当前位置:文档之家› 计量经济学的三种检验

计量经济学的三种检验

10
接近完全多重共线性的情形
• 多重共线性是一个极端的情形 • 在实际中,很少遇到完全多重共线性的情 况,常常是接近或高度多重共线性。亦即 解释变量是接近线性相关的。 • 例:《widget》教科书
11
问题 • • • • • • 多重共线性的性质是什么? 多重共线性产生的原因是什么? 多重共线性的理论后果是什么? 多重共线性的实际后果是什么? 在实际中,如何发现多重共线性? 消除多重共线性的弥补措施有哪些?
计量经济学检验
一、多重共线性 二、异方差 三、自相关
1
一:多重共线性
• • • • •
多重共线性的性质 多重共线性的原因 多重共线性的后果 多重共线性的诊断 多重共线性的补救措施
2
回顾多元线性回归模型的若干假定
• • • • •
零均值假定 同方差假定 无自相关假定 随机项与自变量不相关 非多重共线性
18
注意
• 接近共线性并未破坏最小二乘估计量的最 小方差性:在所有线性无偏估计量中, OLS估计量的方差最小。 • 最小方差并不意味着方差值本身也比较小。
19
注意 • 即使变量总体之间不线性相关,但却可 能与某一样本线性相关 • 多重共线性本质上是一个样本(回归) 现象。 • 原因:大多数经济数据不是通过试验获 得。如:国民生产总值、价格、失业率、 利润、红利等,是以其实际发生值为依 据,而并非试验得到。
• 变量之间有共同的时间趋势 • 模型的过定( overdetermined)
– 解释变量的数目多于观测的数目。
16
多重共线性的理论后果
• 在存在高度多重共线性的情形下,即使多 元回归方程的一个或者多个偏回归系数是 统计不显著的,普通最小二乘估计量仍然 是最优线性无偏估计量。
17
注意
• 无偏性是一个重复抽样的性质,即:保持X 不变,如果得到一些样本并用OLS计算这 些样本估计量,则其平均值收敛于估计量 的真实值。但这并不是某个样本估计值的 性质,在现实中,我们经常无法得到大量 的重复样本。
• 如果t统计量大于2,就不用担心 • 如果回归的 R2大于任何一个 X对其余 Xs回 归的R2 ,就不用担心 • 如果仅仅是对预测感兴趣,并且解释变量 的线性组合在未来仍然延续,就不用担心
37
补救措施(经验法则)
• • • • • •
从模型中删除不重要的解释变量 获取额外的数据或者新的样本 重新考虑模型 先验信息 变量变换 其他补救措施
6
假定4
• • • •
随机项与自变量不相关: Cov(ui, x1i)=0; Cov(ui, x2i)=0 区分随机项u与每个自变量各自对y的影响。 如果x是非随机变量,即x是在重复抽样中 取某固定值,该条件自然满足。
7
假定5
• 解释变量之间不存在线性相关关系,即 任意两个解释变量之间无确切的线性关 系。 • 用统计学语言,称为非共线性或非多重 共线性。 • 非完全共线性是指变量不能完全表示为 其他变量的完全线性函数。 • 违反假定:多重共线性
28
检验方法1 • R2较高但t值显著的不多。这是多重共线 性的“经典”特征。
29
检验方法2
• 解释变量两两高度相关。
– 逐对检查解释变量之间的相关系数 – 这些仅仅是一些有用的指示,经过这些探查后 可能还会有多重共线性 – 解释变量的组合或许具有相关性
30Leabharlann 检验方法3 • 辅助回归:将每个变量对其他剩余变量 回归并计算相应的R2 值,其中每一个回 归都被称作是从属或者辅助回归。 • 然后用F test 检验 R2 是否显著地区别于 0
– F = [R2/(k-1)] /[(1-R2)/(n-k)] – k 是 X的数目 – 如果F大于临界值,则 R2 是显著区别于0的
• 计算较繁琐
31

• 考虑Y对X1,X2, X3,X4,X5、 X6这6个解释变量 的回归 • 辅助回归:用R12 表示X1对其余X 的回归的判决系 数……
32
• 有些情况下,通过获得额外的数据(增加 样本容量)就能削减共线性的程度。
var(b j )
X 2jt (1 R 2j )
u2

X 2jt
u2
VIF
40
获取额外的数据或者新的样本
• 既然多重共线性是一个样本特征,那么在 包括同样变量的另一样本中,共线性也许 不象第一个样本那样高。 • 关键是能否获得另一个样本,因为收集数 据的费用很高。
• 例:需求函数
Q=b0+b1p+b2pr+b3income+u 变形成 Q=b0+b1(p/pr)+b2income+u
44
先验信息
• 根据以往的研究,我们或许知道有关参数 值的某些信息,可以将这些信息用于当前 的样本。 • 假设先验信息是“正确”的,就“解决” 了共线性问题。
45
例 对《wideget》需求函数
41
消费支出对于收入和财富的回归方程
• • • • • •
Y:消费支出;X1:收入;X2:财富 10个观察值: Y=24.337+0.87164 X1 -0.0349 X2 se=(6.2801) (0.31438) (0.0301) t= (3.875) (2.7726) (-1.1595) R2 =0.9682
3
假定1
• 零均值假定:E(ui)=0,i=1,2,….n • 对X1 ,X2的每个观测值,u可以取不同的值, 考虑u的所有可能值,它们的总体平均值 (期望值)等于0。
4
假定2
• 同方差假定:Var(ui)= σ u 2, i=1,2,…n • 上式表明,各次观测值中u具有相同的方差, 即各次观测所受到的随机影响的程度相同, 称为等方差性。 • 违反假定:异方差
21
例:消费函数 • 消费函数的结果:
– Y = 24.77 + 0.94X1 - 0.04X2 – t (3.67) (1.14) (-0.53) – R2=0.96, F = 92.40 – X1 是收入 – X2 是财富 – 高的 R2 表明收入和财富可以解释消费变化 的96%
22
结果分析
38
从模型中删除不重要的解释变量
• 对待严重的多重共线性问题,最简单的 解决方法就是删除一个或多个共线性变 量。
– 导致“模型设定误差”,参数估计量可能是 有偏的。 – 建议不要仅仅因为共线性很严重就从一个经 济上可行的模型中删除变量。所选模型是否 符合经济理论是一个重要的问题。
39
获取额外的数据或者新的样本
12
多重共线性的性质
• 可以获得原始系数的一个线性组合的估 计值。 • 当解释变量之间存在完全线性相关或完 全多重共线性时,不可能获得所有参数 的唯一估计值。 • 既然我们不能获得它们的唯一估计值, 也就不能根据某一样本做任何统计推论 (也即假设检验)
13
多重共线性的原因 • 例:消费函数 • Y = b0 + b1X1 + b2X2 • X1 = income ; X2 = wealth X2 = 5X1 Y = b0 + b1X1 + b2 5X1 Y = b0 + (b1 + 5b2)X1
• 假设在过去估计过的对《wideget》需求函 数中,收入系数为0.9,并且是统计显著的。 如果收入系数的过去值没有多少改变的话, 我们可以重新估计方程 • 需求量=b0+b1*价格+b2*收入+u = b0+b1*价格+0.9*收入+u • 需求量- 0.9*收入= b0+b1*价格+u
42
消费支出对于收入和财富的回归方程
• • • •
40个观察值: Y=2.0907+0.7299 X1 +0.0605 X2 t= (0.8713) (6.0014) (2.0641) R2 =0.9672
43
重新考虑模型
• 模型的不恰当设定可能是回归模型存在共 线性的原因。
– 省略一些重要的变量 – 没有正确选择模型的函数形式
• 没有任何一个斜率系数是显著的。 • 财富变量的符号是错误的。 • 高的 F 值意味着系数都等于0的联合假设不 成立
– 两个变量是如此地高度相关,以至于不能将二 者的效应分离出来。
23
例:消费函数
• 如果将 X2 对 X1 回归,得到:
– X2 = 7.54 + 10.19X1 (0.26) ( 62.04) R2 =0 .99 – 表明,在 X1 和 X2之间有近乎完全的线形关系
35
总结
• 检验多重共线性有许多种不同的方法, 但却没有一种检验方法能够使我们彻底 解决多重共线性问题。 • 多重共线性是一个程度的问题,它是与 样本相关的一种现象。 • 有时我们必须综合运用以上各种手段来 诊断多重共线性的严重程度。 • 总之,没有一个简单的办法判断多重共 线性问题。
36
补救措施
5
假定3 • 无自相关假定: • Cov(ui, uj)=0, i ≠ j, i,j=1,2…..n • 表明任意两次观测的ui, uj是不相关的, 即u在某次的观测值与任何其它次观测中 的值互不影响,称为无序列相关性。 • 等方差性和无序列相关性称为高斯—马 尔柯夫(Gauss-Markov)假定。 • 违反假定:自相关
检验方法4
• 方差膨胀因素(Variance inflation factor )
var(b j )
X
u2
2 jt
(1 R 2 ) j

X
u2
2 jt
VIF
VIF
1 1 R2 j
– 其中 R2j 是Xj对其他X的辅助回归的判决系数
相关主题