计量经济学多重共线性
例:
ˆ 的方差为 以二元回归模型 Y X X 为例, 1 0 1 1 2 2
2 2 x2 i 2 2i
ˆ) Var ( 1
x x
2 1i
( x1i x2i ) 2
2
1
( x1i x2i ) 2
x
2 1i 2 1i 2 2t
x x
4.参数估计量经济意义不合理。
如果模型中两个解释变量X1和X2具有线性相关性,那么它们中的一 个变量就可以由另一个变量表征。这时X1和X2的参数并不反映各自与被
解释变量之间的结构关系,而是反映它们对被解释变量的共同影响,所
以各自的参数已失去了应有的经济意义,于是经常表现出似乎反常的现 象,例如估计结果本来应该是正的,结果却是负的。经验告诉我们,在 多元线性回归模型的估计中,如果出现参数估计值的经济意义明显不合 理的情况,应该首先怀疑是否存在多重共线性。
在近似共线性下,虽然可以由式(5-5)得到参数OLS估计量,但
ˆ ) 2 ( X X )1 Cov( β
由于此时 | X X | 0 ,引起( X X )1 主对角线元素较大,且随着 | X X |
逼近于0而增大。这就使得参数估计量的方差增大,从而不能对总体 参数做出准确推断。
在矩阵表示的线性回归模型
Y = Xβ + μ
完全共线性指矩阵 X的秩 R( X ) k 1 即
| X X | 0
近似共线性意味着
| X X | 0
一般来说,解释变量之间的关系可概括为三种情况: a)情况是完全相关,即解释变量之间的相关系数为1; b)情况是完全不相关,即解释变量之间的相关系数为0; c)情况是不完全相关即解释变量之间的相关系数介于0和1之间。 在建立计量经济学模型中,大量的问题是属于第三种情况。
2
ˆ ) Var (
1
x
2
2 1i
0<r<1,
2
可以看出, |r
|
ˆ )越大,多重共线性使得参数估计量 越大, Var ( 1
1 方差增大,称 1 r 2 为方差膨胀因子。其增大趋势如下表所示。
相关系数平方 方差膨胀因子
0 0.5 0.8 0.9 0.95 0.96 0.97 0.98 0.99 0.999 1 2 5 10 20 25 33 50 100 1000
第五章
◆ 学习目的
多重共线性
了解多重共线性的概念,掌握在建立计量经济学模型时如何 避免发生多重共线性,以及在存在多重共线性情况下,如何正确 建立计量经济学模型。
◆ 基本要求
1)了解多重共线性的概念及多重共线性产生的原因; 2)存在多重共线性对计量经济学模型的危害; 3)掌握多重共线性的检验方法以及修正多重共线性的方法; 4)学会利用EViews软件进行逐步回归分析,建立正确的计量经济学模型。
1.如果解释变量存在完全共线性,则模型的参数 无法估计;
多元回归模型
Y = Xβ + μ
的OLS估计量为
(5-4)
ˆ = (X X)-1 X Y β
如果出现完全共线性,则 ( X X )1 不存在,无法得到参数
(5-5)
β 的估计量。
2.如果解释变量之间存在近似共线性,则参数OLS估计量的方差随 着多重共线程度的提高而增加;
4.在模型参数的估计过程中,样本之间的相关是不可避免的,这是 造成多重共线性的客观原因。
第二节
多重共线性的影响
对存在多重共线性的模型直接用普通最小二乘法估计参数, 就会给模型带来严重的不良后果。 1.如果解释变量存在完全共线性,则模型的参数
无法估计;
2.如果解释变量之间存在近似共线性,则参数OLS估计量的方差随 着多重共线程度的提高而增加; 3.变量的显著性检验和模型的预测功能失去意义; 4.参数估计量经济意义不合理。
第五章
多重共线性
◆ 多重共线性及其产生原因
◆ 多重共线性的影响
◆ 多重共线性的检验 ◆ 多重共线性的修正
第一节
多重共线性及其产生原因
—、多重共线性的概念
指模型解释变量之间存在完全线性或近似线性相关的一类问题。 对模型
Yi 0 1 X1i 2 X 2i
,使得 i
k X ki i
i 1, 2,
,n
(5-1)
如果存在不全为零的
1 X1i 2 X 2i
k X ki 0
(5-2)
成立,则称解释变量之间存在完全共线性(perfect multicollinearity);
第一节
多重共线性及其产生原因
—、多重共线性的概念
指模型解释变量之间存在完全线性或近似线性相关的一类问题。 对模型
需要强调,解释变量之间不存在线性关系,并非不存在非线性 关系,当解释变量之间存在非线性关系时,并不违反无多重共线性假定。
二、产生多重共线性的主要原因
1.经济变量之间的内在联系,是产生多重共线性的根本原因。
2.经济变量在时间上有同方向变动的趋势,这也是造成多重共线 性的重要原因。 3.模型中滞后变量的引入,也是造成解释变量多重共线的原因之一。
当完全共线性时,
r 2 1,ˆ Var 1 Nhomakorabea
3.变量的显著性检验和模型的预测功能失去意义;
存在多重共线性的模型,其参数估计量方差的变大,使得计算的 t 统
计量变小,从而检验接受原假设
H 0 : i 0 的可能性增大,这样会使本来
影响很大的重要因素误判为不显著,结果使模型失去可靠性。其次,由于 参数估计量的方差变大,因而对样本值的反映十分敏感,即当样本观测值 稍有变化时,模型参数就有很大差异,致使模型难以应用。另外,由于参 数估计量的方差增大,使模型的精度大大下降,求出的预测值难以置信。
x
2
2 1i
1 1 r2
(5-6)
其中
r
2
( x1i x2i )2
x x
2 1i
2 2i
r ≤1。 是X1与X2线性相关系数的平方,
2
当X1与X2线性无关时,
当X1与X2 近似共线时,
1 2 ˆ 1)= Var( 2 2 > x 1 r 1i x12i
r 0,
Yi 0 1 X1i 2 X 2i
,使得 i
k X ki i
i 1, 2,
,n
(5-1)
如果存在不全为零的
1 X1i 2 X 2i
k X ki 0
(5-3)
成立,则称解释变量之间存在近似共线性(approximate multicollinearity)。