当前位置:
文档之家› 计量经济学 第七章 多重共线性 PPT
计量经济学 第七章 多重共线性 PPT
y = 99.613 + 0.082 x2 (15.4) (7.6) R2 = 0.83, F = 57.6, T = 14, (1974-1987)
y = 74.648 + 4.893 x3 (9.0) (8.7) R2 = 0.86, F = 75.4, T = 14, (1974-1987)
y = 108.865 + 5.740 x4 (18.3) (6.8) R2 = 0.80, F = 46.8, T = 14, (1974-1987)
7.3 多重共线性的后果
(1)当 rxi xj =1,X 为降秩矩阵,则(X 'X) -1 不存在, ˆ = (X 'X)-1X'Y 不可计算。
(2)若 rxi xj 1,即使 rxi xj 1, ˆ 仍具有无偏性。
E( ˆ )=E[(X 'X)-1X 'Y]=E[(X 'X)-1X '(X+u)]= + (X 'X)-1X ' E(u) =.
7.6 案例分析(3例)
例7.1:天津市粮食需求模型(1974-1987)
y:粮食销售量(万吨 / 年),x1:市常住人口数(万人), x2:人均收入(元 / 年),x3:肉销售量(万吨 / 年), x4:蛋销售量(万吨 / 年),x5:鱼虾销售量(万吨 / 年)。
180 170 Y
160
150
140
4
一次模拟结果,x1 与 x2 高度相关,x1 与 x3 不相关
因为 r(x1, x2) > 0.96, ˆ1 分布的方差变大(红线)。因为 r(x1, x3) = 0, ˆ1 分布的方差很小(蓝线)。
7.4 多重共线性的检验
(1)初步观察。当模型的拟合优度(R 2)很高,F 值很高,而每个回
归参数估计值的方差 Var(j) 又非常大(即 t 值很低)时,说明
(3)当 rxi xj 1 时,X 'X 接近降秩矩阵,即 X 'X 0, Var( ˆ )= 2 (X 'X)-1 变得很大。所以 ˆ 丧失有效性。 80 Var( ˆ )
以二元线性回归模型, Yt = 0 +1Xt1 + 2Xt2 + ut,为例,60
40
Var ( 1- ( x1x2 ) 2
因此我们关心的不是有无多重共线性,而是多重共线性的程度。 随着共线性程度的加强,对参数估计值的准确性、稳定性带来影响。
7.2 多重共线性的经济解释
(1)经济变量在时间上有共同变化的趋势。如在经济上升时期,收入、消费、就业率 等都增长,当经济收缩期,收入、消费、就业率等又都下降。当这些变量同时进入模型 后就会带来多重共线性问题。
第7章 多重共线性
7.1 非多重共线性假定 7.2 多重共线性的经济解释 7.3 多重共线性的后果 7.4 多重共线性的检验 7.5 多重共线性的克服方法 7.6 案例分析(3 例)
7.1 非多重共线性假定
rk (X 'X ) = rk (X ) = k+1
Y(T1) = X[T (k+1)] [(k+1)1] + u(T1)
5.4 利用解释变量之间的关系
如果解释变量之间存在多重共线性,那么可以利用它们之间的关系,引入附加方程, 从而将单方程模型转化为联立方程模型,克服多重共线性。
5.5 变换模型形式 通过变换模型形式克服多重共线性。例如某产品销量Y取决于其出厂价格X1,市场 价格X2,和市场供应量X3。模型为
LnY = 0 +1X1+ 2X2+ 3X3+ut 通常,X1与X2是高度相关的,如果研究的目的是预测销售量Y,则可以用相对价格 X1/ X2代替X1与X2对销售量Y的影响,
5.2 利用已知信息合并解释变量
通过经济理论及对实际问题的深刻理解,对发生多重共线性的解释变量引入附加条 件从而减弱或消除多重共线性。
比如有二元回归模型 yt = 0+ 1 xt1 + 2 xt2 + ut x1与x2间存在多重共线性。如果能给出1与2的某种关系,2 = 1其中 为常数。
yt = 0+ 1 xt1 + 1 xt2 + ut = 0 + 1 (xt1 + xt2) + ut 令 xt = xt1 + xt2 得yt = 0+ 1 xt + ut
模拟模型:Y = 0.4+1.2 x1+ 0.8 x2 + u,r(x1, x2) > 0.96。红色曲线为模拟1万次结果。
模拟模型:Y = 0.4+1.2 x1+ 0.8 x3 + u,r(x1, x3) = 0。蓝色曲线为模拟1万次结果。
5
B1F1
B1F2
4
3
2
1
0
-2
-1
0
1
2
3
真值1 = 1.2
LnYt = LnKt + LnLt + (1- ) LnCt + ut
整理后,Ln ( Yt Ct
)
=
Ln
Kt
+
Ln
(
Lt Ct
) + ut
变成了一元线性回归模型,自然消除了多重共线性。
7.5 多重共线性的克服方法
5.3 增加样本容量或重新抽取样本
这种方法主要适用于那些由测量误差而引起的多重共线性。当重新抽取样本时,克 服了测量误差,自然也消除了多重共线性。有时,增加样本容量也可以减弱多重共 线性的程度。
①若新变量的引入改进了R2,且回归参数的t检验在统计上也是显著的, 则该变量在模型中予以保留。
②若新变量的引入未能改进R2,且对其他回归参数估计值的t检验也未带 来什么影响,则认为该变量是多余的,应该舍弃。
③若新变量的引入未能改进R2,且显著地影响了其他回归参数估计值的 符号与数值,同时本身的回归参数也通不过t检验,这说明出现了严重的 多重共线性。舍弃该变量。
LnY = 0 +1(X1/X2) + 3X3+ut 从而克服了X1与X2的多重共线性。
7.5 多重共线性的克服方法
5.6 把数据中心化 把数据中心化有时也是克服多重共线性的有效方法。 例如多项式回归模型
yt = 0 +1 xt + 2 xt2 + 3 xt3 + ut
中,变量之间常存在多重共线性。 可以把解释变量先中心化(各自减自己的均值), 然后建立多元回归模型
(2)解释变量与其滞后变量同作解释变量。
4.E+11 3.E+11
GDP
4.E+11
GDP
3.E+11
2.E+11
2.E+11
1.E+11
0.E+00 80 82 84 86 88 90 92 94 96 98 00 02
1.E+11
0.E+00 0.E+00
1.E+11
2.E+11
GDP(-1) 3.E+11 4.E+11
y = -3.497 + 0.125 x1 + 0.074 x2 + 2.678 x3 + 3.453 x4 – 4.491 x5
(-0.1) (2.1)
(1.9)
(2.1)
(1.4)
(-2.0)
R2 = 0.97, F = 52.59, DW = 1.97, t0.05(8) = 2.31, T = 14, (1974-1987)
解释变量不是完全线性相关的或接近完全线性相关的。
xtixtj 1, xtixtj 不近似等于 1。
就模型中解释变量的关系而言,有三种可能。 (1) xtixtj = 0,解释变量间相关系数等于 0。(少见)
(2) xtixtj = 1,解释变量间完全相关。(少见)
(3)0 < xtixtj < 1,解释变量间存在一定程度的线性相关。(常见)
4.E+11 3.E+11
GDP
CONS
4.E+11
GDP of HongKong
3.E+11
2.E+11
2.E+11
1.E+11
1.E+11
0.E+00 80 82 84 86 88 90 92 94 96 98 00 02
0.E+00
CONS
0.0E+ 00 5.0E+ 10 1.0E+ 11 1.5E+ 11 2.0E+ 11 2.5E+ 11
R2 = 0.97,而每个回归参数的 t 检验在统计上都不显著,这说明模型中存 在严重的多重共线性。
7.6 案例分析(3例)
把解释变量换成对数形式建模还是存在多重共线性。
y = -134.248 + 0.013x1 + 33.611Lnx2 + 34.363Lnx3 + 27.280Lnx4 – 34.906Lnx5
解释变量间可能存在多重共线性。
(2)Klein 判别法。计算多重可决系数 R2 及解释变量间的简单相关系 数 rxi xj。若有某个 rxi xj > R2,则 xi,xj 间的多重共线性是有害的。
(3)回归参数估计值的符号不符合经济理论。 (4)增加或减少解释变量个数时,回归参数估计值变化很大。
90 68
X3 10 12 14 16 18 20 22 24
180 170 Y
160
150
140
130