多重共线性
7
(2)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济 变量来反映真实的经济关系。
例如,消费=f(当期收入, 前期收入)
显然,两期收入间有较强的线性相关性。
8
(3)样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样
本可能存在某种程度的多重共线性。
一般经验:
时间序列数据样本:简单线性模型,往往存在多重共线性。
表 4.3.1 相关系数平方 方差膨胀因子 0 1 0.5 2 0.8 5 0.9 10 方差膨胀因子表 0.95 20 0.96 25 0.97 33 0.98 50 0.99 100 0.999 1000
当完全共线时, r2=1,
ˆ var( 1 )
14
3、参数估计量经济含义不合理
4
在矩阵表示的线性回归模型 Y=X+ 中,完全共线性指:秩(X)<k+1,即
1 1 X 1 X 11 X 12 X 1n X 21 X 22 X 2n X k1 X k2 | X X | 0 X kn
中,至少有一列向量可由其他列向量(不包括第 一列)线性表出。
如果模型中两个解释变量具有线性相关性,例如
X2 = X1 ,
这时,X1 和X2 前的参数 1 、 2 并不反映各自与被解释变量之间 的结构关系,而是反映它们对被解释变量的共同影响。
1、2已经失去了应有的经济含义,于是经常表现出似乎反
常的现象:例如1本来应该是正的,结果恰是负的。
经验告诉我们,在多元线性回归模型的估计中,如果出现参
21
2.直观判断法
根据经验,通常以下情况的出现可能提示存在多重共线 性的影响:
(1)当增加或删除一个解释变量,或者改变一个观测 值时,回归参数的估计值发生较大变化,回归方程可能 存在严重的多重共线性。
(2)从定性分析认为,一些重要的解释变量的回归系 数的标准误差较大,在回归方程中没有通过显著性检验 时,可初步判断可能存在严重的多重共线性。
定程度上的共线性,即近似共线性。 需要强调,解释变量之间不存在线性关系,并非不存 在非线性关系,当解释变量之间存在非线性关系时,并不违 反无多重共线性假定。
6
实际经济问题中的多重共线性
一般地,产生多重共线性的主要原因有:
(1)经济变量相关的共同趋势
时间序列样本:经济繁荣时期,各基本经济变 量(收入、消费、投资、价格)都趋于增长;衰退 时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动力 投入往往出现高度相关情况,大企业二者都大,小 企业都小。
2 x12i x 2 i ( x1i x 2 i ) 2
1 ( x1i x 2 i ) 2
2 / x12i
2 x12i x 2 i
x
2
2 1i
1 1 r2
x x
2 1i
( x 1i x 2 i ) 2
2 2i
恰为X1与X2的线性相关系数的平方r2 r2 1,故 1/(1- r2 )1
由于
13
当完全不共线时, r2 =0
当近似共线时, 0< r2 <1
ˆ var( 1 ) 2 / x12i
ˆ var( 1 )
2
x
2 1i
1 1 r
2
2
x12i
多重共线性使参数估计值的方差增大,1/(1-r2)为 方差膨胀因子(Variance Inflation Factor, VIF)
如:X2= X1,则X2对Y的作用可由X1代替。
5
一般来说,解释变量之间的关系可概括为三种情况:
a)情况是完全相关,即解释变量之间的相关系数为1;
b)情况是完全不相关,即解释变量之间的相关系数为0;
c)情况是不完全相关,即解释变量之间的相关系数介 于0和1之间。
注意:完全共线性的情况并不多见,一般出现的是在一
10
例:对离差形式的二元回归模型
y 1 x1 2 x 2
如果两个解释变量完全相关,如x2= x1,则
y ( 1 2 ) x1
这时,只能确定综合参数1+2的估计值:
11
2、近似共线性下OLS估计量非有效
近似共线性下,可以得到OLS参数估计量, 但参数估计量方差的表达式为
ˆ 表示,则可以证明(证明过程从略),解释变量Xj参数估计量 J 的方差可
表示为
ˆ Var( j )=
2
x
2 ji
1 1 R
2 j
2
x
2 ji
VIF j
其中,VIFj是变量Xj的方差膨胀因子,即
R2 j
j 1, 2, , k
并计算相应的拟合优度,即判定系数R2。
25
如果某一回归方程的判定系数 R
2 较大(接近于1), j
说明Xj与其他解释变量X间存在多重共线性。
如果求出的判定系数 R 2 都比较小,没有一个是接近于1的, j 则可认为模型的解释变量之间不存在严重的多重共线问题。
26
第8章
◆ 学习目的
多重共线性
了解多重共线性的概念,掌握在建立计量经济学模型时如 何避免发生多重共线性,以及在存在多重共线性情况下, 如何正确建立计量经济学模型。
◆ 基本要求
1)了解多重共线性的概念及多重共线性产生的原因; 2)存在多重共线性对计量经济学模型的影响; 3)掌握多重共线性的检验方法以及修正多重共线性的方法; 4)学会利用EViews软件进行逐步回归分析,建立正确的计量 经济学模型。
3
如果存在 c1X1i+c2X2i+…+ckXki=0
性(perfect multicollinearity)。 如果存在 c1X1i+c2X2i+…+ckXki+vi=0
i=1,2,…,n
其中: ci不全为0,则称为解释变量间存在完全共线
i=1,2,…,n
其中ci不全为0,vi为随机误差项,则称为 近似共线 性 ( approximate multicollinearity ) 或 交 互 相 关 (intercorrelated)。
1
第8章
多重共线性
◆ 多重共线性及其产生原因
◆ 多重共线性的影响
◆ 多重共线性的检验 ◆ 多重共线性的修正
2
第一节 多重共线性及其产生原因
对于模型 Yi=0+1X1i+2X2i++kXki+i i=1,2,…,n 其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了相 关性,则称为多重共线性(Multicollinearity)。
j
的临界值比较来进行检验,判定是否存在相关性。此时 如果
F j F ( k 1, n k ) ,拒绝 H 0 ,即认为Xj与其他解释变量X间
存在多重共线性,否则,接受 H 0 , 即认为Xj与其他解释变量X间不 存在多重共线性。
27
1.判定系数检变量 Xj ,估计模型,如果拟合优度
截面数据样本:问题不那么严重,但多重共线性仍然存在。
在模型参数的估计过程中,样本之间的相关是不可避免的,
这是造成多重共线性的客观原因。
9
第二节
多重共线性的影响
1、完全共线性下参数估计量不存在
Y Xβ μ
的OLS估计量为:
ˆ β ( X X ) 1 X Y
如果存在完全共线性,则(X’X)-1不存在,无法得 到参数的估计量。
20
一、 检验多重共线性是否存在 1.简单相关系数检验法
利用解释变量之间的线性相关程度去判断是否存在严 重多重共线性的一种简便方法。
一般而言,如果每两个解释变量的简单相关系数比较 高,如大于0.8,则可认为存在着较严重的多重共线性。
注意 较高的简单相关系数只是多重共线性存在的充分条件, 而不是必要条件。特别是在多于两个解释变量的回归模型 中,有时较低的简单相关系数也可能存在多重共线性。因 此并不能简单地依据相关系数进行多重共线性的准确判断。
不显著。
23
二、 估计多重共线性的范围 1.判定系数检验法 2.行列式检验法 3.方差膨胀(扩大)因子法 4.逐步回归法
24
1.判定系数检验法
设多元回归模型的解释变量为 X1、X2、…、Xk,为分析研究 它们之间的相关关系,需将每个解释变量与其他解释变量进 行回归,可得出k个回归方程式
X ji 0 1 X 1i j 1 X j 1 i j 1 X j 1 i k X ki i i 1, 2, , n,
预测失去意义。
由于参数估计量的方差变大,因而对样本值的反
映十分敏感,即当样本观测值稍有变化时,模型参 数就有很大差异,致使模型难以应用。
17
综上所述
严重的多重共线性常常会导致下列情形出现:
1、使得用普通最小二乘法得到的回归参数估计值很不稳定, 回归系数的方差随着多重共线性强度的增加而加速增长,对 参数难以做出精确的估计; 2、造成回归方程高度显著的情况下,有些回归系数通不过显 著性检验; 3、甚至可能出现回归系数的正负号得不到合理的经济解释。
(3)有些解释变量的回归系数所带正负号与定性分析 结果违背时,可能存在多重共线性。
(4)解释变量的相关矩阵中,解释变量之间的相关系 数较大时,可能会存在多重共线性问题。
22
3.综合统计检验法
对于多个解释变量(2个以上)的回归模型
若 在OLS法下: R2 与 F 值较大,但各参数估计量的 t 检验值较小,说 明各解释变量对Y的联合线性作用显著,但各解释变量间 存在共线性而使得它们对Y的独立作用不能分辨,故t检验