当前位置：文档之家› 多重共线性

多重共线性

7
（2）滞后变量的引入在经济计量模型中，往往需要引入滞后经济变量来反映真实的经济关系。
例如，消费=f(当期收入, 前期收入）
显然，两期收入间有较强的线性相关性。
8
（3）样本资料的限制由于完全符合理论模型所要求的样本数据较难收集，特定样
本可能存在某种程度的多重共线性。
一般经验：
时间序列数据样本：简单线性模型，往往存在多重共线性。
表 4.3.1 相关系数平方方差膨胀因子 0 1 0.5 2 0.8 5 0.9 10 方差膨胀因子表 0.95 20 0.96 25 0.97 33 0.98 50 0.99 100 0.999 1000
当完全共线时， r2=1，
ˆ var( 1 )
14
3、参数估计量经济含义不合理
4
在矩阵表示的线性回归模型 Y=X+ 中，完全共线性指：秩(X)<k+1，即
1 1 X 1 X 11 X 12 X 1n X 21 X 22 X 2n X k1 X k2 | X X | 0 X kn
中，至少有一列向量可由其他列向量（不包括第一列）线性表出。
如果模型中两个解释变量具有线性相关性，例如
X2 = X1 ，
这时，X1 和X2 前的参数 1 、 2 并不反映各自与被解释变量之间的结构关系，而是反映它们对被解释变量的共同影响。

1、2已经失去了应有的经济含义，于是经常表现出似乎反
常的现象：例如1本来应该是正的，结果恰是负的。
经验告诉我们，在多元线性回归模型的估计中，如果出现参
21
2．直观判断法
根据经验，通常以下情况的出现可能提示存在多重共线性的影响：
(1)当增加或删除一个解释变量，或者改变一个观测值时，回归参数的估计值发生较大变化，回归方程可能存在严重的多重共线性。
(2)从定性分析认为，一些重要的解释变量的回归系数的标准误差较大，在回归方程中没有通过显著性检验时，可初步判断可能存在严重的多重共线性。
定程度上的共线性，即近似共线性。需要强调，解释变量之间不存在线性关系，并非不存在非线性关系，当解释变量之间存在非线性关系时，并不违反无多重共线性假定。
6
实际经济问题中的多重共线性
一般地，产生多重共线性的主要原因有：
（1）经济变量相关的共同趋势
时间序列样本：经济繁荣时期，各基本经济变量（收入、消费、投资、价格）都趋于增长；衰退时期，又同时趋于下降。横截面数据：生产函数中，资本投入与劳动力投入往往出现高度相关情况，大企业二者都大，小企业都小。

2 x12i x 2 i ( x1i x 2 i ) 2

1 ( x1i x 2 i ) 2
2 / x12i
2 x12i x 2 i

x
2
2 1i

1 1 r2
x x
2 1i
( x 1i x 2 i ) 2
2 2i
恰为X1与X2的线性相关系数的平方r2 r2 1，故 1/(1- r2 )1
由于
13
当完全不共线时, r2 =0
当近似共线时, 0< r2 <1
ˆ var( 1 ) 2 / x12i
ˆ var( 1 )
2
x
2 1i

1 1 r
2

2
x12i
多重共线性使参数估计值的方差增大，1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)
如：X2= X1，则X2对Y的作用可由X1代替。
5
一般来说，解释变量之间的关系可概括为三种情况：
a)情况是完全相关，即解释变量之间的相关系数为1；
b)情况是完全不相关，即解释变量之间的相关系数为0；
c)情况是不完全相关，即解释变量之间的相关系数介于0和1之间。
注意：完全共线性的情况并不多见，一般出现的是在一
10
例：对离差形式的二元回归模型
y 1 x1 2 x 2
如果两个解释变量完全相关，如x2= x1，则
y ( 1 2 ) x1
这时，只能确定综合参数1+2的估计值：
11
2、近似共线性下OLS估计量非有效
近似共线性下，可以得到OLS参数估计量，但参数估计量方差的表达式为
ˆ 表示，则可以证明(证明过程从略)，解释变量Xj参数估计量 J 的方差可
表示为
ˆ Var( j )=
2
x
2 ji

1 1 R
2 j

2
x
2 ji
VIF j
其中，VIFj是变量Xj的方差膨胀因子，即
R2 j
j 1, 2, , k
并计算相应的拟合优度，即判定系数R2。
25
如果某一回归方程的判定系数 R
2 较大(接近于1)， j
说明Xj与其他解释变量X间存在多重共线性。
如果求出的判定系数 R 2 都比较小，没有一个是接近于1的， j 则可认为模型的解释变量之间不存在严重的多重共线问题。
26
第8章
◆ 学习目的
多重共线性
了解多重共线性的概念，掌握在建立计量经济学模型时如何避免发生多重共线性，以及在存在多重共线性情况下，如何正确建立计量经济学模型。
◆ 基本要求
1)了解多重共线性的概念及多重共线性产生的原因; 2)存在多重共线性对计量经济学模型的影响; 3)掌握多重共线性的检验方法以及修正多重共线性的方法; 4)学会利用EViews软件进行逐步回归分析，建立正确的计量经济学模型。
3
如果存在 c1X1i+c2X2i+…+ckXki=0
性（perfect multicollinearity）。如果存在 c1X1i+c2X2i+…+ckXki+vi=0
i=1,2,…,n
其中: ci不全为0，则称为解释变量间存在完全共线
i=1,2,…,n
其中ci不全为0，vi为随机误差项，则称为近似共线性（ approximate multicollinearity ）或交互相关 (intercorrelated)。
1
第8章
多重共线性
◆ 多重共线性及其产生原因
◆ 多重共线性的影响
◆ 多重共线性的检验 ◆ 多重共线性的修正
2
第一节多重共线性及其产生原因
对于模型 Yi=0+1X1i+2X2i++kXki+i i=1,2,…,n 其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性，则称为多重共线性(Multicollinearity)。
j
的临界值比较来进行检验，判定是否存在相关性。此时如果
F j F ( k 1, n k ) ，拒绝 H 0 ，即认为Xj与其他解释变量X间
存在多重共线性，否则，接受 H 0 ，即认为Xj与其他解释变量X间不存在多重共线性。
27
1．判定系数检变量 Xj ，估计模型，如果拟合优度
截面数据样本：问题不那么严重，但多重共线性仍然存在。
在模型参数的估计过程中，样本之间的相关是不可避免的，
这是造成多重共线性的客观原因。
9
第二节
多重共线性的影响
1、完全共线性下参数估计量不存在
Y Xβ μ
的OLS估计量为：
ˆ β ( X X ) 1 X Y
如果存在完全共线性，则(X’X)-1不存在，无法得到参数的估计量。
20
一、检验多重共线性是否存在 1．简单相关系数检验法
利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。
一般而言，如果每两个解释变量的简单相关系数比较高，如大于0.8，则可认为存在着较严重的多重共线性。
注意较高的简单相关系数只是多重共线性存在的充分条件，而不是必要条件。特别是在多于两个解释变量的回归模型中，有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。
不显著。
23
二、估计多重共线性的范围 1．判定系数检验法 2．行列式检验法 3．方差膨胀(扩大)因子法 4．逐步回归法
24
1．判定系数检验法
设多元回归模型的解释变量为 X1、X2、…、Xk，为分析研究它们之间的相关关系，需将每个解释变量与其他解释变量进行回归，可得出k个回归方程式
X ji 0 1 X 1i j 1 X j 1 i j 1 X j 1 i k X ki i i 1, 2, , n,
预测失去意义。
由于参数估计量的方差变大，因而对样本值的反
映十分敏感，即当样本观测值稍有变化时，模型参数就有很大差异，致使模型难以应用。
17
综上所述
严重的多重共线性常常会导致下列情形出现：
1、使得用普通最小二乘法得到的回归参数估计值很不稳定，回归系数的方差随着多重共线性强度的增加而加速增长，对参数难以做出精确的估计； 2、造成回归方程高度显著的情况下，有些回归系数通不过显著性检验； 3、甚至可能出现回归系数的正负号得不到合理的经济解释。
(3)有些解释变量的回归系数所带正负号与定性分析结果违背时，可能存在多重共线性。
(4)解释变量的相关矩阵中，解释变量之间的相关系数较大时，可能会存在多重共线性问题。
22
3．综合统计检验法
对于多个解释变量（2个以上）的回归模型
若在OLS法下： R2 与 F 值较大，但各参数估计量的 t 检验值较小，说明各解释变量对Y的联合线性作用显著，但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨，故t检验

e商务文档

多重共线性

相关文档推荐：