当前位置：文档之家› 第四章多重共线性和虚拟变量的应用.pptx

第四章多重共线性和虚拟变量的应用.pptx

（将会导致置信区间变宽。
（2）由于参数估计值的标准差变大，t值将缩小，使得t检验有可能得出错误的结论。
（3）将无法区分单个变量对被解释变量的影响作用。
8
多重共线性的检验
▪ 如前所述，多重共线性普遍存在于金融、经济数据中，因此对多重共线性的检验并不是要确定其是否存在，而是要确定多重共线性的程度。
▪ 辅助回归法构造的检验统计量定义如下：
Fi=
R2 i
/(k
1)
(1 Ri2 ) /(n k)
服从自由度为k-1与n-k的F分布
▪ 其余中解释Ri变2（量i=的1,辅2,…助k回）归为的第拟i个和解优释度变，量k为X解i 关释于变其量的个数，n代表样本容量。
11
检验多重共线性的表现形式
▪ 当确定多重共线性是由哪些主要变量引起后，若要找出与主要变量有共线性的解释变量，即确定多重共线性的表现形式，可采用偏相关系数法。解释变量 X与i Xj偏相关系数即是在其它的解释变量固定的情况下它们之间的相关系数。
（1）数据收集及计算方法。（2）模型或从中取样的总体受到限制。（3）模型设定偏误。 ▪ 此外，在观测值个数较少，以至于小于解释变量个数时，
也会产生多重共线性；时间序列数据中，若同时使用解释变量的当期值和滞后值，由于当期值和滞后值之间往往高度相关，也容易产生多重共线性。
5
多重共线性的后果
▪ 多重共线性不会改变最小二乘估计的无偏性，但在解释变量之间存在严重的多重共线性而被忽略时，会对模型的估计、检验与预测产生严重的不良后果。以某一离差形式（即xt Xt X ）表示的二元线性回归模型
▪ 为对上述两概念加以区别，我们以一组解释变量 X1、X2、...Xn为例
▪ 如果存在一组不完全为零的常数 1、 2、 ... n 满足1X1+2X2+...+nXn=0 ，即任一变量都可以由其它变
量的线性组合推出，则这组变量满足完全多重共线性。若变量组 X1、X2、...Xn , 满足如下关系式
为例 yi 1x1i 2 x2i vi
▪ 若存在完全多重共线性，假设存在关系 x1i x2i
常数 0 。则 1的估计值
ˆ1
yi x1i x2i2 x1i x2i yi x2i x1i2 x2i2 ( x1i x2i )2
yi x2i x2i2 yi x2i x2i2
第四章多重共线性和虚拟变量的应用
1
本章要点
▪ 多重共线性的含义 ▪ 多重共线性产生的原因 ▪ 多重共线性的后果 ▪ 判断多重共线性的方法及其修正方法 ▪ 虚拟变量的设置原则 ▪ 虚拟变量模型的应用 ▪ 邹氏检验的做法及缺陷 ▪ 虚拟变量法检验结构稳定性的优点
2
多重共线性的概念
▪ 多重共线性（multicollinearity）一词最早由挪威经济学家弗瑞希（R.Frisch）于1934年提出。
▪ 若两个解释变量之间的相关系数高，比如说大于 0.8，则可以认为存在严重的多重共线性。
10
判断多重共线性的存在范围
▪ 要确定多重共线性是由哪些主要变量引起的，可以采用辅助回归法（auxiliary regression method）。所谓辅助回归是指某一解释变量对其余解释变量的回归，区别于因变量对所有解释变量回归的主回归（main regression）。
▪ 当存在近似多重共线性时，尽管可以求得参数估计值，但它们是不稳定的，同时参数估计值的方差将变大，变大的程度取决于多重共线性的严重
程度。
7
▪ 在实际金融数据中，完全多重共线性只是一种极端情况，各种解释变量之间存在的往往是近似多重共线性，因此通常所说多重共线性造成的后果是指近似多重共线性造成的后果，具体而言，它将造成如下的后果：
是由哪些主要变量引起的。
（3）多重共线性的表现形式，即找出与主要变量有共线性的解释变量。
9
检验多重共线性问题是否严重
▪ 若回归模型的 R2 值高（如R2 >0.8）,或F检验值显著，但单个解释变量系数估计值却不显著；或从金融理论知某个解释变量对因变量有重要影响，但其估计值却不显著，则可以认为存在严重的多重共线性问题。
2 (
x
2 2i
)2
2 (
x
2 2i
)
2
0 0
▪ 同理 ˆ2 也是无法确定的，即不能求得参数估计值。
6
▪ 而对于参数估计值的方差，有
var(ˆ1)
2 v
x2i 2
x1i2 x2i2 ( x1i x2i )2
2 v
x2i 2
2
(
x
2 2i
)2
2
(
x
2 2i
)2
▪ 同理，ˆ2 的方差也是无限大的。因此，当存在完全多重共线性时，我们将不能求得参数估计值，参数估计值的方差无限大。
▪ 由于多重共线性是对被假定为非随机变量的解释变量的情况而言的，所以它是一种样本而非总体特征，这决定了我们只能以某些经验法则（rules of thumb）来检验模型的多重共线性。
▪ 对多重共线性的检验主要包括以下内容：（1）检验多重共线性问题是否严重（2）多重共线性的存在范围，即确定多重共线性
▪ 其原义是指回归模型中的一些或全部解释变量中存在的一种完全(perfect)或准确(exact)的线性关系。而现在所说的多重共线性，除指上述提到的完全多重共线性（perfect multicollinearity ）, 也包括近似多重共线性（near multicollinearity）。
3
1X1+ 2X2+...+nXn+u=0，其中u表示随机误差项，即
某一变量不仅取决于其它变量的线性组合，也取决于随机误差项，此时变量组之间存在非严格但近似的线性关系，解释变量之间高度相关，也即变量组存在近似多重共线性关系。
4
多重共线性产生的原因
▪ 多重共线性问题在金融数据中是普遍存在的，不仅存在于时间序列数据中，也存在于横截面数据中。具体而言，多重共线性产生的原因主要有以下几点：
▪ 偏相关系数法构造的检验统计量定义如下：
，服从自由度为n-k-1的t分布
ti n k 1 ij
▪ 其中n为样本容量1，kij为2 解释变量的个数，为与的
偏相关系数。若显著不为零，则认为、ij 是X引i 起X多j 重

e商务文档

第四章多重共线性和虚拟变量的应用.pptx

相关文档推荐：