当前位置:文档之家› 第10章_多重共线性

第10章_多重共线性

1X1i 2 X2i k Xki i 0
那么就说原模型中存在多重共线性。
若vi 0
1X1i 2 X 2i k X ki 0
则表明原模型中存在完全多重共线性
若vi 0
1X1i 2 X 2i k X ki i 0
则表明原模型中存在不完全多重共线性
Yi
变量之间没有明确的函数关系,
49
但是它们之间的相关系
数 rX1X2 0.7228 , 说明两
个变量之间还是存在线性相关
45 44
关系
39
38
37
34
ቤተ መጻሕፍቲ ባይዱ
32
30
29
X1i
X 2i
1
297.5
2
294.9
3
293.5
4
292.8
5
290.2
6
289.7
7
285.8
8
294.6
9
291.1
10
278.8
11
以一个二元线性回归模型的偏斜率系数为例
bˆ1
yi x1i x22i yi x2i x1i x2i x12i x22i ( x1i x2i )2
在完全共线性情况下,若 X 2i X1i
bˆ1
yi x1i 2 x12i yix1i x1ix1i x12i 2 x12i ( x1ix1i )2
Yt b0 b1X t b2 X t1 bk X tk1 t
Xt 当期收入,Xt1-前一期收入,,Xtk-前k期收入
9
引起多重共线性的原因(蒙哥马利&佩克)
1. 数据采集所用的方法: 限于一个范围 2. 模型或从中取样的总体受到约束:
如做电力消费(Y)对收入(X2)和住房面积 (X3)回归时,可能X2高的X3也大 3. 模型设定: 如在模型中加入多项式 4. 一个过度决定的模型:回归元个数大于观测次 数
6
在这种不完全多重共线性情况下,可以对模型使 用最小二乘估计,得到下面的结果
Yˆi 14.537 2.7975X1i 0.3191X2i
t
(-3.4444)
(-0.7911)
参数是可以估计出来,但是这个模型存在下面两个 问题:
1.收入参数的斜率系数符号为负,在现实生活中我们 知道随着人们收入的增加,对一般商品的需求应该 也是增加的,参数符号应该为正;
第10章 多重共线性
1
多重共线性的性质
含义:原意是指回归模型的解释变量之间存在“完 全”或准确的线性关系。如:
1 X1 2 X 2 k X k 0
其中1, 2 ,, k为常数,但不同时为零 。
(10.1.1)
现在多重共线性还用来泛指诸X变量之间有交互 相关,但又非完全相关:
x12i
x22i x22i (
x1i x2i )2 2
分子、分母同除 x22i ,有
Var(bˆ1)
2
x12i (
x1i x2i )2 x22i

2
x12i[1 (
x1i x12i
x2i )2 x22i
]
而拟合系数R2 r122 (
• 2、经济变量共同变化的趋势(对时间序列数据)
这些经济变量本身之间可能没有非常密切的联系,但是它
们在相同的样本期间内,有着相同变化的趋势,比如在经济
繁荣的时期,人们的收入、投资、就业等经济变量都会相同
的增长趋势
8
• 3、模型中引入了滞后变量 比如在消费函数中引入了上一期或者前几期收入,各期收 入之间有可能是高度相关的
2
yi x1i x12i 2 2 ( x12i )2 2 (
yi x1i x12i )2
x12i 0 0
因此无法确定bˆ1,同样也没有办法确定bˆ2
12
(2)参数估计量的方差无穷大
在多元线性回归模型一章中也给出了参数估计量的方差
Var(bˆ1)
3
1. 完全多重共线性
假设为了研究某种商品的需求函数
Yi b0 b1X1i b2 X 2i i
收集到一组样本数据,观察两个 自变量,它们之间实际上存在下面 函数关系
X2i 300 2X1i
也就是说两个自变量之间存在明 确的线性关系,即所谓的完全共线 性
Yi
X1i
X 2i
49
10
10.3 多重共线性的后果
多重共线性对多元线性模型的影响,可以从完全多重共线 性和不完全多重共线性两个方面进行分析。
1.完全多重共线性对模型的影响 (1)参数无法估计(参数无唯一解)
前面我们已经通过一个例子说明在完全多线性的情况下, 没有办法得到参数的唯一解,实际上我们也可以从二元线 性回归模型的参数估计表达式中得出同样得结论
1 X1 2 X 2 k X k vi 0
其中vi是随机误差项
(10.1.2)
2
10.1 多重共线性的两种表现形式
对于形如 Yi b0 b1X1i b2 X2i bk Xki i 的多元
线性回归模型,如果自变量之间存在较强的线性关系,或者说
一组不全为零的常数 1, 2 ,k,使得
这个模型实际上变成了一个一元线性回归模型,我们 可以估计出截距系数和斜率系数
cˆ0 b0 300b2
cˆ1 b1 2b2
在上面的方程组中,有三个未知数,没有办法求出 原回归模型中三个参数的唯一解,这就是完全多重共线 性的后果
5
2. 不完全多重共线性
• 假设现在收集到另外一组样本
数据,在这个样本中,两个自
1
298
45
2
296
44
3
294
39
4
292
38
5
290
37
6
288
34
7
286
32
8
284
30
9
282
29
10
280
Yi 商品需求量,X1i 商品价格,X2i 可支配收入
4
因而原来的模型变为
Yi b0 b1X1i b2(300 2X1i ) i
(b0 300b2 ) (b1 2b2 ) X1i i
2.收入参数没有通过t检验
t 0.7911 2
7
10.2 多重共线性产生的原因
• 1、经济变量之间的内在联系(对横截面数据)
工业生产函数中, 劳动力投入量和资金投入量
产品需求函数中, 商品本身价格和替代品价格
消费函数中,
人们的收入和财产
这些变量之间实际上相互联系,经常会表现出一定的相关关系
相关主题