第四章多重共线性
21662.5
21617.8
8087.1
1015.1
1409.7
46.9
65.9
1992
109170
26651.9
26638.1
10284.5
1415.0
1681.8
54.6
66
1993
115993
34560.5
34634.4
14143.8
2284.7
2123.2
61.2
67.32
1994
122737
26.4
67.48
1988
92997
14922.3
14928.3
5777.2
810.0
661.0
31.2
66.54
1989
96934
16917.8
16909.2
6484.0
794.0
786.0
35.3
66.51
199
.4
18547.9
6858.0
859.4
1147.5
42.4
67.2
1991
103783
第四章-多重共线性
———————————————————————————————— 作者:
———————————————————————————————— 日期:
第四章多重共线性
一、填空题
1.在多元线性回归模型中,解释变量间呈现近似线性关系的现象为________问题,给计量经济建模带来不利影响,因此需检验和处理它。
2.理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计数据,具体如下:
年份
商品进口额
(亿元)
国内生产总值
(亿元)
居民消费价格指数(1985=100)
1985
1257.8
8964.4
100
1986
1498.3
10202.2
106.5
1987
1614.2
11962.5
114.3
1988
2055.1
14928.3
135.8
1989
2199.9
16909.2
160.2
1990
8.克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:
括号中的数据为相应参数估计量的标准误。试对上述模型进行评析,指出其中存在的问题。
9.将下列函数以适当的方法消除多重共线性
46670.0
46759.4
19359.6
3012.6
2685.9
72.7
65.2
1995
.9
58478.1
24718.3
3819.6
3054.7
83.5
71.05
1996
.5
67884.6
29082.6
4530.5
3494.0
93.1
71.5
1997
.7
74462.6
1997
11806.5
74462.6
337.1
1998
11626.1
78345.2
334.4
1999
13736.4
82067.5
329.7
2000
18638.8
89468.1
331.0
2001
20159.2
97314.8
333.3
2002
24430.3
105172.3
330.6
2003
34195.6
(1)消费函数为: ,式中C、W、P分别表示消费、工资收入和非工资收入,W与P可能高度相关,但研究表明 。
(2)需求函数为: ,式中Q、Y、P、Ps分别表示需求量、收入水平、该商品价格及其替代品价格水平,P、Ps可能高度相关。
三、实践题
1.下表给出了中国商品进口额Y、国内生产总值GDP、消费者价格指数CPI。
(2) 会等于 或 或某两个的某个线性组合吗?
(3)是否有 且 ?
7.在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而作出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么?
二、问答题
1.简述多重共线性的含义。
2.简述多重共线性的后果。
3.方差膨胀因子(Variance InflationFactor,VIF)及其含义?
4.列举多重共线性的检验方法。
5.多重共线性的补救办法?
6.假设在模型 中, 与 之间的相关系数为零,于是有人建议你进行如下回归:
(1)是否存在 且 ?为什么?
2574.3
18547.9
165.2
1991
3398.7
21617.8
170.8
1992
4443.3
26638.1
181.7
1993
5986.2
34634.4
208.4
1994
9960.1
46759.4
258.6
1995
11048.1
58478.1
302.8
1996
11557.4
67884.6Байду номын сангаас
327.9
117251.9
334.6
资料来源:《中国统计年鉴》,中国统计出版社2000年、2004年。
请考虑下列模型:
(1)利用表中数据估计此模型的参数。
(2)你认为数据中有多重共线性吗?
(3)进行以下回归:
根据这些回归你能对数据中多重共线性的性质说些什么?
(4)假设数据有多重共线性,但 在5%水平上个别地显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?
年份
Y
X1
X2
X3
X4
X5
X6
X7
1985
76682
8989.1
8964.4
3448.7
417.9
406.9
21.3
68.29
1986
80850
10201.4
10202.2
3967.0
525.7
475.6
23.2
68.32
1987
86632
11954.5
11962.5
4585.8
665.8
544.9
2.在回归分析中,当检验回归系数所得的t值不显著时,我们往往将它归结为多重共线性。但也可能是其他原因的影响,如或。
3.存在多重共线时,回归系数的标准差趋于,t值趋于。方差膨胀因子越大,OLS估计量的将越大。
4.检验样本是否存在多重共线性的常见方法有:________、和。
5.处理多重共线性的方法主要有两大类:__________和_________。