当前位置:文档之家› 管理统计学_异方差、自相关、多重共线性的检验

管理统计学_异方差、自相关、多重共线性的检验

实验名称:多元回归模型的异方差、自相关性、多重共线性检验
【实验内容】
表4-7给出了我国1995-2007年名义服务产业产出(Y)、服务员就业人数(X1)、软件外包服务收入(X2)和技术进步知识(X3)的数据。

试完成:
表4-7 我国1995-2007年名义服务业产出、服务员就业人数、软件外包服务收入和技术进步指数的数据
年份名义服务业产出
(亿元)
服务员就业人数
(万人)
软件外包服务收
入(亿美元)
技术进步指数
1995 19978.5 16880 0.09 1.086
1996 23326.2 17927 0.08 1.089
1997 26988.1 18432 0.11 1.047
1998 30580.5 18860 0.14 1.065
1999 33873.4 19205 0.58 1.015
2000 38714 19823 1.06 0.999
2001 44361.6 20228 1.8 1.021
2002 49898.9 21090 3.26 1.139
2003 56004.7 21809 4 0.772
2004 64561.3 23011 6.33 1.34
2005 73432.9 23771 9.6 1.45
2006 84721.4 24614 14.3 1.58
2007 100053.5 24917 22.06 1.64
(1)根据表4-7的数据建立多元回归模型,并进行估计。

(2)用White检验法对回归模型的随机干扰项进行异方差检验。

(3)用LM检验法回归模型的随机干扰项进行自相关检验。

(4)根据回归方程的结果判断各项系数是否通过了t检验,方程是否通过了F检验。

【实验步骤】
(一)参数估计:
打开EViews软件,输入数据,估计样本回归方程(操作方法同第二章案例的建立工作文件部分)如下图:
根据上图,模型的估计的回归方程为:
Y=-76769.99+6.0453X1+1631.505X2-6206.783X3 (0.199) (2.235) (31.487) (17.770)
998.02=R 181.1617=F 括号内为t 统计量值。

(二)检验异方差性: (1)图形检验分析:
1. 散点图:在EViews 命令窗口中输入:SCAT X1 Y ,得到名义服务业产出(Y )和服务员就业人数(X1)的散点图。

从图中可以看出,随着名义服务业产出(Y )的增加,服务员就业人数(X1)也不断提高,而离散程度几乎没有变化。

这说明变量之间不存在异方差性。

同样地,也用散点图法检验X2,得到下图:
从图中可以看出,随着名义服务业产出(Y )的增加,软件外包服务收入(X2)也不断提高,而离散程度几乎没有变化。

这说明变量之间不存在异方差性。

检验X3得到下图:
从图中可以看出,随着名义服务业产出(Y)的增加,技术进步指数也不断提高,而离散程度几乎没有变化。

这说明变量之间不存在异方差性。

2、残差检验法:
在命令窗口输入:line resid,得到如下图的模型残差分布图
上图显示回归方程的残差分布有明显的缩小的趋势,即表明不存在异方差性。

3、White检验法:
(1)建立回归模型:ls y c x1 x2 x3,回归结果如最上面的图所示,
(2) 在方程窗口上以此点击View\Residual\Test\White Heteroskedastcity,检验结果如下图:
其中F 值为辅助回归模型的F 统计量值。

取显著水平
05
.0=α,由于
9073.116.919)9(20.052=>=nR χ,所以不存在异方差性。

实际应用中可以直接观察相伴概
率p 值的大小,在显著水平05.0=α的条件下,若p 值小于0.05,则认为存在异方差性。

反之,则认为不存在异方差性。

4、Park 检验:
1. 建立回归模型。

2. 生成新变量序列残差平方的对数:在命令窗口分别输入GENR LNE2=log(RESID^2)。

3. 建立新残差序列对解释变量的回归模型:LS LNE2 C X1 X2 X3,回归结果如图3-10所示。

从上图所示的回归结果中的p 值可以直接看出,X 的系数估计值在显著水平05.0=α的条件下,显著为0,即随机干扰项的方差与解释变量不存在较强的相关关系,即认为不存在异方差性。

由于Gleiser 检验与Park 检验原理相同,在此略去。

三、自相关性检验:
模型的估计的回归方程为:
Y=-76769.99+6.0453X1+1631.505X2-6206.783X3 se=(6477.589) (0.290) (149.751) (2744.556) t = (0.199) (2.235) (31.487) (17.770)
998.02=R 181.1617=F DW=1.6205 (一)DW 检验
由于样本容量小于15,所以该检验法不适合使用。

(二)BG 检验
在方程窗口中点击View/Residual Test/Serial Correlation LM Test ,选择滞后期为2,输出结果如下图。

可得16.919)9(11534.0008872.0*1305.022=<==χnR ,相伴概率(即p 值)为0.5618,因此在显著性水平0.05α=的条件下,接受无自相关的原假设,即随机干扰项不存在自相关。

(4)模型检验: 1、经济意义检验:
模型估计结果说明,在假定其他变量不变的情况下,当服务就业人数每增长1万人,名义服务业产出就会增加6.0453亿美元;在假定其他变量不变的情况下,当软件外包服务收入每增长1亿美元,国债发行总量就会增加1631.505亿美元;在假定其他变量不变的情况下,当技术进步指数每增长1,国债发行总量就会增加-6206.783亿美元;服务就业人数、软件外包服务收入与名义服务业产出均为正相关,这与理论分析及经验判断相一致。

但技术进步指数与名义服务业产出为负相关,这与理论分析及经验判断不一致。

说明该模型可能存在多重共线性。

2、t 检验: 分别针对
0H :
)
3,2,1(0==j j β,给定显著性水平α=0.05,查t 分布表得自由度为13-3-1=9,
临界值2622.2)9(025.0=t 。

)
3,2,1(==j t j 对应的t 统计量分别为2.435、31.487、17.770。

,
其绝对值均大于临界值2.2622,所以均通过了显著性检验。

3、F 检验:
针对
0H :
321===βββ,给定显著性水平05.0=α,在F 分布表中查出自由度为3和9
的临界值68.3)9,3(05.0=F 。

由于F=1617.181>3.86,应拒绝原假设
H ,说明回归方程显著,
即服务员就业人数(X1)、软件外包服务收入(X2)、技术进步指数(X3)对名义服务业产出有显著影响。

(5)多重共线性检验: 计算各解释变量的系数,选择X1,X2,X3的数据,点“View/covariance analysis ”,勾选correlation 得相关系数矩阵,如下图所示:
由相关系数矩阵可以看出,个解释变量之间存在较高的相关系数,由此证实存在较严重的多重共线性。

(6)多重共线性的修正:
①采用逐步回归的办法,去检验和解决多重共线性问题。

分别作Y 对X1、X2、X3的一元回变量 X1 X2 X3 参数估计值 9.297 3514.690 76854.93 t 统计量 17.409 10.232 4.161 2
R
0.965
0.905
0.611 修正后的2
R
0.962
0.896
0.576
F 统计值
303.065
104.685
17.312
按2
R 的大小排序为:X1、X2、X3。

②以X1为基础,顺次加入其他变量逐步回归。

首先加入X2回归结果为:
Y=-84355.98+6.112X1+1408.58X2 t=(-12.81) (17.82) (10.52) R=0.997 F=1716.85
X2的系数为正,合理,而且Prob=0,显著,所以予以保留。

③加入X3,以X1,X2,X3作为解释变量,得到回归结果为:
Y=-76769.99+6.0453X1+1631.505X2-6206.783X3 t = (0.199) (2.235) (31.487) (17.770)
998.02=R 181.1617=F
可以发现X3的系数估计值为负,不合理,予以剔除。

那么,消除共线性后的最终模型为:
Y=-84355.98+6.112X1+1408.58X2
t=(-12.81) (17.82) (10.52)
R=0.997 F=1716.85
最后,从此模型中可以看出,服务员就业人数和软件外包服务收入对服务业产出有显著影响。

相关主题