实验目的:在回归模型牵涉到多个自变量的时候,自变量之间可能会相互关联,即他们之间存在有多重共线性,本节实验的实验目的是如何用Eviews检测各个自变量之间是否存在的多重共线问题以及如何对多重共线性进行修正。
我们实验的原始数据如图所示,判断钢产量y与生铁产量X1,发电量X2,固定资产投资X3,国内生产总值X4,铁路运输量X5之间的关系。
实验步骤:1:打开Eviews7.0. →File→Workfile,选择年度数据,在初始日期和结束日期分别输入“1978”和结束年份“1997”。
点击“OK”确定。
2:在新建工作表中,点击Proc→Import→Read,选定需要导入的Excel工作表,在“Upper-left data cell”中输入数据在Excel中的初始位置“B2”,在“Excel 5+….”中输入“sheet1”,在“Name for serises、”中输入“y x1 x2 x3 x4 x5”点击“OK”即可。
3:在Eviews空白处输入:“ls y c x1 x2 x3 x4 x5”,回车即可,结果如下。
Dependent Variable: YMethod: Least SquaresDate: 04/19/13 Time: 11:24Sample: 1978 1997Included observations: 20Variable Coefficient Std. Error t-Statistic Prob.C 354.5884 435.6968 0.813842 0.4294X1 0.026041 0.120064 0.216892 0.8314X2 0.994536 0.136474 7.287380 0.0000X3 0.392676 0.086468 4.541271 0.0005X4 -0.085436 0.016472 -5.186649 0.0001X5 -0.005998 0.006034 -0.994019 0.3371R-squared 0.999098 Mean dependent var 5153.450 Adjusted R-squared 0.998776 S.D. dependent var 2512.131 S.E. of regression 87.87969 Akaike info criterion 12.03314 Sum squared resid 108119.8 Schwarz criterion 12.33186 Log likelihood -114.3314 Hannan-Quinn criter. 12.09145 F-statistic 3102.411 Durbin-Watson stat 1.919746 Prob(F-statistic) 0.000000经查表可知,t(17)=1.345,结合上表可知,x1和x5没有通过t检验,而且F\检验较大,估计解释变量之间可能存在着多重共线性。
相关性如下图所示:可知X1 X2 X3 X4 X5,之间存在着较强的多重共线我们分别用y和xi做线性回归,结果如下图所示。
R-squared 0.994453 Mean dependent var 5153.450 R-squared 0.995411 Mean dependent var 5153.450 R-squared 0.930148 Mean dependent var 5153.450 R-squared 0.939387 Mean dependent var 5153.450 R-squared 0.879348 Mean dependent var 5153.450可知拟合由强到弱的顺序依次是:X2 X1 X4 X3 X5,我们选定拟合最好的X2作为基准变量,分别导入X1 X4 X3 X5做回归,结果如下:C -287.6867 101.2341 -2.841797 0.0113X2 0.487185 0.112687 4.323352 0.0005 X1 0.415867 0.117497 3.539376 0.0025X1的t统计量为3.539376,而t0.01(17)=1.333,处于拒绝区域,则拒绝零假设,保存X1变量。
然后我们一X2 X1为解释变量,对X3 X4 X5做回归,结果如下:C -260.7822 215.8307 -1.208272 0.2445X2 0.490976 0.119095 4.122544 0.0008X1 0.405060 0.142867 2.835232 0.0119X3 0.004554 0.031986 0.142378 0.8886Variable Coefficient Std. Error t-Statistic Prob.C -393.0125 195.3528 -2.011808 0.0614X2 0.491128 0.114888 4.274839 0.0006X1 0.443259 0.127166 3.485687 0.0031X4 -0.003932 0.006196 -0.634662 0.5346Variable Coefficient Std. Error t-Statistic Prob.C -188.8822 495.0822 -0.381517 0.7078X2 0.502528 0.138221 3.635681 0.0022X1 0.407267 0.128082 3.179734 0.0058X5 -0.000970 0.004752 -0.204146 0.8408可知解释变量X3 X4 X5的t 统计量均小于t0.01(17)=1.3334,接受零假设,即X3 X4 X5前面的系数为零,可以删除,只保留解释变量X2 X1 ,回归结果如下图示。
Variable Coefficient Std. Error t-Statistic Prob. C -287.6867 101.2341 -2.841797 0.0113 X2 0.487185 0.112687 4.323352 0.0005 R-squared0.997358 Mean dependent var 5153.450 Adjusted R-squared 0.997047 S.D. dependent var 2512.131 S.E. of regression 136.5096 Akaike info criterion 12.80815 Sum squared resid 316792.9 Schwarz criterion 12.95751 Log likelihood -125.0815 F-statistic 3208.727回归结果:( 2.841797) (3.539376) (4.323352)y=-287.6867+0.415867X1+0.487185X2 -下面我们再次对修正后的模型进行序列相关检验和异方差检验.序列相关性检验此时t 统计量均能通过检验,但是DW 为0.692473,经查表可知,存在着序列相关性。
又因为DW=2(1-p ),得p=0.6538,以此我们可以用广义差分法再次回归,在这里我们用另一种方法,Cochrane-Orcutt 法估计模型,回归结果如图所示。
C -214.1697 162.8751 -1.314932 0.2083 X1 0.515590 0.118979 4.333443 0.0006 X2 0.375872 0.116493 3.226572 0.0056 AR(1)0.5825210.1863163.1265220.0069 R-squared0.998626 Mean dependent var 5308.474 Adjusted R-squared 0.998351 S.D. dependent var 2480.737 S.E. of regression 100.7230 Akaike info criterion 12.24729 Sum squared resid 152176.9 Schwarz criterion 12.44612 Log likelihood -112.3492 F-statistic 3634.613 Inverted AR Roots.58此时,DW=1.589375,du<DW<4—du ,表明模型中不存在自相关。
回归方程为:( 1.314932) (4.333443) (3.226572)214.16970.51559010.375872X2 y X -=-++异方差性检验我们对方程再次检验异方差性,如下图:White Heteroskedasticity Test: F-statistic 0.900529 Probability 0.489771 Obs*R-squared3.888180 Probability 0.421351Test Equation:Dependent Variable: RESID^2 Method: Least Squares Date: 04/19/13 Time: 23:41 Sample: 1979 1997 Variable Coefficient Std. Error t-Statistic Prob. C -48641.86 42241.01 -1.151532 0.2688 X1 24.88128 45.16291 0.550923 0.5904 X1^2 -0.002558 0.003265 -0.783372 0.4465 X2 -6.771283 37.99257 -0.178227 0.8611 R-squared0.204641 Mean dependent var 8009.308 Adjusted R-squared -0.022604 S.D. dependent var 16252.35 S.E. of regression 16435.01 Akaike info criterion 22.47315 Sum squared resid 3.78E+09 Schwarz criterion 22.72169 Log likelihood -208.4949 F-statistic 0.900529 Durbin-Watson stat2.428196 Prob(F-statistic)0.489771由于22T*R m χ (),检验结果显示2T*R =3.888180,且约束条件的个数m=4,经查表可知2=9.448χ0.05(4),即22T*R m χ<(),落在非拒绝区域,即原方程不存在异方差性。