能源消耗量多重共线性
数据来源:《2001年一2015年中国统计年鉴》
最小二乘法:
Dep endent Sample: 20Q1 2015
In eluded observatio ns: 15
Vanable CoefUaent Std Error t-Statistic Prob C 132334.0 103956.8 1.272849 0.2437 GDP -0.344084 0.212689 -1.6177S4 0 1497 QC -2096395 2060207 -1.017566 0.3428 FDL 7.647163 2.353612 3.249118 0.0141 HXXW 3559803 23.04932 1.269123 0.2450 TU 1337.533 729.2753 1.834058 0.1093 HF -3.055542 8.653656 -0.353208 0.7343 LSCL
-1.669657 2.724030
-0.612936
0.5593 R-squared
0.996149 Mean dependentvar 290620 1 Adjusted R-squared 0.992297 S.D dependent var 90737 42 S.E. of regression 7963.604 Akaike info criterion 21.10768 Sum squared resid 4 44E+0S Schwarz critenon 21.48530 Log liKelifiood -1503076 Hannan-Quinn criter. 21.10366 F-statistic
258 6471 Durbin-Watson stat
2.66U01
Prob(F-statistic)
0.000000
得到的回归模型为
Y = 132333.984713 - 0.344084350491*GDP - 20.9639535518*QC + 7.64716297259*FDL +
35.5980328128*HXXW + 1337.53288876*TLJ - 3.0565********HF - 1.66965708916*LSCL
258.6471,明显显著。
但是当 G =0.05时,口2
(n - k-1)=鮎.02
5(15 — 8) = 1.7531 不仅 HF 、HXXW 的系数t 检验不显著,而且 GDP 、QC 、LSCL 系数的符号与预期相反,这样表明可能存在严重的多重共线 性。
计算各解释变量的相关系数,选择 GDP 、QC 、FDL 、HXXW 、TLJ 、HF 、LSCL 的数据
¥
GDP
QC FDL HXXW TLJ HF
LSCL Y
1.D000G0 0 978962 0.9715M 0.993906 0.392043 0 982450 0.95517B OJ70274 GDP
097G962
1 000000
0.933772 0 992184
0993639 098S076 0906618
0936553
t= ( 1.273) (-1.617) (1.269)
(1.834)
R2=0.996,F =258.647 : ,DW=2.661
由以上结果可见,该模型
(-0.353 )
(-1.018 ) (-0.613 )
(3.249 )
2
R =0.996149,修正的可决系数为
0.992297,可决系数非常高, F 检验值为
全部解释变量的相关系数矩阵
由相关系数矩阵可以看岀,各解释变量相互之间的相关系数较高吗,证实确实存在严重的多重共线性。
多重共线性的修正
为消除共线性的影响,首先分别拟合Y对GDP QC FDL HXXW TLJ HF LSCL 的一元回归,得到七个回归模型的参数估计结果。
7个解释变量分别进行一元回归模型的参数估计结果
可以发现,变量FDL拟合效果最佳,且整体拟合效果最好。
即发电量对能源消耗量起主要作用。
按照各个
解释变量一元回归模型的拟合优度大小进行排序:FDL,HXXW,TLJ,GDP,LSCL,QC,HF ,以FDL 为基础依次加入其他解释变量进行逐步回归。
加入HXXW
Y = 79506.7054599 + 4.7901720539*FDL + 15.018962978*HXXW
t = ( 5.08510) ( 2.011848) ( 0.550224)
R =0.988,F=500.22,RSS=1.37*10A9
系数为正
加入TLJ
Y = 83502.3622712 + 4.7662124355*FDL + 10.3033091555*HXXW + 296.631527853*TLJ
t= (4.1385 ) ( 1.925450) (0.325176) (0.334023)
R2
=0.988266 , F=308.8278 , RSS=1.35*10A9
系数为正
加入TLJ
Y = 57002.1055085 + 5.90241783797*FDL + 49.5728951535*HXXW - 0.311419040916*GDP t= (4.088001 ) ( 3.191238 ) ( 2.101646 ) (-3.107994 )
R =0.993689 , F=577.3510 , RSS=7.27*10A8
系数为负,剔除GDP
加入LSCL
Y = 165163.157653 + 5.61116988855*FDL + 16.2680580598*HXXW - 2.25051469861*LSCL
t= ( 1.420467 ) ( 2.104788 ) ( 0.583718 ) (-0.743696 )
R2=0.988715 , F=321.2445 , RSS=1.3*10A9
系数为负,剔除LSCL
加入QC
Y = 56459.2268715 + 6.33133390691*FDL + 21.8258849727*HXXW - 40.2663627237*QC
t= ( 3.160903 ) ( 2.821108 ) ( 0.891906 ) (-2.051861)
R =0.991428 , F=424.0930 , RSS=9.88*10A8
系数为负,剔除QC
加入HF
Y = 49317.0081576 + 3.58414062424*FDL + 18.0157355404*HXXW + 11.3550355173*HF
t=(2.315445) (1.593152 ) ( 0.726667 ) ( 1.898782 )
R? =0.991073 , F=407.0851 RSS=1.03*10A9
最后,从此模型中可以看出,发电量、化学纤维、和化肥对能源消耗量有显著影响。