第六章 6.6
(1)判断多重共线性
做y 与x1,x2,x3,x4x5,x6的线性回归方程,得到
由表中的VIF 值可知x1,x2,x3,x4,x5的方差膨胀因子远大于10,这几个变量之间存在很高的线性相关性,说明回归方程存在多重共线性。
(2)逐步回归法
得到回归方程:215^
353.0611.0637.06.874x x x y --+=
方程通过了三大检验。
其中,x1为农业,x2为工业,x5为社会消费总额,由方程表明农业每增加一亿元,财政收入减少0.611亿元;工业每增加一亿元,财政收入减少0.353亿元;社会消费总额每增加一亿元,财政收入增加0.637亿元。
结合实际可看出该回归方程不合理。
由表中的VIF 值可知三个自变量的方差膨胀因子远大于10,说明逐步回归法得到的回归方程仍然存在多重共线性。
(3)VIF 后退法
由(1)判断得知原方程存在严重的多重共线性,要消除多重共线性利用VIF 后退法。
首先剔除VIF 值最大的自变量x2,得到
由表中的VIF 值可知除x6外其他自变量的方差膨胀因子仍然大于10
,方程仍存在多重共线性。
再剔除VIF 值最大的自变量x5,得到
由表中的VIF 值可知除x6外其他自变量的方差膨胀因子仍然大于10,方程仍存在多重共线性。
再剔除VIF 值最大的自变量x1,得到
由表中的VIF 值可知剩余自变量的方差膨胀因子都小于10,说明方程的多重共线性已消除。
所以得到回归方程:643^
004.0.031.0359.1332.2296
x x x y +++-= 方程通过了R 检验和F 检验,但是x6没有通过t 检验,说明不显著,所以剔除x6,得到
回归方程为:43^
.033.0359.1802.2306x x y ++-=
模型的自变量x4的
t 检验P 值为0.076>0.05,说明在95%的置信度下4x 对y 的线性影响不显著。
剔除x4
回归方程为:3^
513.1039.1120x y +=
其中,x3为建筑业,由方程表明建筑业每增加一亿元,财政收入增加1.513亿元,结合实际可看出该回归方程合理。
(4)主成分回归法
由表可知第一个主成分的方差百分比=85.542%,含有6个原始变量85.542%的信息量,因此取一个主成分。
1Z =133.5/)61.099.0929.0984.0985.0991.0(*
6*5*4*3*2*1x x x x x x +++++ 1Z =*
6
*5*4*3*2*1119.0193.0181.0192.0192.0193.0x x x x x x +++++ 用y*与主成分1Z 做普通最小二乘回归,得到
1^
983.0Z y =
^
y =*
6*5*4*3*2*11168.01896.01779.01883.01886.01898.0x x x x x x +++++ 还原变量得到方程:
654321^
0438.00342.0.0507.02878.00458.01082.001.6201x x x x x x y ++++++-=
方程通过了三大检验。
其中,x1为农业,x2为工业,x3建筑业,x4为人口,x5为社会消费总额,x6为受灾面积,由方程表明农业每增加一亿元,财政收入增加0.1082亿元;工业每增加一亿元,财政收入增加0.0458亿元;建筑业每增加一亿元,财政收入增加0.2878亿元;人口每增加一万人,财政收入增加0.0507亿元;社会消费总额每增加一亿元,财政收入增加0.0342亿元;受灾面积每增加一万公顷,财政收入增加0.0438亿元。
结合实际可看出该回归方程合理。
(5)选择模型
我选择主成分回归法的模型,因为逐步回归法得到的模型仍然有多重共线性,而VIF 后退法得到的模型变量剔除得只剩下一个,丢失了很多原始变量的信息。
选择主成分回归法得到的模型不仅保留了原始变量的绝多数信息,而且解决了多重共线性的问题,回归模型也相对比较合理。