实验报告
实验题目:多重共线性的研究指导老师:
学生一:
学生二:
实验时间:2011年10月
多重线性回归分析及其实验报告
实验目的:为了更好地了解财政收入构成,需要定量地分析影响财政收入的因素
模型设定及其估计:经分析,影响财政收入的主要因素,农业增加值X1,工业增加值X2,建筑业增加值X3,总人口X4,受灾面积X5.为此设定了如下形式的计量经济模型:
Y=β
1+β
2
X1+β
3
X2+β
4
X3+β
5
X4+β
6
X5+u0
其中,Y为财政收入(元),X1农业增加值(元),X2为工业增加值(元),X3为建筑业增加值(元),X4为总人口(万人),X5为受灾面积(千公顷)
为估计模型参数,收集1978~2007年财政收入及其影响因素数据,如图:
1978~2007年财政收入及其影响因素数据
年份
财政收入CS/亿
元
农业增加值
NZ/亿元
工业增加值
GZ/亿元
建筑业增加
值JZZ/亿元
总人口
TPOP/万
人
受灾面积
SZM/千公顷1978 1132.3 1027.5 1607 138.2 96259 50790 1979 1146.6 1270.2 1769.7 143.8 97542 39370 1980 1159.9 1371.4 1996.5 195.5 98705 44526 1981 1175.8 1559.5 2048.5 207.1 100072 39790 1982 1212.3 1777.4 2162.3 220.7 101654 33130 1983 1367 1978.5 2375.8 270.6 103008 34710 1984 1642.5 2316.1 2789 316.7 104357 31890 1985 2004.6 2564.3 3448.5 417.9 105851 44365 1986 2122 2788.7 3987.5 525.7 107507 47170 1987 2199.4 3233 4565.9 665.8 109300 42090 1988 2357.6 3865.4 5062 810 111026 50870 1989 2664.5 5062 8087.3 794 112704 46991 1990 2937.4 5342.3 10284.5 859.4 114333 38474
1991 3149.48 5866.8 14188 1015.1 115823 55472 1992 3483.48 6963.6 19480.5 1415 117171 51333 1993 4348.95 9572.7 19480.4 2266.5 118517 48829 1994 5218.1 12315.7 24950.7 2964.7 119850 55043 1995 6242.2 14015.8 29447.6 3728.8 121121 45821 1996 7407.99 14441.8 32921.4 4387.4 122389 46898 1997 8615.14 14917.6 34018.4 4985.8 123626 53429 1998 9875.95 14944.5 40036 5172.1 124761 59145 1999 11444.08 15871.8 43580.6 5522.3 125786 49981 2000 13395.23 16537 47431.6 5913.7 126743 54688 2001 16386.04 17381.8 54945.5 6465.5 127627 52215 2002 18903.64 21412.7 65210 7490.8 128453 47119 2003 21715.25 22420 76912.6 8694.3 129227 54506 2004 26396.47 21224 87632.4 8967.8 129988 37106 2005 31649.29 22420 89834.5 10133.8 130756 38818 2006 38760.2 24040.9 91310.9 11851.1 131448 41091 2007 51321.45 28095 107367.2 14014.1 132129 48992
利用Eviews软件,生成Y、X1、X2、X3、X4、X5等数据,采用这
些数据进行OLS回归,结果如下
Dependent Variable: Y
Method: Least Squares
Date: 10/24/11 Time: 22:49
Sample: 1978 2007
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
C -6734.394 11259.37 -0.598115 0.5554
X1 -1.678611 0.328371 -5.111937 0.0000
X2 0.071078 0.081171 0.875666 0.3899
X3 5.699199 0.745591 7.643870 0.0000
X4 0.101481 0.114244 0.888277 0.3832
X5 -0.010922 0.057578 -0.189691 0.8511
R-squared 0.983660 Mean dependent var 10047.83
Adjusted R-squared 0.980255 S.D. dependent var 12585.61
S.E. of regression 1768.473 Akaike info criterion 17.97048
Sum squared resid 75059958 Schwarz criterion 18.25072
Log likelihood -263.5572 F-statistic 288.9512
Durbin-Watson stat 0.898668 Prob(F-statistic) 0.000000
由此可见,该模型R2=0.983660,R2=0.980255可决系数很高,F检验值为288.9512,明显显著。
但是,当 =0.05时,t a2/(n-k)=t025.0(30-6)=2.064,X2、X4的系数t检验不显著,而且X5的系数的符号与预期相反,这表明很可能存在严重的多从共线性。
相关系数矩阵
变量X1 X2 X3 X4 X5
X1 1.000000 0.969706 0.972734 0.946742 0.297017
X2 0.969706 1.000000 0.991036 0.880790 0.162275
X3 0.972734 0.991036 1.000000 0.875033 0.183445
X4 0.946742 0.880790 0.875033 1.000000 0.398598
X5 0.297017 0.162275 0.183445 0.398598 1.000000 由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在严重的多重共线性。
修正多重共线性:
采用逐步回归的方法,分别作Y对X1、X2、X3、X4、X5的一元回归:
一元回归估计结果
加入新变量的回归结果(一)
经比较,新加入X1的方程R2=0.98102,改进最大,而且各参数的T检验显著,选择保留X1,在加入其他变量逐步回归,结果如下:
加入新变量的回归结果(二)
在X1,X3基础上加上X2后的方程R 2有所改善,且各参数
的T 检验都显著。
而加入X4时,R 2
有所下降 ,且X4参数的T 检验变得不显著。
加入X5后,R 2
有所下降,X4参数的T 检验变得不显著,甚至X5
参数的符号也变得不合理。
保留X2,再加入其他新变量逐步回归,结果如下:
加入新变量的回归结果(三)
当加入X4,有所下降,参数的T 检验不显著。
加入X5 ,R 2也有
所下降,参数的T 检验不显著,且参数为负值不合理。
说明主要是
X4,X5引起了多重共线性,予以剔除。
最后修正多重共线性影响后的回归结果为:
Y=2957.433+1.457X1+0.082847X2+5.400387X3
T=4.555717 (-8.726769) (1.104935) (8.330814)
R2=0.983121 R2=0.981174 F=504.7988 DW=0.749673
这说明,在其他因素不变的情况下,当农业增加值每增加1元,工业增加值和建筑业增加值分别增加1元时,平均来说,财政收入将分别增加1.457元、0.082847元和5.400387元。