1 《计量经济学》课后习题 P140 六、案例——中国粮食生产函数
建立模型 列出书上的数据 下表列出了1988-2007年全国粮食产量与农业化肥施用量、粮食播种面积、成灾面积、农业机械总动力和第一产业从业人口的统计数据。 表1 中国粮食产量与相关投入资料
年份 粮食产量/万吨 农业化肥施用量/万吨 粮食播种面积/千公顷 成灾面积/公顷 农业机械总动力/万千瓦 第一产业从业人员/万人 1988 39408 2141.5 110123 23944.7 26575 32249 1989 40755 2357.1 112205 24448.7 28067 33225 1990 44624 2590.3 113466 17819.0 28708 38914 1991 43529 2805.1 112314 27814.0 29389 39098 1992 44266 2930.2 110560 25859.0 30308 38699 1993 45649 3151.9 110509 23133.0 31817 37680 1994 44510 3317.9 109544 31383.0 33803 36628 1995 46662 3593.7 110060 22267.0 36118 35530 1996 50454 3827.9 112548 21233.0 38547 34820 1997 49417 3980.7 112912 30309.0 42016 34840 1998 51230 4083.7 113787 25181.0 45208 35177 1999 50839 4124.3 113161 26731.0 48996 35768 2000 46218 4146.4 108463 34374.0 52574 36043 2001 45264 4253.8 106080 31793.0 55172 36513 2002 45706 4339.4 103891 27318.9 57930 36870 2003 43070 4411.6 99410 32516.3 60387 36546 2004 46947 4636.6 101606 16297.3 64028 35269 2005 48402 4766.2 104278 19966.1 68398 33970 2006 49804 4927.7 104958 24631.9 72522 32561 2007 50160 5107.8 105638 25063.8 76590 31444 数据来源:2008年中国统计年鉴 运用多元线性回归模型拟建立中国粮食生产函数,设粮食生产函数为:
XXXXXY
55443322110
其中,Y代表全国粮食产量、X1代表农业化肥施用量、X2代表粮食播种面积、X3代表成灾面积、X4代表农业机械总动力、X5代表第一产业从业人口,μ 为随机误差项。
3.2 模型回归分析 用 OLS 法估计模型,利用 Eviews软件的回归结果如表2所示。 表2 Eviews软件回归结果 2
Dependent Variable: Y Method: Least Squares Date: 12/21/13 Time: 13:08 Sample: 1988 2007 Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob. C -32694.46 6936.839 -4.713163 0.0003 X1 5.944415 0.499374 11.90374 0.0000 X2 0.577844 0.049104 11.76767 0.0000 X3 -0.149139 0.025107 -5.940150 0.0000 X4 -0.077387 0.034158 -2.265568 0.0399 X5 0.032382 0.069423 0.466449 0.6481
R-squared 0.982491 Mean dependent var 46345.70 Adjusted R-squared 0.976238 S.D. dependent var 3343.081 S.E. of regression 515.3347 Akaike info criterion 15.57084 Sum squared resid 3717978. Schwarz criterion 15.86955 Log likelihood -149.7084 F-statistic 157.1185 Durbin-Watson stat 2.177300 Prob(F-statistic) 0.000000
XXXXXY543210.0323820.077387-0.149139-0.5778445.944415-32694.46
(-4.713163) (11.90374) (11.76767) (-5.940150) (-2.265568) (0.466449) 0.9824912R 0.9762382R
F=157.1185 D.W.=
2.177300
给定显著性水平5%,自由度为(5,14)的F分布的临界值F0.05(5,14)=2.96,因此总体上看,X1,X2,X3,X4,X5联合起来对Y有显著线性影响。在5%的显著水
平下,自由度为14的t 分布的临界值为145.2)14(t0.025。因此,X5的参数估计值未能通过该显著性水平下的t 检验,而且符号的经济意义也不合理。同时,X4的参数估计值虽通过t 检验,但经济意义不合理。故认为解释变量间存在多重共线性。
3.3 回归模型多重共线性检验 1).检验简单相关系数 x1,x2,x3,x4,x5的相关系数如表3所示: 表3 相关系数表 X1 X2 X3 X4 X5 X1 1 -0.6252 0.0973 0.9450 -0.3368
X2 -0.6252 1 -0.0705 -0.7482 0.1949
X3 0.09723 -0.0705 1 0.0400 0.1398
X4 0.9450 -0.7482 0.0400 1 -0.4467
X5 -0.3368 0.1949 0.1398 -0.4467 1
由表中数据可以发现x1与x4间存在高度相关性。 3
2).找出最简单的回归形式 分别做 Y与X1,X2,X3,X4,X5之间的回归: (1) Y与x1之间回归:
X12.71787836086.55Y
(14.73657) (4.295126) 0.5061472R F=18.44810 D.W.= 0.745206
(2) Y与x2之间回归: X20.05163740728.84Y
(2.034244) (0.280746) 0.0043602R F=0.078818 D.W.= 0.411491
(3) Y与x3之间回归: X30.089173-48628.91Y
(11.61381) (-0.554536) 0.0043602R F=0.307510 D.W.= 0.316723
(4)Y与x4之间回归: X40.10822241328.80Y
(20.38283) (2.613922) 0.2751462R F=6.832589 D.W.= 0.590314
(5) Y与x5之间回归: X50.342208-58525.65Y
(4.631180) (-0.965505) 0.0492392R F=0.932201 D.W.= 0.518321
可见,粮食生产受农业化肥施用量的影响最大,与经验相符,因此选(1)Y=f(X1)为初始的回归模型。
3) 逐步回归 将其它变量逐步导入初始回归模型,并找出最佳回归方程(表4)。 表4 逐步回归 4
C X1 X2 X3 X4 X5 R2 Y=f(X1) 36087 2.72 0.4787 t值 14.74 4.30 Y=f(X1, X2) -42818 4.72 0.66 0.9269 t值 -5.68 15.55 10.55 Y=f(X1,X2,X3) -39409 4.79 0.65 -0.13 0.9659 t值 -7.58 23.02 15.39 -4.52 Y=f(X1,X2,X3,X4) -30588 6.04 0.57 -0.19 -0.09 0.9775 t值 -5.97 13.55 12.86 -6.08 -3.04 Y=f(X1,X2,X3,X5) -43834 4.89 0.65 -0.14 0.16 0.9697 t值 -7.93 23.84 16.36 -5.03 1.73 讨论: 第一步:在初始模型中引入X2(粮食播种面积),模型拟合优度大幅提高,且参数符号合理,变量也通过了t检验; 第二步:引入 X3(成灾面积),模型拟合优度再次提高,且参数符号合理,变量的参数也通过了t检验; 第三步:引入X4(农业机械总动力),模型拟合优度仍略有提高,变量的参数通过了t检验,但参数符号不合理; 第四步:去掉X4,引入X5(第一产业从业人口),模型拟合优度仍有所提高,参数符号合理,但变量的参数未能通过t检验; 第三步和第四步表明,X4和X5是多余的。因此,最终的粮食生产函数应以Y=f(X1,X2,X3)为最优,拟合结果如下:
XXX3210.13-0.654.79-39409Y
通过分析,我们得出结论:粮食产量与农业化肥施用量、粮食播种面积和成灾面积有着密切联系。