粮食产量的影响因素分析一、问题的提出改革开放以来,中国经济迅速发展,人口增长迅猛,对粮食的需求日益增加。
粮食产量无疑成了影响中国经济发展的重大因素。
同时,粮食的产量直接关系到农业劳动力的生活水平,因此,“三农”问题成为中国经济研究的热点问题,提高粮食产量,关注农村居民收入迫在眉睫。
为此,本文将就粮食产量影响因素进行分析,希望从中发现一些对粮食产量关键作用的因素。
二.研究方案与数据的搜集统计通过对影响粮食产量的主要因素的分析,把影响农民收入的因素主要归结与以下几个方面:农业化肥施用量,粮食播种面积,成灾面积,农业机械总动力,农业劳动力。
通过查找中国统计年鉴,我们得到如下的统计资料:注:这里由于没有从事粮食生产的农业劳动数据,用第一产业劳动力替代。
资料来源:《中国统计年鉴》(1985,2009)三、模型的估计、检验、确认对模型有如下假设:1.零均值: 0)(=i u E n i ,,3,2,1 =2.同方差无自相关:3.随机扰动项与解释变量不相关:0),(=i ji u X Cov k j ,,3,2 =4.无多重共线性5. 残差的正态性:显然这些假设是不可能完全成立的,所以必须对其进行检验。
残差的正态性检验已完成。
主要需要检验的有:一、多重共线性检验。
二、异方差性检验。
三、自相关性检验。
由于现有知识有限,只能对检验出来的一种情况进行修正,其它的暂不做修正,只做检验。
我们将基于以上数据进行分析。
(1)利用Eviews5.0作OLS 估计的结果为:Dependent Variable: Y Method: Least Squares Date: 12/26/11 Time: 12:41 Sample: 1985 2009 Included observations: 25Variable Coefficient Std. Error t-Statistic Prob.C -26695.08 7507.527 -3.555775 0.0021 X1 5.994511 0.609713 9.831685 0.0000 X2 0.536701 0.057858 9.276245 0.0000 X3 -0.135873 0.029720 -4.571732 0.0002 X4 0.090822 0.042053 -2.159696 0.0438 X5-0.0073900.070511-0.1048140.9176R-squared0.980829 Mean dependent var 44945.64 Adjusted R-squared 0.975783 S.D. dependent var 4150.729 S.E. of regression 645.9230 Akaike info criterion 15.98480 Sum squared resid 7927113. Schwarz criterion 16.27733 Log likelihood -193.8100 F-statistic 194.4114 Durbin-Watson stat1.715679 Prob(F-statistic)0.000000⎩⎨⎧≠===--=ki k i u u E Eu u Eu u E u u COV k i k k i i k i ,0,),()])([(),(2σ),0(~2σμN iY= -26695.08+5.994511X1+0.536701X2+-0.135873X3+0.090822 X4+-0.007390X5 (7507.527) (0.609713) (0.057858)(0.029720) (0.042053) (0.070511) T =(-3.555775)(9.831685) (9.276245) (-4.571732) (-2.159696) (-0.104814)R-Squared=0.980829df=19从上面的估计的结果可以看出:可决系数R-Squared=0. 980829,表明模型在整体的拟和非常好。
系数显著性检验:对于C、X1、X2、X3、X4的系数,t的统计量的绝对值都通过了检验,而X5的系数的t统计量为-0.104814,在df=19、α=0.05的情况下,X5的系数不能通过检验。
根据经验判断,无法通过第一步检验的原因很可能是解释变量之间存在多重共线性。
(2)多重共线性的检验与修正我们对X1 X2 X3 X4 X5进行多重共线性检验,得到:表1.2 相关系数表X1 X2 X3 X4 X5X1 1.000000 -0.616566 0.400644 0.952746 0.314885 X2 -0.616566 1.000000 -0.238039 -0.741538 -0.060970 X3 0.400644 -0.238039 1.000000 0.310096 0.409704 X4 0.952746 -0.741538 0.310096 1.000000 0.128834 X5 0.314885 -0.060970 0.409704 0.128834 1.000000可以发现X1 X2 X3 X4 X5之间存在高度的线性相关关系。
运用逐步回归法进行修正:表1.3一元回归估计结果变量X1 X2 X3 X4 X5参数估计3.158761 -0.14429 0.182715 0.165219 0.553797值t值7.716525 -0.68297 1.126564 4.775066 1.799071r^2 0.721363 0.019877 0.052295 0.165219 0.123364其中,加入X1的r^2最大,以X1为基础,顺次加入其他变量逐步回归。
结果如下。
表1.4 加入新变量的回归结果(一)加入变量X2 X3 X4 X5参数估计0.631835 -0.10622 -0.26297 0.146656值t值11.07516 -1.11232 -3.97217 0.79565r^2 0.957624 0.736199 0.837737 0.729157其中,加入X2的r^2最大,以X1,X2为基础,顺次加入其他变量逐步回归。
结果如下。
表1.4 加入新变量的回归结果(二)加入变量X3 X4 X5参数估计-0.11151 -0.03681 0.002836值t值-3.63213 -0.82605 0.037402r^2 0.973974 0.958958 0.957627其中,加入X3的r^2最大,以X1,X2,X3为基础,顺次加入其他变量逐步回归。
表1.5 加入新变量的回归结果(三)加入变量X4 X5参数估计-0.08821 0.082863值t值-2.67113 1.34134r^2 0.980817 0.082863显然可见,加入X5时,参数的检验值不显著,说明主要是因为X5引起了多重共线性。
修正多重共线性以后的回归结果为:Dependent Variable: YMethod: Least SquaresDate: 12/26/11 Time: 13:36Sample: 1985 2009Included observations: 25Variable Coefficient Std. Error t-Statistic Prob.C -27110.39 6217.065 -4.360641 0.0003X1 5.954533 0.463769 12.83943 0.0000X2 0.538519 0.053816 10.00673 0.0000X3 -0.136393 0.028570 -4.773986 0.0001X4 0.088210 0.033023 -2.671134 0.0147R-squared 0.980817 Mean dependent var 44945.64Adjusted R-squared 0.976981 S.D. dependent var 4150.729S.E. of regression 629.7498 Akaike info criterion 15.90538Sum squared resid 7931696. Schwarz criterion 16.14915Log likelihood -193.8172 F-statistic 255.6537Durbin-Watson stat 1.706044 Prob(F-statistic) 0.000000Y = -27110.39+ 5.954533X1+ 0.538519X2+-0.136393X3+0.088210X4(6217.065) (0.463769) (0.053816)(0.028570) (0.033023)T = (-4.360641)(12.83943) (10.00673) (-4.571732) (-2.671134)R-Squared=0.980817 Adjusted R-squared=0.976981 F-statistic=255.6537(3)自相关检验1.706044得到dl=1.038,dv=1.767,由于DW=1.706044,介于DL和DU之间,所以根据判定定理无法通过DW检验其自相关是否存在。
(4)异方差检验利用怀特检验的方法进行,结果如下:White Heteroskedasticity Test:F-statistic 1.292972 Probability 0.347081Obs*R-squared 16.10371 Probability 0.307082Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 12/26/11 Time: 13:54Sample: 1985 2009Included observations: 25Variable Coefficient Std. Error t-Statistic Prob.C -2.30E+08 2.75E+08 -0.837516 0.4219X1 49179.67 41752.13 1.177896 0.2661X1^2 -0.995886 2.105686 -0.472951 0.6464X1*X2 -0.444369 0.387229 -1.147561 0.2779X1*X3 -0.110715 0.143066 -0.773874 0.4569X1*X4 0.300021 0.301199 0.996090 0.3427X2 3211.790 4746.863 0.676613 0.5140X2^2 -0.010124 0.020745 -0.488019 0.6361X2*X3 -0.004130 0.016274 -0.253749 0.8048X2*X4 0.016188 0.029300 0.552498 0.5927X3 902.1972 1891.897 0.476874 0.6437X3^2 -0.004837 0.006702 -0.721763 0.4870X3*X4 0.004962 0.009664 0.513384 0.6188X4 -2218.252 3182.078 -0.697108 0.5016X4^2 -0.010839 0.010163 -1.066478 0.3113R-squared 0.644148 Mean dependent var 317267.9Adjusted R-squared 0.145956 S.D. dependent var 558892.5S.E. of regression 516497.6 Akaike info criterion 29.43124Sum squared resid 2.67E+12 Schwarz criterion 30.16256Log likelihood -352.8905 F-statistic 1.292972Durbin-Watson stat 2.895846 Prob(F-statistic) 0.347081从上表看出,Obs*R-squared=16.10371,在显著性水平=0.05下,查其相关分布表,得临近值为23.684,Obs*R-squared=16.10371<23.684,所以接受原假设,表明模型不存在异方差。