关于影响粮食产量因素的回归分析摘要:我国土地资源稀缺,人口多而粮食需求量大,因此粮食产量的稳定增长,直接影响着人民生活和社会的稳定与发展。
粮食生产的不稳定性对国民经济的影响是不可忽略的,主要体现在:粮食生产不稳定会引发粮食供求关系的变动,尤其当国家粮食储备不足的时候,很容易导致粮价上涨,从而影响整个宏观经济。
通过回归分析粮食产量波动的原因,并据此提出相应的对策,对保障粮食生产持续稳定发展,具有重要意义。
关键词:线性回归 回归分析 粮食产量 宏观经济 稳定发展一、引言本文按照计量经济分析方法,以1993—2012年中国粮食产量及其重要因素的时间序列数据为样本,对影响中国粮食生产的多种因素进行了分析。
选用了粮食产量、受灾面积、化肥施用量、粮食作物播种面积 农机动力、农村用电量,以粮食产量作为因变量,其它5个指标作为解释变量进行回归分析。
(一)建立模型通过对中国粮食生产及影响因素的初步定性分析后假设,粮食产量与其它3个指标之间存在多元线性关系, 即粮食受灾面积,化肥施用量,粮食作物播种面积,存在着线性关系,也即可以把粮食产量的线性回归模型初步设定为:^01122334455Y X X X X X ββββββ=+++++,其中,y:粮食产量(CHANLIANG ), X 1 受灾面积(SZMJ ),X 2化肥施用量(HFSYL),X 3粮食作物播种面积(BZMJ),X4农机动力,X5农村用电量,然后利用已有的数据进行模型拟合,以便发现这些因素之间存在的数量关系。
(二)数据搜集和来源根据相应年度的《中国统计年鉴》、《中国农村统计年鉴》、《中国农业发展报告》,选用了粮食产量、受灾面积,化肥施用量,粮食作物播种面积,农机动力,农村用电量这6个指标,把这6个指标的1993—2012年20年间的时间序列数据进行回归分析,来分析这些因素与粮食产量的关系。
以粮食产量作为因变量,其它3个指标作为解释变量进行回归分析。
按照计量经济分析方法对影响中国粮食生产的多种因素进行了分析。
数据如下:本次采用的估计模型为^01122334455Y X X X X X ββββββ=+++++粮食产量 受灾面积 化肥施用量 粮食作物播种面积 农机动力农村用电量年份 (万吨)y(万公顷)x1 (万吨)x2 (千公顷)x3(万千瓦)x4(亿千瓦时)x5 1993 45648.8 4882.9 3151.9 110509 31817 1244.8 1994 44510.1 5504.3 3317.9 109544 33803 1473.9 1995 46661.8 4582.1 3593.7 110060 36118 1655.7 1996 50453.5 4698.9 3827.9 112548 38547 1812.7 1997 49417.1 5342.9 3980.7 112912 42016 1980.1 1998 51229.5 5014.5 4083.7 113787 45208 2042.1 1999 50838.6 4998.1 4124.3 113161 48996 2173.4 2000 46217.5 5468.8 4146.4 108463 52574 2421.3 2001 45263.7 5221.5 4253.8 106080 55172 2610.8 2002 45705.8 4711.9 4339.4 103891 57930 2993.4 2003 43069.5 5450.6 4411.6 99410 60387 3432.9 2004 46946.9 3710.6 4636.6 101606 64028 3933.0 2005 48402.2 3881.8 4766.2 104278 68398 4375.3 2006 49746.1 4109.1 4927.7 104957 72522 4895.8 2007 50150.2 4899.2 5107.8 105638 76589 5509.9 2008 52850.5 3999.0 5239.0 106792 82190 5713.2 2009 53082.0 4721.4 5404.4 108986 87496 6104.4 2010 54641.0 3742.6 5561.7 109876 92780 6632.4 201157121.13247.0 5704.2 110573 97735 7139.6 2012 58957.0 2496.05838.91112051025597508.5是回归系数。
其中i二、模型的参数估计与分析线性利用SAS对模型进行拟合,参数估计和检验,用最小二乘法得到线性回归方程的形式如下:Y=-30416-1.24359*X1+5.28523*X2+0.61924*X3-0.14305*X4+0.95538 *X5其中X4为农机动力(万千瓦),但是得到的参数为负值,与其经济学意义不相符,故此推测存在严重的多重共线性。
此外,该模型的F值221.48,可决系数R方为0.9875,修正可决系数为0.9831说明该模型的显著性成立,方程解释变量X1,X2,X3,X系数的t检验伴随概率小于5%,即t检验显著性成立,但是解释变量X5系数的t检验伴随概率大于5%,接受系数为0的假设.因此该方程需要调整,该模型可能存在多重共线性和序列相关、异方差等问题。
三、模型的多重共线性检验所谓多重共线性是指解释变量之间违背了相互独立的假设,及某两个或多个解释变量之间出现了相关性。
多重共线性的检验主要应用逐步回归法。
首先计算出各个变量之间的简单相关系数矩阵,初步判断相关性。
通过SAS程序运行,得到各解释变量的相关系数表如下:1)第一步:由于统计量X2的F值最大,为24.47,说明它最显著,此外R 方 =0.5761和 C(p) = 459.3327,所以X2为最先选入的统计量。
2)第二步:其他变量继续进行统计分析,出最显著的统计量X3,此时R 方=0.9548,比上一次更加显著,而C(p)=36.7162,和上一次比下降的非常明显,说明X3这个统计量是有效果的。
3)第三步:继续进行上述步骤,得出最显著的统计量X1,此时R^2为0.9831,而C(p)=6.9133,下降的非常明显,说明X1是有效果的。
4)第四步:继续上述步骤,发现在水平为0.05下,其他各变量没有通过显著性检验,所以可以剔除X4,X5。
回归方程为:Y=-29857-1.29658X1+3.72461X2+0.32648X3四、异方差性检验以上各统计量似乎没有那个参数的t 检验是显著的,且可决系数比较小。
但怀特统计量nR^2=20*0.1563=3.126,该值小于5%显著性水平下自由度为9的2 分布的相应临界值16.92.因此,接受同方差性的检验。
五、序列相关性由上表得知,D.W.=1.708,查询D.W.分布表得知,n=20,k=4时,l d =1.00,u d =1.68。
u d <D.W.<4-u d ,则无自相关。
六、统计学检验选取2012年数据来进行统计检验:Y=-29857-1.29658*2496.0+3.72461*5838.9+0.32648*111205 =58989.300049与实际值误差为32.300049,误差为0.0543%,与实际情况吻合的很好。
七、总结和建议中国的粮食生产问题,不仅是中国经济界的重要研究课题,而且也越来越受到世界经济学家的重视。
要提高粮食产量,必须积极稳妥地推进农业机械化的发展:①要把主要农产品生产过程机械化和产业化经营有机结合起来;②对农业机械化进行结构性调整;③因地制宜,有重点的推荐地区农业机械化;④大力促进农业技术进步,重视农村的基础教育;⑤建立与农业机械化相适应的农村经济体制。
纵观中国农村现状,与其他产业相比,农业的发展一直比较缓慢。
扩大耕作面积,提高单产,实现机械化、规模化生产是我国农业健康发展的必由之路。
八、参考文献吴玉鸣.中国粮食生产主要影响因素的多因素动态关联分析[J],农业经济问题,1998(1)戚世均等.中国粮食生产潜力及未来粮食生产研究[J].郑州粮食学院学报,2000(3)庞皓,《计量经济学》[M],西南财经大学出版社,2001年8月第一版周四军,《对我国粮食生产影响因素的计量分析》,《统计与决策》[M],2003.赵慧江,《基于回归分析的粮食产量影响因素分析》,《怀化学院学报》[M],2009.相关程序:参数估计:1)data grain1;input year Y X1 X2 X3 X4 X5 @@;cards;1993 45648.8 4882.9 3151.9 110509 31817 1244.81994 44510.1 5504.3 3317.9 109544 33803 1473.91995 46661.8 4582.1 3593.7 110060 36118 1655.71996 50453.5 4698.9 3827.9 112548 38547 1812.71997 49417.1 5342.9 3980.7 112912 42016 1980.11998 51229.5 5014.5 4083.7 113787 45208 2042.11999 50838.6 4998.1 4124.3 113161 48996 2173.4 2000 46217.5 5468.8 4146.4 108463 52574 2421.3 2001 45263.7 5221.5 4253.8 106080 55172 2610.8 2002 45705.8 4711.9 4339.4 103891 57930 2993.4 2003 43069.5 5450.6 4411.6 99410 60387 3432.9 2004 46946.9 3710.6 4636.6 101606 64028 3933.0 2005 48402.2 3881.8 4766.2 104278 68398 4375.3 2006 49746.1 4109.1 4927.7 104957 72522 4895.8 2007 50150.2 4899.2 5107.8 105638 76589 5509.9 2008 52850.5 3999.0 5239.0 106792 82190 5713.2 2009 53082.0 4721.4 5404.4 108986 87496 6104.4 2010 54641.0 3742.6 5561.7 109876 92780 6632.4 2011 57121.1 3247.0 5704.2 110573 97735 7139.6 2012 58957.0 2496.0 5838.9 111205 102559 7508.5 run;proc print data=grain1;title" 原始样本值观测";run;proc reg data=grain1;model Y=X1 X2 X3 X4 X5/DW;run;2)共线性检验:data grain1;input year Y X1 X2 X3 X4 X5@@;cards2;1993 45648.8 4882.9 3151.9 110509 31817 1244.81994 44510.1 5504.3 3317.9 109544 33803 1473.91995 46661.8 4582.1 3593.7 110060 36118 1655.71996 50453.5 4698.9 3827.9 112548 38547 1812.71997 49417.1 5342.9 3980.7 112912 42016 1980.11998 51229.5 5014.5 4083.7 113787 45208 2042.11999 50838.6 4998.1 4124.3 113161 48996 2173.42000 46217.5 5468.8 4146.4 108463 52574 2421.32001 45263.7 5221.5 4253.8 106080 55172 2610.82002 45705.8 4711.9 4339.4 103891 57930 2993.42003 43069.5 5450.6 4411.6 99410 60387 3432.92004 46946.9 3710.6 4636.6 101606 64028 3933.02005 48402.2 3881.8 4766.2 104278 68398 4375.32006 49746.1 4109.1 4927.7 104957 72522 4895.82007 50150.2 4899.2 5107.8 105638 76589 5509.92008 52850.5 3999.0 5239.0 106792 82190 5713.22009 53082.0 4721.4 5404.4 108986 87496 6104.42010 54641.0 3742.6 5561.7 109876 92780 6632.42011 57121.1 3247.0 5704.2 110573 97735 7139.62012 58957.0 2496.0 5838.9 111205 102559 7508.5run;proc print data=grain1;title " 粮食生产原始样本值观测";run;proc reg data=grain1;model Y=X1 X2 X3 X4 X5/DW;run;proc corr;/*求相关系数矩阵*/var X1 X2 X3 X4 X5;run;proc reg data=grain1;model Y=X1 /DW;run;proc reg data=grain1;model Y=X2/DW;run;proc reg data=grain1;model Y=X3/DW;run;proc reg data=grain1;model Y=X4/DW;run;proc reg data=grain1;model Y=X5/DW;run;/*以下是逐步回归过程*/proc reg data=grain1;model Y=X1 X2 X3 X4 X5/ dw selection=stepwise details=all slentry=0.05 slstay=0.05;title "粮食模型逐步回归";run;data grain;set grain1 ;Yguji=Y=-30416-1.24359*X1+5.28523*X2+0.61924*X3-0.14305*X4+0.95 538*X5;/*加波浪线的数值是前面估计得来的参数值,需要从前面的回归结果中得到。