统计预测与决策作业 Prepared on 22 November 2020
多元线性回归分析在粮食产量预测中的应用
摘要:本文主要是以粮食产量及其影响因素为变量建立多元线性回归分析模型,并通过SPSS软件对数据进行处理,来预测粮食产量。
关键词:多元回归分析粮食产量预测 SPSS
1.研究问题阐述及理论依据
中国是一个人口大国,粮食关系着国计民生和国家战略安全。
为了养活14亿中国人,我国必须保证粮食产量的稳定高产。
回归分析是统计学的一个重要分支,它基于观测数据建立变量之间的某种依赖关系,分析数据的内在规律,并可用于预测等方面。
粮食产量的回归分析是在获得大量粮食产量、粮食播种面积、自然灾害对农田的影响面积以及机械化农耕的数据的基础上,利用多元统计的方法建立自变量和因变量之间的回归关系,并对所建立的模型进行检验,以通过回归模型进行预测,对粮食安全形势的预警有着至关重要的作用。
2.指标选取、数据来源及处理
(一)指标的选择
根据理论和经验分析,影响粮食产量的因素有农业机械总动力、机耕面积、粮食播种面积、成灾面积、农业化肥施用量、气温、降水量、日照等,但是后面几个因素的数据统计的误差较大且不容易找到,所以本文只考虑前面几个因素;对于机耕面积,众所
周知它在减少,但是我国的粮食产量却在增加,主要是由于耕种技术的进步,因此本文将其以常量来对待,不予考虑。
所以,本文选取的指标有粮食总播种面积(x1),成灾面积(x2),农业机械总动力(x3)。
(二)数据来源
因此,本文收集了我国自1991年至2012年粮食产量、粮食总播种面积、成灾面积和农业机械总动力的相关数据。
数据资料均来源于《2013年中国统计年鉴》。
以下为搜集到的数据:
表1-1 1991-2012主要农业数据
资料来源:2013年中国统计年鉴
3.模型设计
多元线性回归分析是研究一个因变量与多个自变量之间相关关系的最基本方法。
设y是一个可观测的随机变量,它受到n个随机因素的影响,其多元回归预测模型为
ŷ=b0+b1x1+b2x2+…+b n x n
式中:b1,b2,…,b n是待定参数;b0是随机变量,它表示除x以外其他随机因素对y影响的总和。
根据上面所选定的指标可以建立我国粮食产量的函数,即
ŷ=b0+b1x1+b2x2+ b3x3
其中,ŷ代表全国粮食产量的预测值,x1代表粮食总播种面积,x2代表成灾面积,x3代表农业机械总动力。
4.模型估计和检验
(一)结果输出
将数据导入到中,输出的结果如下:
表1-2 描述性统计量
均值标准偏
差N
粮食产量(万吨)22 粮食总播种面积
(千公顷)
22
成灾面积(千公
顷)
22
农用机械总动力
(万千瓦)
22
表1-3 相关性
粮食产量(万吨)粮食总播
种面积
(千公
顷)
成灾面积
(千公
顷)
Pearson 相关性粮食产量(万吨).327 粮食总播种面积
(千公顷)
.327
成灾面积(千公
顷)
农用机械总动力
(万千瓦)
.782
Sig. (单侧)粮食产量(万吨). .069 .000 粮食总播种面积
(千公顷)
.069 . .322
成灾面积(千公
顷)
.000 .322 .
农用机械总动力
(万千瓦)
.000 .110 .001
N 粮食产量(万吨)22 22 22 粮食总播种面积
(千公顷)
22 22 22
成灾面积(千公
顷)
22 22 22
农用机械总动力
(万千瓦)
22 22 22
表1-4 输入/移去的变量b
模型输入的变
量
移去的
变量方法
由于R方为,接近于1,因此该模型的拟合优度较高。
表1-7 Anova b
模型平方和df 均方 F Sig.
1 回归 3 .000a
残差18
总计21
a. 预测变量: (常量), 农用机械总动力(万千瓦), 粮食总播种面积(千公顷), 成灾面积
(千公顷)。
b. 因变量: 粮食产量(万吨)
从上述的分析表中可以看出F的统计值为,取α=,F>Fα
(1,20),通过了F检验,这说明y关于x1、x2、x3的线性回归方程通过了显着检验,即说明三个自变量联合起来对因变量有显着影响。
表1-8 系数a
模型非标准化系数
B 标准误差
1 (常量)
粮食总播种面积(千公顷).590 .069
成灾面积(千公顷).054
农用机械总动力(万千瓦) .155 .015
此表给出了回归系数的t统计量检验结果,我们可以看出非标准化的回归方程为ŷ = - + x1 - x2 + x3
表1-9 系数a
模型标准系数
t Sig.
B 的 % 置信区间试用版下限上限
1 (常量) .024
粮食总播种面积(千公
顷)
.529 .000 .446 .734 成灾面积(千公顷).025
农用机械总动力(万千瓦) .814 .000 .124 .186
表1-10 系数a
模型
相关性共线性统计量零阶偏部分容差VIF
1 (常量)
粮食总播种面积(千公
顷)
.327 .897 .476 .808 成灾面积(千公顷).545 农用机械总动力(万千瓦) .782 .927 .581 .510 a. 因变量: 粮食产量(万吨)
表1-11 共线性诊断a
模型维数特征值条件索引
方差比例
(常量)
粮食总播种面
积(千公顷)
成灾面积(千
公顷)
农用机械总动
力(万千瓦)
1 1 .00 .00 .00 .00
2 .150 .00 .00 .07 .27
3 .018 .01 .02 .71 .45
4 .000 .99 .98 .22 .27
a. 因变量: 粮食产量(万吨)
由上表可看出共线性的值均小于,故该模型没有多重共线性的问题。
表1-12 残差统计量a
极小值极大值均值标准偏差N
预测值22
残差.0000 22
标准预测值.000 22
标准残差.000 .926 22
3-13 直方图
3-14 回归标准化残差的标准P-P图
此回归标准化残差的标准P-P图表明回归函数为线性形式,拟合效果不错,因此回归方程:
ŷ = - + x1 - x2 + x3是一个有效的方程。
(二)对往年粮食产量进行预测检验
以1991至2012年度粮食耕种面积、自然灾害成灾面积和农用机械总动力为自变量,带人求出的回归方程,计算粮食产量,并计算残差值,绘制出表3-15。
表3-15 实际粮食产量与预计粮食产量对比
从表中我们可以看出预计粮食产量的拟合程度比较好,相应的残差都在~+之间,说明回归模型建立是比较可靠的。
5.结论
本文通过运用软件对中国1991至2012年度的粮食产量、粮食总播种面积、自然灾害成灾面积和农用机械总动力的相关数据进行了线性回归分析,并建立了回归方程,在经过了显着性检验证明回归方程建立的拟合性比较高,而且显着性也较高,然后运用回归方程进行的粮食产量预测也与实际值比较符合。
因此说明在软件中运用回归分析的方法对粮食产量数据进行处理分析和预测是可行的。
在实际的农业生产活动中我们可以利用这一模型对粮食产量进行预测,从而为农用地整治规划和农用机械的采购提供依据,并减小粮食危机发生的可能性。
6.参考文献
[1]2013年中国统计年鉴
[2]徐国祥.《统计预测和决策》:上海财经大学出版社,。