当前位置:文档之家› 应用回归分析论文

应用回归分析论文

贵州民族大学实用回归分析论文(GuizhouMinzu University)论文题目:影响谷物的因素分析年级:2014级班级:应用统计班小组成员:姓名:黄邦秀学号:201410100318 序号:4姓名:王远学号:201410100314 序号:26姓名:陈江倩学号:201410100326 序号:11姓名:吴堂礼学号:时间:2016.12.06目录摘要: (3)关键词: (3)一、问题的提出 (4)二、多元线性回归模型的基假设 (4)三、收集整理统计数据 (5)3.1数据的收集 (5)3.2确定理论回归模型的数学形式 (6)四、模型参数的估计、模型的检验与修改 (6)4.1 SPSS软件运用 (6)4.2 用SPSS软件,得到相关系数矩阵表 (8)4.3 回归方程的显著性检验 (9)4.4利用逐步回归法进行修正 (10)4.5 DW检验法 (11)五、结果分析 (12)六、建议 (12)七、参考文献 (13)影响谷物的因素分析摘要:在实际问题的研究中,经常需要研究某一些现象与影响它的某一最主要因素的关系,如影响谷物产量的因素非常多。

本文采用多元线性回归分析方法,以1994—2014年中国谷物产量及其重要因素的时间序列数据为样本,对影响中国谷物生产的多种因素进行了分析。

分析结果表明,近年来我国谷物生产主要受到单产提高缓慢、播种面积波动大、农业基础设施投入不足、自然灾害频繁等重要因素的影响。

为提高谷物产量、促进谷物生产,首先应该提供一套促进谷物生产的政策措施,提高谷物种植效益,增加谷物收入是根本。

在这个前提下,才有可能提高单产、稳定面积、加强基础设施建设、提高抗灾能力,增强我国谷物生产能力和生产稳定性。

关键词:谷物产量影响因素多元线性回归分析一、问题的提出我国土地资源稀缺,人口多而粮食需求量大,因此粮食产量的稳定增长,直接影响着人民生活和社会的稳定与发展。

粮食生产的不稳定性对国民经济的影响是不可忽略的,主要体现在:粮食生产不稳定会引发粮食供求关系的变动,尤其当国家粮食储备不足的时候,很容易导致粮价上涨,从而影响整个宏观经济。

因此,对关系国计民生的这个特殊农产品,我们不得不慎重对待。

因此,分析粮食产量波动的原因,并据此提出相应的对策,对保障粮食生产持续稳定发展,具有重要意义。

二、多元线性回归模型的基假设(1)解释变量x1,x2,x3,xp 是确定性变量,不是随机变量,且要求rank(k)=p+1<n ,表明设计矩阵X 中的自变量列之间不相关,样本量的个数大于解释变量的个数,X 是一满秩矩阵。

(2)随机误差项具有零均值和等方差,即:()⎪⎩⎪⎨⎧⎩⎨⎧=≠====n j i j i j i n i E j i i .,2,1,,0,),cov(,,2,1,02σεεε 这个假定常称为高斯-马尔柯夫条件。

()0=i E ε,即,假设观测值没有系统误差,随机误差项i ε的平均值为零。

随机误差项i ε的协方差为零,表明随机误差项在不同的样本之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相关的精度。

(3)正态分布的假定条件为:()⎩⎨⎧=相互独立,,,,,n 21i ,,n21i 0~2εεεσε N 对于多元线性回归的矩阵模式εβ+=X y ,这个条件便可表示为:()n 2,0~I N σε由上述假定和多元正态分布的性质可知,随机向量y 服从n 维正态分布,回归模型εβ+=X y 的期望向量()βX E =y ()n 2y var I σ=因此()n 2,~y I X N σβ三、收集整理统计数据3.1数据的收集选用了谷物产量y (万吨)、谷物零售价格指数x1、受灾面积x2(万公顷),化肥施用量x3(万吨),乡村农林牧渔业从业人员数x4(万人),谷物作物播种面积x5(千公顷),农用机械总动力x6(万千瓦),农村用电量x7(亿千瓦),把这7个指标的1994—2014年21年间的时间序列数据进行回归分析,来分析这些因素与谷物产量的关系。

以谷物产量作为因变量,其它7个指标作为解释变量进行回归分析。

表1-1 1994-2014年度谷物产量影响因素表展报告》、《中华人民共和国年鉴》、《中国统计摘要》3.2确定理论回归模型的数学形式通过对中国谷物生产及影响因素的初步定性分析后假设,谷物产量与其它7个指标之间存在多元线性关系,即谷物零售价格指数、受灾面积,化肥施用量,乡村农林牧渔业从业人员数,谷物作物播种面积,农用机械总动力,农村用电量之间存在着线性关系,也即可以把谷物产量的线性回归模型初步设定为:76533217654321x x x x x x x y ββββββββ+++++++=其中,y:谷物产量, x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量,然后利用已有的数据进行模型拟合,以便发现这些因素之间存在的数量关系。

可能有人会提出质疑,是否遗漏了其它重要的解释变量,的确像农业科技费用等这些因素对谷物产量有重要的影响,但考虑农业科技费用会导致严重的多重共线性(因为它们与谷物单产有极高的正相关性),又考虑到它代表对农业的投入和科技进步,在选用指标中已有灌溉面积、农机总动力等性质相似的指标,再加上分析工具的局限性,因此就舍弃了这几个指标。

这也是线性相关分析的局限性之一四、模型参数的估计、模型的检验与修改4.1 SPSS 软件运用将收集到的数据运用SPSS 软件进行运算,可以得到以上模型设定的参数估计值,结果如下表7366.126136.05043.04433.03870.122606.11854.29895.37259ˆx x x x x x x y-++-+--=0.9742=R ,0.9602=R , 2.031=DW ,795.68=F4.2 用SPSS 软件,得到相关系数矩阵表由相关系数矩阵表得如下矩阵: 相关矩阵⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=10.9900.531-0.3720.9660.5730.243-0.7800.99010.516-0.3750.9620.6140.283-0.7870.531-0.516-10.0950.385-0.382-0.135-0.011-0.3720.3750.09510.5230.4830.090.5920.9660.9620.385-0.52310.6610.151-0.8960.5730.6140.382-0.4830.66110.1890.5420.243-0.283-0.135-0.090.151-0.18910.169-0.7800.7870.011-0.5920.8960.5420.169-1R从相关矩阵看出,y 与x1,x2,x3,x4,x5,x6,x7的相关系数169.0r 1-=y 偏小,P 值=0.232;542.0r y 2=偏小,P 值=0.006;0.896r 3=y ,P 值=0.000;0.592r y 4=偏小,P 值=0.002;-0.011r y 5=偏小P 值=0.481;-0.787r y 6=偏小,P 值=0.000;0.780r y 7=偏小,P 值=0.000。

x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量,说明x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量对谷物产量无显著影响。

自变量之间可能存在多重共线性,SPSS 软件同时可以计算出相关系数显著性单侧和双侧检验的P 值。

4.3 回归方程的显著性检验显著影响x1对应的-1.224t =值t ,对应的05.00.243p >=值;x2对应的-2.765t =值t ,对应的05.00.016p <=值;x3对应的 6.354t =值t ,对应的05.00.000p <=值;x4对应的-1.490t =值t ,对应的05.00.160p >=值;x5对应的0.228t =值t ,对应的05.00.823p >=值;x6对应的0.926t =值t ,对应的05.00.371p >=值;x7对应的-3.970t =值t ,对应的05.00.002p <=值,所以x1、x4、x5、x6对y 没有显著影响,只有x2、x3、x7通过系数的显著性检验。

回归系数没有通过显著性检验的,将用逐步回归法重新建立回归方程。

4.4利用逐步回归法进行修正4-5 模型汇总模型R R 方调整R 方标准估计的误差1.896a.803.7932050.323522.966b.934.9271220.785253.974c.949.9401103.98755a. 预测变量: (常量), x3。

b. 预测变量: (常量), x3, x5。

c. 预测变量: (常量), x3, x5, x7。

从表 输出结果看到,逐步回归的最优子集为模型3,回归方程为:7613.35468.03331.7601.62.25ˆx x x y-++-= 由回归方程可以看出,对谷物产量有显著性影响的是x3化肥施用量、x5谷物作物播种面积、x7农村用电量,回归方程中2个自变量的系数为正、1个系数为负,即化肥施用量和谷物作物播种面积越大,每万吨谷物产量越大;农村用电量越大,每万吨谷物产量越小。

具体说,在x5、x7保持不变时,x3每增加一个百分点,每万吨谷物产量平均增加7.331万吨,在x3、x7保持不变时,x5每增加一个百分点,每万吨谷物产量平均增加0.468万吨,在x3、x5保持不变时,x7每增加一个百分点,每万吨谷物产量平均减少3.613万吨。

4.5 DW 检验法由上表4-2可得,DW=1.995,96.1,83.0==U L d d ,04.24=-U d ,17.34=-L d ,U U d DW d -<<4,所以误差项之间不存在自相关。

五、结果分析我们进行了一系列的检验和修正后的结果如下:7613.35468.03331.7601.62.25ˆx x x y-++-= 0.0152=R ,DW=1.995, 5.010=F从模型中可以看出:1、 x1、x2、x4、x6不符合经济意义的检验,因为在实际上,谷物产量是随着x1谷物零售价格指数的增长而增加;谷物产量是随着x2受灾面积增广而减少,谷物产量是随着 x4乡村农林牧渔业从业人员数增加而增加, 谷物产量是随着x6农用机械总动力增加而减少,所以最新的模型的剔除了这4个在原模型的解释变量。

相关主题