当前位置:文档之家› 多元回归(多重共线,异方差,残差检验eviews,spss)

多元回归(多重共线,异方差,残差检验eviews,spss)

数据处理: 4.3 模型建立设年末实有耕地面积,有效灌溉率,农用塑料薄膜使用量,农药使用量,农业机械总动力,农业从业人数,农业投资额分别为127,,,X X X ;农业产值为Y 。

在此我们假设上述七个变量都与农业产值有显著影响,在SPSS 中用进入法对其做出预判。

表4-3 回归预判表模型 非标准化系数标准化系数T 显著性 共线性统计 B 标准误差 Bata 允差 VIF(常数) 1.987E-15 .018.000 1.000年末实有耕地面积 .225 .291 .225 .775 .464 .004 239.655 有效灌溉率.208 .116 .208 1.797 .115 .02638.086农用塑料薄膜使用量-.396 .489 -.396 -.810 .445 .001 677.462 农药使用量 -.426 .564 -.426 -.756 .475 .001 899.494 农业机械总动力 .831 .282 .831 2.946 .022 .004 225.582 农业从业人数 .024 .179 .024 .136 .895 .011 90.381 农业投资额.197.140.1971.401.204.01855.747因变量: 农业产值可以从表中得出回归方程:12345670.2250.2080.3960.4260.8310.0240.197Y X X X X X X X =+---++从显著性水平上看,小于0.05的只有一个农业机械动力,显然不能够准确的表达出与农业产值之间的关系。

根据表中的VIF 值均大于10,其中四个大于了100,这说明模型中存在严重的多重共线性。

并且在相关系数表中(附表1-2),我们也能够看出各个自变量之间相关系数较大,有较大的相关性。

为了保证得到的回归模型能较好的反映真实意义,就要解决多重共线性问题。

解决多重共线性我们一般使用逐步回归的方法。

4.3.1 逐步回归将标准化后的数据输入EVIEWS ,首先找出与因变量拟合度最高自变量,的经过回归拟合可以得出7个变量的拟合优度,按降序排列如下表:表4-4 拟合优度表变量 拟合优度 5X 0.984325 3X 0.972272 4X 0.972024 1X 0.906987 7X 0.903033 2X 0.84501 6X0.684597拟合优度的大小也能在一定程度上表现出自变量与因变量的影响大小。

这里5X 是农业机械总动力,说明农业机械总动力对农业产值有较大的影响。

在近年来江苏省整体经济发展迅速,科技水平大大提高,使农业的机械化水平发展迅速,机械设备的使用极大促进了农业产值的提高。

由表44-得,Y 与5X 的拟合优度最高,故Y 5X 作为基本方程。

依次按拟合优度降序排列进入模型,检验新进入的变量是否显著并且拟合优度是否提高。

拟合优度排第二的是变量3X ,所以将3X 进入基础模型。

3X 进入基本方程,结果如下图:图4-1 变量判断图从图41-的运行结果我们可以看出,3X 的估计量对应的0.8094p =大于0.05,不显著,所以3X 不符合回归模型。

3X 是农膜使用量,可以看出其对农业产值的影响不显著。

农膜主要使用在经济作物的种植中,近年来有部分农户利用地膜覆盖技术和塑料大棚进行种植、栽培瓜果蔬菜,获得了可观的收益,但是普及率不是很高,是一个对农业产值的影响不是很大。

所以我们不选择变量3X ,再将4X 进入基本方程。

图4-2 第一步逐步回归图由图42-可以看出,4X 的估计量对应的0.8548p =值大于0.05,所以没有显著性,所以4X 同样不符合回归模型,故删去变量4X 。

4X 为农药使用量,所以农药使用量对农业产值没有显著影响。

再将1726,,,X X X X 依次进入方程判断最优拟合方程,1X ,6X 不显著,7X 显著,2X 也是具有显著性的,表明农业投资额,有效灌溉率对农业产值也有显著影响,但是农业投资额对农业产值的影响大还是有效灌溉率对农业产值的影响大,还需要进一步比较。

表4-5 拟合优度表变量 系数标准差t 值p 值 拟合优度1常数-1.57E-07 0.022013 -7.11E-06 1.0000 0.9937700 5X 0.76519 0.057883 13.21969 0.0000 7X0.246876 0.057883 4.26518 0.0011 2常数8.13E-10 0.03293 2.47E-08 1.0000 0.986058 2X 0.999922 0.0818 1.221544 0.2453 5X0.9012980.081811.018320.0000由表45-可得,但由于模型Y 5X 7X 的拟合优度为0.993770,模型Y 2X 5X 的拟合优度为0.986058,比较他们两个的拟合优度,发现模型Y 5X 7X 的拟合优度较大,故选则Y 5X 7X 作为基本方程。

然后按照第一次逐步回归法的步骤依次添加变量,并根据p 值判断其显著性。

可以得出Y5X 7X 2X 为最终方程,p 值分别为20.0107p =,20.0000p =,20.0001p =,均显著。

经过逐步回归依次得到农业机械总动力,农业投资额,有效灌溉率对农业产值的影响较为显著。

估计结果如下图:图4-3 逐步回归模型结果图从图43-中可以得出系数:702571.5910,0.129540,0.263208,0.263208ββββ-=-⨯===,所以写出对应的估计方程为:72571.59100.1295400.6324180.263208Y X X X -=-⨯+++。

得出估计方程还要进行各项检验,只有通过检验才能说明我们得到的方程有效,才具有实际意义。

4.3.2 F 检验F 检验的原假设和备择假设如下:001:0n H βββ====;1:(0,1,,)i H i n β=不全为零。

从图43-中可以看出F 检验(F-statistic)对应的p 值小于0.05,所以拒绝0H ,所以我们得出的估计方程存在显著的线性关系。

4.3.3 t 检验t 检验的原假设和备择假设为:0:0i H β=; 1:0i H β≠。

由图43-可以看出变量2X 5X 7X 分别对应的20.0107p =,20.0000p =,20.0001p =均小于0.05,拒绝原假设0H 。

同样可以看模型得出的t 值,2573.067362,10.20083, 5.887977t t t ===,通过查找t 分布表得,用t 值与0.052(11) 2.201t =进行比较,如果0.052(11)i t t >,则拒绝原假设所以回归系数显著。

变量5X 7X 2X 对Y 有显著影响。

4.3.4 异方差检验由于异方差的存在使得最小二乘估计量不再是最好线性无偏估计量,会导致模型的残差不再是同方差的,所以要对模型进行异方差检验。

(1)图示法此方法是较为原始的一种检验异方差的方法,可以直观的看出残差平方的散点图是否与样本数据i X 或i Y 有明显的关系,若随着i X 或i Y 的变化而变化,那么就说明存在异方差性。

这里我们可以看出残差平方的散点图呈不规则状,散乱分布,所以我们得出的回归模型不存在异方差性。

图4-4 异方差散点图(2)怀特(white )检验可以看出模型中有三个解释变量,那么模型辅助回归可以写成:2220112233415263712813923t t t t t t t t t t t t t t u x x x x x x x x x x x x ααααααααααε=++++++++++其原假设和备择假设分别为:0:0i H α=,1,,9i =;119:,,H αα中至少一个不为零。

怀特检验的运行图如下:图4-5 怀特检验图给定显著性水平0.05,obs*R -squared 对应的0.5587p =大于0.05,(错了要改正))拒绝原假设,故不存在异方差。

4.3.5 自相关检验误差存在自相关时,模型中的系数用最小二乘估计计算会不准确,往往会算出的系数的真实方差值和误差项的方差值会偏小。

为了检验得到的方程的准确性,我们进行自相关检验。

DW 检验的原假设和备择假设分别为:0:0H ρ=(t u 不存在自相关)1:0H ρ≠(t u 存在一阶自相关)表4-6 DW 检验运行结果图从表中得出,DW 值为1.964452,通过查找DW 表可得,当n =15,k =3时,0.82L d =, 1.75U d =,所以DW 值在区间(1.75,2.25)之间。

这说明所建立的线性回归模型无自相关现象,不需要修正DW 值检验。

4.3.6 残差检验图4-7 残差分析图由于JB对应的0.76874p 大于0.05,所以拒绝原假设。

从残差分析图上也可以直观的看出残差直方图中间高,两边低,基本服从正态分布。

所以我们估计的线性回归模型是有意义的。

4.3.7 组内预测对样本内数据进行组内预测:图4-8 组内预测图由图4-8可知,预测值和真实值几乎完全重合,且残差在零水平线上下波动,说明模型总体上效果较好。

相关主题