异方差问题的检验与修正【实验目的】1、深刻理解异方差性的实质、异方差出现的原因、异方差的出现对模型的不良影响(即异方差的后果),掌握估计和检验异方差性的基本思想和修正异方差的若干方法。
2、能够运用所学的知识处理模型中的出现的异方差问题,并要求初步掌握用Eviews处理异方差的基本操作方法。
【实验原理】1、最小二乘估计。
2、异方差。
3、最小二乘残差图解释异方差。
4、Breusch-Pagan检验(B-P检验)和White检验(怀特检验)检验特定方差函数的异方差性。
5、稳健标准差和加权最小二乘法对特定方差函数的异方差性的修正。
【实验软件】Eviews6.0【实验步骤】一、设定模型首先将实验数据导入软件之中。
(注:本实验报告正文部分只显示软件统计结果,导入数据这一步骤参见附A)本次实验的数据主要是Big Andy店的食品销售收入数据与食品价格数据,共采用了75组。
实验数据来源于课本中的例题,由老师提供。
如下表:表Big Andy店月销售收入和价格的观测值sales price sales price sales price sales price 73.2 5.6975.7 5.5978.1 5.773.7671.8 6.4974.4 6.2288 5.2271.2 6.3762.4 5.6368.7 6.4180.4 5.0584.7 5.3367.4 6.2283.9 4.9679.7 5.7673.6 5.2389.3 5.0286.1 4.8373.2 6.2573.7 5.8870.3 6.4173.7 6.3585.9 5.3478.1 6.2473.2 5.8575.7 6.4783.3 4.9869.7 6.4786.1 5.4178.8 5.6973.6 6.3967.6 5.4681 6.2473.7 5.5679.2 6.2286.5 5.1176.4 6.280.2 6.4188.1 5.187.6 5.0476.6 5.4869.9 5.5464.5 6.4984.2 5.0882.2 6.1469.1 6.4784.1 4.8675.2 5.8682.1 5.3783.8 4.9491.2 5.184.7 4.8968.6 6.4584.3 6.1671.8 5.9873.7 5.6876.5 5.3566 5.9380.6 5.0282.2 5.7380.3 5.2284.3 5.273.1 5.0874.2 5.1170.7 5.8979.5 5.6281 5.2375.4 5.7175 5.2180.2 5.2873.7 6.0281.35.45756.0581.25.83696.33其中,sales 表示在某城市的月销售收入,以千美元为单位;price 表示在该城市的价格,以美元为单位。
假设表1中的月销售收入数据满足假设SR1—SR5。
即,假设Big Andy 店的月销售收入的期望值是产品价格水平的线性函数,误差项额的均值为零,销售收入的方差和误差项e 的方差相同,随机误差项e 在统计上不相关,且选取的价格的值是非随机的。
这样,在上面的基础之上,建立Big Andy 的食品销售收入(sales )与食品价格(price )之间的线性模型方程:eprice sales ++=10ββ根据最小二乘估计的思想估计模型参数,(此过程参见附B )结果如下图:CoefficientStd.Error t-Statistic Prob.C 121.9002 6.52629118.678320.0000PRICE -7.829074 1.142865-6.8503940.0000R-squared0.391301Mean dependent var 77.37467Adjusted R-squared0.382963S.D.dependent var6.488537S.E.of regression 5.096858Akaike info criterion 6.121430Sum squared resid 1896.391Schwarz criterion 6.183230Log likelihood -227.5536Hannan-Quinn criter. 6.146106F-statistic46.92790Durbin-Watson stat 2.224741Prob(F-statistic)0.000000图1注:本报告数据结果均有删减。
根据上图,我们可以看出,0β的估计量0b 的观测值为121.9002,1β的估计量1b 的观测值为-7.829074。
从而模型方程为:()()7.829-121.9)-6.850(1.143)18.678(6.526)()( PRICE SALES t se =(1)0.3912=R 0.3832=R 5.097..=E S 从中可以看出,价格前面的系数不为0,则销售收入对价格是富有弹性的。
在给定05.0=α时,价格的P 值远小于0.05,则拒绝原假设,认为价格对销售收入的影响是显著的。
价格前面的系数为-7.829说明价格和销售收入是呈现负相关关系,其价格每上升一美元,销售收入将会减少782.9美元。
拟合优度2R =0.391,说明这个模型对数据的拟合只是一定程度上的拟合,不是完全拟合。
模型尚待改进。
二、用图形进行异方差检验接下来打破五个假设中的同方差假定,认为数据本身可能具有异方差问题,即随着价格的变化,销售收入的方差会发生改变。
首先我们先做出SALES 与PRICE 的散点图(此过程参见附C ),如图2所示:图2从图2中,我们可以看出随着价格的上升,销售收入确实是呈下降的趋势(<0)。
1但是不能很明显的看出销售收入随着价格的变化,其波动的幅度有所稍微的扩大,可以预见其方差可能是不全等的。
为了进一步用图像显示方差的变化,我们做出残差图(此过程参见附D)(图3)。
从图3可以看出,随着价格的上升,残差(RESID)的绝对值大概可以看出是先增大后减小的趋势,那么这说明随着价格的变化,残差是在变化的,也就是月销售收入的方差是在不断变化的。
这说明这组数据存在异方差。
图3三、对异方差进行检验图形只能从视觉上直观的表示这些数据之间可能存在异方差,接下来我们以假设检验的方法对其是否具有异方差问题进行更进一步的检验。
(一)Breusch-Pagan异方差检验(B-P检验)根据Eviews的运算,(此过程参加附E)得到以下结果:Heteroskedasticity Test:Breusch-Pagan-GodfreyF-statistic0.073505Prob.F(1,73)0.7871Obs*R-squared0.075443Prob.Chi-Square(1)0.7836Scaled explained SS 0.080774Prob.Chi-Square(1)0.7763CoefficientStd.Error t-Statistic Prob.C 38.6003849.312950.7827640.4363PRICE -2.3412528.635537-0.2711180.7871R-squared0.001006Mean dependent var 25.28521Adjusted R-squared -0.012679S.D.dependent var 38.27024S.E.of regression 38.51209Akaike info criterion 10.16613Sum squared resid 108272.2Schwarz criterion 10.22793Log likelihood -379.2297Hannan-Quinn criter.10.19080F-statistic0.073505Durbin-Watson stat2.025976Prob(F-statistic)0.787065图4在本例中,0.0754432=χ,而本次试验中主要只有一个参数,因此卡方检验自由度为一,取5%作为显著性水平,从而查表得()841.31,95.02=χ,远远大于0.0754432=χ,因而不能拒绝原假设,即不能认为数据存在异方差。
从P 值上看,本例得出的P =0.7836>0.05的临界值,也得出不能拒绝原假设的结论。
(二)White 检验(怀特检验)根据Eview 的运算,(此过程参见附F )得到以下结果:Heteroskedasticity Test:White F-statistic1.198109Prob.F(2,72)0.3077Obs*R-squared2.415664Prob.Chi-Square(2)0.2988Scaled explained SS2.586362Prob.Chi-Square(2)0.2744CoefficientStd.Error t-Statistic Prob.C -964.3741660.1007-1.4609500.1484PRICE 352.2809232.9089 1.5125270.1348PRICE^2-31.0901720.40562-1.5236080.1320R-squared0.032209Mean dependent var 25.28521Adjusted R-squared 0.005326S.D.dependent var 38.27024S.E.of regression 38.16819Akaike info criterion 10.16106Sum squared resid 104890.4Schwarz criterion 10.25376Log likelihood -378.0398Hannan-Quinn criter.10.19807F-statistic1.198109Durbin-Watson stat1.983969Prob(F-statistic)0.307708图5在本例中, 2.4156642=χ,而怀特检验中有两个参数出现,所以自由度为二,取5%作为显著性水平,查表得()991.52,95.02=χ>2.415664,从而不能拒绝原假设,即不认为数据存在异方差。
从P 值上看,本例得出的P =0.2988>0.05的临界值,也得出不能拒绝原假设的结论。
四、对异方差进行修正(一)稳健标准差根据Eviews 的运算,(此过程参见附G )得到以下结果:White Heteroskedasticity-Consistent Standard Errors &CovarianceCoefficientStd.Error t-Statistic Prob.C121.9002 5.80474921.000080.0000PRICE-7.829074 1.009840-7.7527830.0000R-squared0.391301Mean dependent var 77.37467Adjusted R-squared 0.382963S.D.dependent var 6.488537S.E.of regression 5.096858Akaike info criterion 6.121430Sum squared resid 1896.391Schwarz criterion 6.183230Log likelihood -227.5536Hannan-Quinn criter. 6.146106F-statistic46.92790Durbin-Watson stat2.224741Prob(F-statistic)0.000000图6()()()()PRICESALES t se 7.753-1.001000.21)805.5()(7.829-121.9=(2)0.3912=R 5.097..=E S 从中可以看出,在给定05.0=α时,价格的P 值远小于0.05,则拒绝原假设,认为价格对销售收入的影响是显著的。