第五章练习题及参考解答 设消费函数为i i i i u X X Y +++=33221βββ式中,i Y 为消费支出;i X 2为个人可支配收入;i X 3为个人的流动资产;i u 为随机误差项,并且222)(,0)(i i i X u Var u E σ==(其中2σ为常数)。
试回答以下问题:(1)选用适当的变换修正异方差,要求写出变换过程;(2)写出修正异方差后的参数估计量的表达式。
【练习题参考解答】(1)因为22()i i f X X =,所以取221i iW X =,用2i W 乘给定模型两端,得 312322221i i iii i i Y X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即22221()()i i i iu Var Var u X X σ==(2)根据加权最小二乘法,可得修正异方差后的参数估计式为***12233ˆˆˆY X X βββ=--()()()()()()()***2****22232322322*2*2**2223223ˆii i i i i i i i i i i ii ii i iW y x W x W y x W x x W xW xW x xβ-=-∑∑∑∑∑∑∑()()()()()()()***2****23222222332*2*2**2223223ˆii i i i i i i i i i i ii ii i iW y x W x W y x W x x WxWxWx xβ-=-∑∑∑∑∑∑∑其中22232***23222,,i ii ii i iiiW X W XW Y X X Y WWW ===∑∑∑∑∑∑******222333i i i i i x X X x X X y Y Y =-=-=-对于第三章练习题家庭书刊消费与家庭收入及户主受教育年数关系的分析,进一步作以下分析:1)判断模型123i i i i Y X T u βββ=+++是否存在异方差性。
2。
如果模型存在异方差性,应怎样去估计其参数3)对比分析的结果,你对第三章练习题的结论有什么评价 【练习题参考解答】 建议学生自己独立完成表是2007年我国各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据数据来源: 中国统计年鉴2008(1)试根据上述数据建立2007年我国农村居民家庭人均消费支出对人均纯收入的线性回归模型。
(2)选用适当方法检验模型是否在异方差,并说明存在异方差的理由。
(3)如果存在异方差,用适当方法加以修正。
【练习题参考解答】解: (1)建立样本回归函数。
ˆ179.1916+0.7195YX = ()()20.895260, F=247.8769R=(2)利用White 方法检验异方差,则White 检验结果见下表:Heteroskedasticity Test: WhiteF-statistic Prob. F(2,28)Obs*R-squared Prob. Chi-Square(2) Scaled explained SSProb. Chi-Square(2)由上述结果可知,该模型存在异方差。
分析该模型存在异方差的理由是,从数据可以看出,一是截面数据;二是各省市经济发展不平衡,使得一些省市农村居民收入高出其它省市很多,如上海市、北京市、天津市和浙江省等。
而有的省就很低,如甘肃省、贵州省、云南省和陕西省等。
(3)用加权最小二乘法修正异方差,分别选择权数2111,2,3w w w X X X===,经过试算,认为用权数3w 的效果最好。
结果如下:结果为2ˆ787.28470.5615(4.5325)(10.0747)0.7778,101.4992YX R F =+==表的数据是2011年各地区建筑业总产值(X)和建筑业企业利润总额(Y)。
表各地区建筑业总产值(X)和建筑业企业利润总额(Y)(单位:亿元)数据来源:国家统计局网站根据样本资料建立回归模型,分析建筑业企业利润总额与建筑业总产值的关系,并判断模型是否存在异方差,如果有异方差,选用最简单的方法加以修正。
【练习题参考解答】建议学生自己独立完成为研究居民收入与交通通讯消费支出的关系,取得了2005年中国各省市区城镇居民人均年可支配收入(X)与人均年交通通讯消费支出(Y)的数据:表 2005年中国各省市区城镇居民人均可支配收入与交通通讯消费支出(单位:元)江苏西藏浙江陕西安徽甘肃福建青海江西宁夏山东新疆河南问题。
2.用两种以上的方法检验模型是否存在异方差性。
【练习题参考解答】1.回归结果2.检验异方差性1)Goldfeld-Quanadt检验将样本数据X递增排序: “Procs/Sort Series/输入”X”/Ascending/ok,去掉中间7个数据, 分为”1-12”和”20-31”两个样本分别回归样本区间1-12的回归2152031.04ie=∑211070530ie=∑F统计量:222110705302.0666552031.04iieFe===∑∑0.05α=,查F分布表0.05(10,10) 2.98F=0.052.06665(10,10) 2.98F F=<=,表明不存在异方差2)White检验:点Wiew/Residual Tests/white heteroskedasticity(no cross terms)结果为220.051.54193(2) 5.9915nRχ==由于220.051.54193(2) 5.9915nRχ=<=,同时p值为,表明无异方差性表为1978年—2011年四川省农村人均纯收入、人均生活费支出、商品零售价格指数的数据。
时间农村人均纯收入X/元农村人均生活消费支出Y/元商品零售价格指数时间农村人均纯收入X/元农村人均生活消费支出Y/元商品零售价格指数1978 19951979 19961980 19971981 19981982 19991983 20001984 20011985 20021986 20031987 20041988 20051989 20061990 20071991 20081992 20091993 2010资料来源:中经网统计数据库1) 如果不考虑价格变动因素,建立回归模型并检验是否存在异方差,如果存在异方差,选用适当方法进行修正。
2)如果考虑价格变动因素,对异方差性的修正应该怎样进行3)对比以上两个回归模型,你有什么体会【练习题参考解答】 建议学生自己独立完成检验异方差性的基本思想,是检验随机误差项的方差与某解释变量X 的变动是否相关。
统计学中的Spearman 等级相关系数也可以度量变量间的相关性,是否能够利用Spearman 等级相关系数去检验随机误差项的方差(可用残差的绝对值代表)与解释变量X 是否存在异方差性呢如果可以,用Spearman 等级相关系数检验本章案例中是否存在异方差,并将其检验结果与其他检验方法相比较。
【练习题参考解答】Spearman 检验计算公式为216(1)is dr n n =--∑其中,i d 为第i 个现象的两种不同特性样本的等级之差,n 为观测现象的等级个数。
设模型为12i i i Y X u ββ=++,用Spearman 检验检验异方差的步骤如下 1) 做Y 对X 的回归,得到残差e 。
2) 求残差e的绝对值e ,将X 按递升或递降划分等级并与e 对应的等级相减,即得到i d 。
3) 将i d 和n 代入计算s r ,根据相关系数的变动范围,可初步判断是否存在异方差。
4)在0:0H ρ=(ρ为总体等级相关系数)成立下,并且8n >,s r 的显著性可通过如下服从自由度为2n -的t 分布的统计量得到检验,即t =。
给定显著性水平α,查t 分布表,得临界值2(2)t n α-,若2(2)t t n α>-,则拒绝原假设,说明序列存在异方差。
否则接受原假设,说明不存在异方差。
由本章案例回归估计后得到残差序列i e ,取i e 的绝对值i e 并得到其等级数。
同样,将解释变量X 取等级数。
计算对应的i e 的等级数与X 的等级数之差i d ,将其平方得到2i d 。
具体计算结果见下表。
等级相关系数检验2i d 的计算结果将表中计算的2i d 代入公式,计算得0.9815s r =。
根据相关系数的规则,可判断i e 与解释变量X 高度相关,所以,初步认为模型存在异方差。
进一步,将有关数据代入计算得31.4272t =,给定显著性水平0.05α=,查t 分布表得临界值0.025(19) 2.093t =。
比较t值与临界值,显然,0.02531.4272(19) 2.093t t =>=,所以,拒绝原假设,表明该模型确实存在异方差。
检验结果与其他检验方法一致。