第五章练习题参考解答练习题设消费函数为i i i i u X X Y +++=33221βββ式中,i Y 为消费支出;i X 2为个人可支配收入;i X 3为个人的流动资产;i u 为随机误差项,并且222)(,0)(i i i X u Var u E σ==(其中2σ为常数)。
试回答以下问题:(1)选用适当的变换修正异方差,要求写出变换过程;(2)写出修正异方差后的参数估计量的表达式。
根据本章第四节的对数变换,我们知道对变量取对数通常能降低异方差性,但须对这种模型的随机误差项的性质给予足够的关注。
例如,设模型为u X Y 21ββ=,对该模型中的变量取对数后得如下形式u X Y ln ln ln ln 21++=ββ(1)如果u ln 要有零期望值,u 的分布应该是什么 (2)如果1)(=u E ,会不会0)(ln =u E 为什么 (3)如果)(ln u E 不为零,怎样才能使它等于零由表中给出消费Y 与收入X 的数据,试根据所给数据资料完成以下问题: (1)估计回归模型u X Y ++=21ββ中的未知参数1β和2β,并写出样本回归模型的书写格式;(2)试用Goldfeld-Quandt 法和White 法检验模型的异方差性; (3)选用合适的方法修正异方差。
Y X Y X Y X 55 80 152 220 95 140 65 100 144 210 108 145 70 85 175 245 113 150 80110180260110160791201351901251658411514020511518098130178265130185951401912701351909012513723012020075901892501402057410555801402101101607085152220113150759014022512516565100137230108145741051452401151808011017524514022584115189250120200791201802601452409012517826513018598130191270由表中给出1985年我国北方几个省市农业总产值,农用化肥量、农用水利、农业劳动力、每日生产性固定生产原值以及农机动力数据,要求:(1)试建立我国北方地区农业产出线性模型;(2)选用适当的方法检验模型中是否存在异方差;(3)如果存在异方差,采用适当的方法加以修正。
地区农业总产值农业劳动力灌溉面积化肥用量户均固定农机动力(亿元)(万人)(万公顷)(万吨)资产(元)(万马力)北京天津河北1639 .0山西内蒙古辽宁吉林黑龙江山东河南陕西764新疆表中的数据是美国1988研究与开发(R&D)支出费用(Y)与不同部门产品销售量(X)。
试根据资料建立一个回归模型,运用Glejser方法和White方法检验异方差,由此决定异方差的表现形式并选用适当方法加以修正。
单位:百万美元工业群体销售量X R&D费用Y利润Z1.容器与包装2.非银行业金融3.服务行业4.金属与采矿5.住房与建筑6.一般制造业10837.休闲娱乐8.纸张与林木产品9.食品10.卫生保健11.宇航9529412.消费者用品13.电器与电子产品14.化工产品15.五金16.办公设备与电算机17.燃料18.汽车293543由表中给出的收入和住房支出样本数据,建立住房支出模型。
假设模型为i i i u X Y ++=21ββ,其中Y 为住房支出,X 为收入。
试求解下列问题: (1)用OLS 求参数的估计值、标准差、拟合优度(2)用Goldfeld-Quandt 方法检验异方差(假设分组时不去掉任何样本值)(3)如果模型存在异方差,假设异方差的形式是222i i X σσ=,试用加权最小二乘法重新估计1β和2β的估计值、标准差、拟合优度。
表中给出1969年20个国家的股票价格(Y )和消费者价格年百分率变化(X )的一个横截面数据。
国家 股票价格变化率%Y消费者价格变化率%X1.澳大利亚 52.奥地利3.比利时4.加拿大5.智利6.丹麦7.芬兰8.法国9.德国 10.印度 4 11.爱尔兰 4 12.以色列 13.意大利 14.日本 15.墨西哥 16.荷兰 17.新西兰 18.瑞典 8 4 19.英国 20.美国9试根据资料完成以下问题:(1)将Y 对X 回归并分析回归中的残差;(2)因智利的数据出现了异常,去掉智利数据后,重新作回归并再次分析回归中的残差; (3)如果根据第1条的结果你将得到有异方差性的结论,而根据第2条的结论你又得到相反的结论,对此你能得出什么样的结论表中给出的是1998年我国重要制造业销售收入与销售利润的数据资料试完成以下问题:(1)求销售利润岁销售收入的样本回归函数,并对模型进行经济意义检验和统计检验; (2)分别用图形法、Glejser 方法、White 方法检验模型是否存在异方差; (3)如果模型存在异方差,选用适当的方法对异方差性进行修正。
下表所给资料为1978年至2000年四川省农村人均纯收入t X 和人均生活费支出t Y 的数据。
四川省农村人均纯收入和人均生活费支出 单位:元/人时间农村人均纯收入农村人均生活费时间农村人均纯收入农村人均生活费X支出Y X支出Y 19781990197919911980199219811993198219941983199519841996198519971986199819871999198820001989数据来源:《四川统计年鉴》2001年。
(1)求农村人均生活费支出对人均纯收入的样本回归函数,并对模型进行经济意义检验和统计检验;(2)选用适当的方法检验模型中是否存在异方差;(3)如果模型存在异方差,选用适当的方法对异方差性进行修正。
在题中用的是时间序列数据,而且没有剔除物价上涨因素。
试分析如果剔除物价上涨因素,即用实际可支配收入和实际消费支出,异方差的问题是否会有所改善由于缺乏四川省从1978年起的农村居民消费价格定基指数的数据,以1978年—2000年全国商品零售价格定基指数(以1978年为100)代替,数据如下表所示:数据来源:《中国统计年鉴2001》练习题参考解答练习题 参考解答(1)因为22()i i f X X =,所以取221i iW X =,用i W 乘给定模型两端,得312322221i i i i i i iY X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即 22221()()i i i iu Var Var u X X σ== (2)根据加权最小二乘法及第四章里()和()式,可得修正异方差后的参数估计式为***12233ˆˆˆY X X βββ=-- ()()()()()()()***2****22232322322*2*2**2223223ˆii i i i i i i i i i i ii ii i iWy x W x W y x W x x W xWxWx xβ-=-∑∑∑∑∑∑∑()()()()()()()***2****23222222332*2*2**2223223ˆi i i i i i i i i i i i i i i i i i W y x W x W y x W x x Wx W x W x x β-=-∑∑∑∑∑∑∑其中22232***23222,,i ii ii iiiiW X W X W Y XXYWWW===∑∑∑∑∑∑******222333i i i i i x X X x X X y Y Y =-=-=-练习题参考解答(1)该模型样本回归估计式的书写形式为2ˆ9.34750.6371(2.5691)(32.0088)0.9464,..9.0323,1023.56i iY X R s e F =+===(2)首先,用Goldfeld-Quandt 法进行检验。
a.将样本按递增顺序排序,去掉1/4,再分为两个部分的样本,即1222n n ==。
b.分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即2122603.01482495.840e e==∑∑求F 统计量为22212495.844.1390603.0148e F e===∑∑给定0.05α=,查F 分布表,得临界值为0.05(20,20) 2.12F =。
c.比较临界值与F 统计量值,有F =>0.05(20,20) 2.12F =,说明该模型的随机误差项存在异方差。
其次,用White 法进行检验。
具体结果见下表F-statistic ProbabilityTest Equation:Dependent Variable: RESID^2 Method: Least Squares Date: 08/05/05 Time: 12:37 Sample: 1 60C X R-squared Mean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic给定0.05α=,在自由度为2下查卡方分布表,得25.9915χ=。
比较临界值与卡方统计量值,即2210.8640 5.9915nR χ=>=,同样说明模型中的随机误差项存在异方差。
(2)用权数11W X=,作加权最小二乘估计,得如下结果Dependent Variable: Y Method: Least Squares Date: 08/05/05 Time: 13:17 Sample: 1 60Included observations: 60C R-squared Mean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic R-squared Mean dependent var Adjusted R-squared . dependent var . of regression Sum squared resid其估计的书写形式为2ˆ10.37050.6310(3.9436)(34.0467)0.2114,..7.7789,1159.18YX R s e F =+===练习题参考解答(1)建立样本回归模型。