当前位置:文档之家› 应用回归分析课后答案

应用回归分析课后答案

应用回归分析课后答案第二章一元线性回归解答:EXCEL结果:SUMMARY OUTPUT回归统计Multiple RR SquareAdjusted R Square标准误差观测值5方差分析df SS MS F Significance F回归分析125残差3总计410Coefficients标准误差t Stat P-value Lower 95%Upper 95%下限%上限% InterceptX Variable 15RESIDUAL OUTPUT观测值预测Y残差12345SPSS结果:(1)散点图为:(2)x 与y 之间大致呈线性关系。

(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑2n01i=11(())n-2i y x ββ∧∧=-+∑ =2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1169049363110/3=++++=1330 6.13σ∧=≈ (5)由于211(,)xxN L σββ∧tσ∧==服从自由度为n-2的t分布。

因而/2|(2)1P t nαασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(p t tααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为(7-2.3537+2.353即为:(,)22001()(,())xxxNn Lββσ-∧+t∧∧==服从自由度为n-2的t分布。

因而/2(2)1P t nαα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1pβσββσα∧∧∧∧-<<+=-可得195%7.77,5.77β∧-的置信度为的置信区间为()(6)x与y的决定系数22121()490/6000.817()niiniiy yry y∧-=-=-==≈-∑∑(7)线性项加权的1.056偏差.8331.833.326组内2.500总数4由于(1,3)F Fα>,拒绝H,说明回归方程显着,x与y有显着的线性关系。

(8)tσ∧==其中2221111()22n ni i ii ie y yn nσ∧∧====---∑∑3.66==≈/22.353tα=/23.66t tα=>∴接受原假设01:0,Hβ=认为1β显着不为0,因变量y对自变量x的一元线性回归成立。

(9)相关系数()()ni ixyxx yyx x y yLrL L----==∑0.904=≈r小于表中1%α=的相应值同时大于表中5%α=的相应值,∴x与y有显着的线性关系.残差图为:从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。

(11)当广告费0x =万元时,销售收入028.4y =万元,95%置信度为的置信区间 y 2σ∧∧±近似为,即(,) 解答:(1) 散点图为:(2)x 与y 之间大致呈线性关系。

(3)设回归方程为01y x ββ∧∧∧=+1β∧=1221(2637021717)0.0036(71043005806440)()ni ii nii x y n x yxn x --=-=--==--∑∑01 2.850.00367620.1068y x ββ-∧-=-=-⨯=0.10680.0036y x ∧∴=+可得回归方程为(4) 22ni=11()n-2i i y y σ∧∧=-∑2n01i=11(())n-2i y x ββ∧∧=-+∑ =σ∧=(5) 由于211(,)xxN L σββ∧t σ∧==服从自由度为n-2的t 分布。

因而/2|(2)1P t n αασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(p t t ααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为0.4801/0.4801/⨯⨯(0.0036-1.8600.0036+1.860即为:(,)22001()(,())xxx Nn L ββσ-∧+t ∧∧==服从自由度为n-2的t 分布。

因而/2(2)1P t n αα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1p βσββσα∧∧∧∧-<<+=- 可得195%0.3567,0.5703β∧-的置信度为的置信区间为()(6)x 与y 的决定系数 22121()()nii nii y y r y y ∧-=-=-==-∑∑16.8202718.525=(7)ANOVA x平方和df均方F显着性组间(组合)7.168线性项加权的1.027偏差6.315.885组内2总数9由于(1,9)F Fα>,拒绝H,说明回归方程显着,x与y有显着的线性关系。

(8) tσ∧==其中2221111()22n ni i ii ie y yn nσ∧∧====---∑∑8.542==/21.895tα=/28.542t tα=>∴接受原假设01:0,Hβ=认为1β显着不为0,因变量y对自变量x的一元线性回归成立。

(9) 相关系数()()ni ix x y yLr----==∑0.9489=r小于表中1%α=的相应值同时大于表中5%α=的相应值,∴x与y有显着的线性关系.8 325 9 670 3 1012155从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。

(11)001000 3.7x ∧==新保单时,需要加班的时间为y 小时。

(12)00/200y (2)1y t n h αα∧∧±-+的置信概率为1-的置信区间精确为, 即为(,)近似置信区间为:02y σ∧∧±,即(,)(13)可得置信水平为α1-的置信区间为0/200(2)y t n h α∧∧±-,即为(,).可以用直线回归描述y 与x 之间的关系. (2)回归方程为:12112.629 3.314y x ∧=+(3)从图上可看出,检验误差项服从正态分布。

第三章多元线性回归初始数据:编号y x1x2x3116070351226075403210654024265744235240723862206845727578424816066362927570441025065423解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵:相关性y x1x2x3 Pearson 相关性y.556.731.724x1.556.113.398x2.731.113.547x3.724.398.547y..048.008.009x1.048..378.127x2.008.378..051x3.009.127.051. N y10101010x110101010x210101010x310101010所以r~=系数a模型非标准化系数标准系数t Sig.B 的% 置信区间相关性共线性统计量B标准误差试用版下限上限零阶偏部分容差VIF 1(常量).096(2)所以三元线性回归方程为3447.122101.71754.328.348ˆx x x y+++-=由于决定系数R 方= R=较大所以认为拟合度较高(4)因为F= P=<所以认为回归方程在整体上拟合的好(5)(6)可以看到P 值最大的是x3为,所以x3的回归系数没有通过显着检验,应去除。

由表知通过F 检验 继续做回归系数检验此时,我们发现x1,x2的显着性大大提高。

(7)x1:, x2:, x3:,(8)****3277.02535.01385.0ˆx x x y++= (9)残差统计量a极小值极大值均值标准 偏差N预测值 10 标准 预测值 .00010 预测值的标准误差 10 调整的预测值 10 残差 .00000 10 标准 残差 .000.81610 Student 化 残差 10 已删除的残差10 Student 化 已删除的残差 10 Mahal 。

距离 .894 10 Cook 的距离.000.486.97610所以置信区间为(,)(10)由于x3的回归系数显着性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产业每增加一个单位,GDP就增加个单位。

在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP就增加个单位。

第四章违背基本假设的情况初始数据:用户序号x y167922923101244935582611567997821899109710207811181812170013747142030151643164141735418127619745204352154022874231543241029257104261434278372817482913813014283112553217773337034231635113036463377703872439808407904178342406431242446584517464646847111448413491787503560511495522221531526由SPSS计算得:yˆ=+残差散点图为:(2)由残差散点图可知存在异方差性再用等级相关系数分析:P= 所以方差与自变量的相关性是显着的。

(3)模型描述因变量y自变量1x权重源x幂值模型描述因变量y自变量1x权重源x幂值模型: MOD_1.M=时可以建立最优权函数,此时得到:所以:yˆ+初始数据:序号x y121303451356789101112132514151617181920172解:yˆ=+d=DW= 查DW分布表知:Ld,故误差项存在正相关。

所以DW<L残差图为:e随t的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。

t(3) ˆ=*DW= 计算得:Y’x’得回归方程'ˆy=+’即:t yˆ=+1-t y +(t x —1-t x ) (4)△t y =+△t x即:t yˆ=+1-t y +(t x -1-t x ) (5)差分法的DW 值最大为消除相关性最彻底,但是迭代法的σˆ值最小为,拟合的较好。

系数a模型非标准化系数 标准系数 tSig. B标准 误差试用版1(常量).107 x1 .345 .012 x2.911.297.029系数a模型非标准化系数标准系数B标准误差试用版t Sig.1(常量).107 x1.345.012x2.911.297.029 a. 因变量: y回归方程为:yˆ=++DW=<Dl 所以误差项存在正相关残差图为:(2) ˆ=*DW=系数a模型非标准化系数标准系数t Sig.此时得方程:t yˆ’=+1’+2’ 所以回归方程为:)26275.02(434.1)16275.01(77.2116275.0668.179ˆ1?11----+-++-=t t t t t t x x x x y y(3)系数a模型非标准化系数 标准系数 t Sig. B标准 误差试用版1(常量).194.847 x13 .544 .000 x23.583.274.020a. 因变量: y3此时得方程:△2399.11891.209698.7ˆx x yt ∆+∆+= 所以回归方程为:)22(399.1)(891.209698.7ˆ11---+-+=t t t t t x x x x y第五章 自变量选择与逐步回归初始数据:年份农业x1工业x2建筑业x3人口x4最终消费x5受灾面积x6财政收入y19789625950760 19799754239370 19809870544530 198110007239790 198210165433130 198310300834710 198410435731890 198510585144370 198610750747140 198710930042090 198811102650870 198911270446990 199011433338470 199111582355470 199211717151330 199311851748830 199411985055040 199512112145821 199612238946989 199712362653429 199812481050145c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。

相关主题