当前位置：文档之家› 应用回归分析课后答案

应用回归分析课后答案

应用回归分析课后答案第二章一元线性回归解答：EXCEL结果:SUMMARY OUTPUT回归统计Multiple RR SquareAdjusted R Square标准误差观测值5方差分析df SS MS F Significance F回归分析125残差3总计410Coefficients标准误差t Stat P-value Lower 95%Upper 95%下限%上限% InterceptX Variable 15RESIDUAL OUTPUT观测值预测Y残差12345SPSS结果：（1）散点图为：（2）x 与y 之间大致呈线性关系。

（3）设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为（4）22ni=11()n-2i i y y σ∧∧=-∑2n01i=11(())n-2i y x ββ∧∧=-+∑ =2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦（10-（-1+71））（10-（-1+72））（20-（-1+73））（20-（-1+74））（40-（-1+75）） []1169049363110/3=++++=1330 6.13σ∧=≈ （5）由于211(,)xxN L σββ∧tσ∧==服从自由度为n-2的t分布。

因而/2|(2)1P t nαασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即：1/211/2(p t tααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为（7-2.3537+2.353即为：（，）22001()(,())xxxNn Lββσ-∧+t∧∧==服从自由度为n-2的t分布。

因而/2(2)1P t nαα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1pβσββσα∧∧∧∧-<<+=-可得195%7.77,5.77β∧-的置信度为的置信区间为（）（6）x与y的决定系数22121()490/6000.817()niiniiy yry y∧-=-=-==≈-∑∑（7）线性项加权的1.056偏差.8331.833.326组内2.500总数4由于(1,3)F Fα>,拒绝H,说明回归方程显着，x与y有显着的线性关系。

（8）tσ∧==其中2221111()22n ni i ii ie y yn nσ∧∧====---∑∑3.66==≈/22.353tα=/23.66t tα=>∴接受原假设01:0,Hβ=认为1β显着不为0，因变量y对自变量x的一元线性回归成立。

（9）相关系数()()ni ixyxx yyx x y yLrL L----==∑0.904=≈r小于表中1%α=的相应值同时大于表中5%α=的相应值，∴x与y有显着的线性关系.残差图为：从图上看，残差是围绕e=0随机波动，从而模型的基本假定是满足的。

（11）当广告费0x =万元时，销售收入028.4y =万元，95%置信度为的置信区间 y 2σ∧∧±近似为，即（，）解答：（1）散点图为：（2）x 与y 之间大致呈线性关系。

（3）设回归方程为01y x ββ∧∧∧=+1β∧=1221(2637021717)0.0036(71043005806440)()ni ii nii x y n x yxn x --=-=--==--∑∑01 2.850.00367620.1068y x ββ-∧-=-=-⨯=0.10680.0036y x ∧∴=+可得回归方程为(4) 22ni=11()n-2i i y y σ∧∧=-∑2n01i=11(())n-2i y x ββ∧∧=-+∑ =σ∧=(5) 由于211(,)xxN L σββ∧t σ∧==服从自由度为n-2的t 分布。

因而/2|(2)1P t n αασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即：1/211/2(p t t ααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为0.4801/0.4801/⨯⨯（0.0036-1.8600.0036+1.860即为：（，）22001()(,())xxx Nn L ββσ-∧+t ∧∧==服从自由度为n-2的t 分布。

因而/2(2)1P t n αα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1p βσββσα∧∧∧∧-<<+=- 可得195%0.3567,0.5703β∧-的置信度为的置信区间为（）(6)x 与y 的决定系数 22121()()nii nii y y r y y ∧-=-=-==-∑∑16.8202718.525=(7)ANOVA x平方和df均方F显着性组间（组合）7.168线性项加权的1.027偏差6.315.885组内2总数9由于(1,9)F Fα>,拒绝H,说明回归方程显着，x与y有显着的线性关系。

(8) tσ∧==其中2221111()22n ni i ii ie y yn nσ∧∧====---∑∑8.542==/21.895tα=/28.542t tα=>∴接受原假设01:0,Hβ=认为1β显着不为0，因变量y对自变量x的一元线性回归成立。

(9) 相关系数()()ni ix x y yLr----==∑0.9489=r小于表中1%α=的相应值同时大于表中5%α=的相应值，∴x与y有显着的线性关系.8 325 9 670 3 1012155从图上看，残差是围绕e=0随机波动，从而模型的基本假定是满足的。

(11)001000 3.7x ∧==新保单时，需要加班的时间为y 小时。

（12）00/200y (2)1y t n h αα∧∧±-+的置信概率为1-的置信区间精确为, 即为（，）近似置信区间为：02y σ∧∧±，即（，）（13）可得置信水平为α1-的置信区间为0/200(2)y t n h α∧∧±-，即为（，）.可以用直线回归描述y 与x 之间的关系. (2)回归方程为:12112.629 3.314y x ∧=+(3)从图上可看出，检验误差项服从正态分布。

第三章多元线性回归初始数据：编号y x1x2x3116070351226075403210654024265744235240723862206845727578424816066362927570441025065423解：（1）用SPSS算出y，x1，x2,x3相关系数矩阵：相关性y x1x2x3 Pearson 相关性y.556.731.724x1.556.113.398x2.731.113.547x3.724.398.547y..048.008.009x1.048..378.127x2.008.378..051x3.009.127.051. N y10101010x110101010x210101010x310101010所以r~=系数a模型非标准化系数标准系数t Sig.B 的% 置信区间相关性共线性统计量B标准误差试用版下限上限零阶偏部分容差VIF 1(常量).096(2)所以三元线性回归方程为3447.122101.71754.328.348ˆx x x y+++-=由于决定系数R 方= R=较大所以认为拟合度较高（4）因为F= P=<所以认为回归方程在整体上拟合的好（5）（6）可以看到P 值最大的是x3为，所以x3的回归系数没有通过显着检验，应去除。

由表知通过F 检验继续做回归系数检验此时，我们发现x1，x2的显着性大大提高。

（7）x1:, x2:, x3:,(8)****3277.02535.01385.0ˆx x x y++= (9)残差统计量a极小值极大值均值标准偏差N预测值 10 标准预测值 .00010 预测值的标准误差 10 调整的预测值 10 残差 .00000 10 标准残差 .000.81610 Student 化残差 10 已删除的残差10 Student 化已删除的残差 10 Mahal 。

距离 .894 10 Cook 的距离.000.486.97610所以置信区间为（，）（10）由于x3的回归系数显着性检验未通过，所以居民非商品支出对货运总量影响不大，但是回归方程整体对数据拟合较好解：在固定第二产业增加值，考虑第三产业增加值影响的情况下，第一产业每增加一个单位，GDP就增加个单位。

在固定第一产业增加值，考虑第三产业增加值影响的情况下，第二产业每增加一个单位，GDP就增加个单位。

第四章违背基本假设的情况初始数据：用户序号x y167922923101244935582611567997821899109710207811181812170013747142030151643164141735418127619745204352154022874231543241029257104261434278372817482913813014283112553217773337034231635113036463377703872439808407904178342406431242446584517464646847111448413491787503560511495522221531526由SPSS计算得：yˆ=+残差散点图为：（2）由残差散点图可知存在异方差性再用等级相关系数分析：P= 所以方差与自变量的相关性是显着的。

（3）模型描述因变量y自变量1x权重源x幂值模型描述因变量y自变量1x权重源x幂值模型: MOD_1.M=时可以建立最优权函数，此时得到：所以：yˆ+初始数据：序号x y121303451356789101112132514151617181920172解：yˆ=+d=DW= 查DW分布表知：Ld,故误差项存在正相关。

所以DW<L残差图为：e随t的变化逐次变化并不频繁的改变符号，说明误差项存在正相关。

t（3） ˆ=*DW= 计算得：Y’x’得回归方程'ˆy=+’即：t yˆ=+1-t y +（t x —1-t x ）（4）△t y =+△t x即：t yˆ=+1-t y +（t x -1-t x ）（5）差分法的DW 值最大为消除相关性最彻底，但是迭代法的σˆ值最小为，拟合的较好。

系数a模型非标准化系数标准系数 tSig. B标准误差试用版1(常量).107 x1 .345 .012 x2.911.297.029系数a模型非标准化系数标准系数B标准误差试用版t Sig.1(常量).107 x1.345.012x2.911.297.029 a. 因变量: y回归方程为：yˆ=++DW=<Dl 所以误差项存在正相关残差图为：（2） ˆ=*DW=系数a模型非标准化系数标准系数t Sig.此时得方程：t yˆ’=+1’+2’ 所以回归方程为：)26275.02(434.1)16275.01(77.2116275.0668.179ˆ1?11----+-++-=t t t t t t x x x x y y（3）系数a模型非标准化系数标准系数 t Sig. B标准误差试用版1(常量).194.847 x13 .544 .000 x23.583.274.020a. 因变量: y3此时得方程：△2399.11891.209698.7ˆx x yt ∆+∆+= 所以回归方程为：)22(399.1)(891.209698.7ˆ11---+-+=t t t t t x x x x y第五章自变量选择与逐步回归初始数据：年份农业x1工业x2建筑业x3人口x4最终消费x5受灾面积x6财政收入y19789625950760 19799754239370 19809870544530 198110007239790 198210165433130 198310300834710 198410435731890 198510585144370 198610750747140 198710930042090 198811102650870 198911270446990 199011433338470 199111582355470 199211717151330 199311851748830 199411985055040 199512112145821 199612238946989 199712362653429 199812481050145c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。

e商务文档

应用回归分析课后答案

相关文档推荐：