当前位置:文档之家› 回归分析练习试题和参考答案解析

回归分析练习试题和参考答案解析

1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

α=)。

(5)检验回归方程线性关系的显著性(0.05(6)如果某地区的人均GDP为5000元,预测其人均消费水平。

(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。

解:(1)可能存在线性关系。

(2)相关系数:系数a模型非标准化系数标准系数t Sig.相关性B标准误差试用版零阶偏部分1(常量).003人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平有很强的线性关系。

(3)回归方程:734.6930.309y x=+系数a模型非标准化系数标准系数t Sig.相关性回归系数的含义:人均GDP没增加1元,人均消费增加元。

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。

系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)人均GDP(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型R R 方调整 R 方标准估计的误差1.998a.996.996a. 预测变量: (常量), 人均GDP。

人均GDP对人均消费的影响达到%。

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。

模型摘要模型R R 方调整的 R 方估计的标准差1.998(a)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(5)F检验:Anova b模型平方和df均方F Sig.1回归.6801.680.000a 残差5总计.7146a. 预测变量: (常量), 人均GDP。

b. 因变量: 人均消费水平回归系数的检验:t检验%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。

系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)人均GDP(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (6)某地区的人均GDP 为5000元,预测其人均消费水平为 734.6930.30950002278.693y =+⨯=(元)。

(7)人均GDP 为5000元时,人均消费水平95%的置信区间为[,],预测区间为[,]。

2 从n =20的样本中得到的有关回归结果是:SSR (回归平方和)=60,SSE (误差平方和)=40。

要检验x 与y 之间的线性关系是否显著,即检验假设:01:0H β=。

(1)线性关系检验的统计量F 值是多少 (2)给定显著性水平0.05α=,F α是多少 (3)是拒绝原假设还是不拒绝原假设(4)假定x 与y 之间是负相关,计算相关系数r 。

(5)检验x 与y 之间的线性关系是否显著解:(1)SSR 的自由度为k=1;SSE 的自由度为n-k-1=18;因此:F=1SSR k SSEn k --=6014018=27(2)()1,18F α=()0.051,18F = (3)拒绝原假设,线性关系显著。

(4)=,由于是负相关,因此r=(5)从F 检验看线性关系显著。

3 随机抽取7家超市,得到其广告费支出和销售额数据如下:求:(1)用广告费支出作自变量x,销售额作因变量y,求出估计的回归方程。

(2)检验广告费支出与销售额之间的线性关系是否显著(0.05α=)。

(3)绘制关于x的残差图,你觉得关于误差项ε的假定被满足了吗(4)你是选用这个模型,还是另寻找一个更好的模型解:(1)系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)广告费支出(万元)(2)回归直线的F检验:ANOVA(b)模型平方和df均方F显著性1回归1.021(a)残差5合计1,6显著。

回归系数的t检验:系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)广告费支出(万元)显著。

(3)未标准化残差图:标准化残差图:学生氏标准化残差图:看到残差不全相等。

(4)应考虑其他模型。

可考虑对数曲线模型:y=b0+b1ln(x)=+(x)。

4 根据下面SPSS输出的回归结果,说明模型中涉及多少个自变量多少个观察值写出回归方程,并根据F,s e,R2及调整的2aR的值对模型进行讨论。

模型汇总b模型R R 方调整 R 方标准估计的误差1Anova b模型平方和df均方F Sig. 1回归3残差11总计45367014系数a模型非标准化系数t Sig. B标准误差1(常量)VAR00002VAR00003VAR00004解:自变量3个,观察值15个。

回归方程:ˆy=+拟合优度:判定系数R2=,调整的2aR=,说明三个自变量对因变量的影响的比例占到63%。

估计的标准误差yxS=,说明随即变动程度为回归方程的检验:F检验的P=,在显著性为5%的情况下,整个回归方程线性关系显著。

β的t检验的P=,在显著性为5%的情况下,y与X1线性关系显著。

回归系数的检验:1β的t检验的P=,在显著性为5%的情况下,y与X2线性关系不显著。

2β的t检验的P=,在显著性为5%的情况下,y与X3线性关系显著。

3因此,可以考虑采用逐步回归去除X2,从新构建线性回归模型。

5 下面是随机抽取的15家大型商场销售的同类产品的有关数据(单位:元)。

求:(1)计算y与x1、y与x2之间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系(2)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否有用α=)。

(3)求回归方程,并检验模型的线性关系是否显著(0.05(4)解释判定系数R2,所得结论与问题(2)中是否一致(5)计算x1与x2之间的相关系数,所得结果意味着什么(6)模型中是否存在多重共线性你对模型有何建议解:(1)y与x1的相关系数=,y与x2之间的相关系数=。

对相关性进行检验:相关性销售价格购进价格销售费用销售价格Pearson 相关性1显著性(双侧)N151515购进价格Pearson 相关性1(**)显著性(双侧)N151515销售费用Pearson 相关性(**)1显著性(双侧)N151515可以看到,两个相关系数的P值都比较的,总体上线性关系也不现状,因此没有明显的线性相关关系。

(2)意义不大。

(3)回归统计Multiple RR SquareAdjusted RSquare标准误差观测值15方差分析df SS MS F Significance F回归分析2残差12总计14Coefficients标准误差t Stat P-value L ower 95%U pper 95%下限 %上限 % (常量)购进价格x10.销售费用x20.从检验结果看,整个方程在5%下,不显著;而回归系数在5%下,均显著,说明回归方程没有多大意义,并且自变量间存在线性相关关系。

(4)从R2看,调整后的R2=%,说明自变量对因变量影响不大,反映情况基本一致。

(5)方程不显著,而回归系数显著,说明可能存在多重共线性。

(6)存在多重共线性,模型不适宜采用线性模型。

6 一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。

下面是近8个月的销售额与广告费用数据:求:(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。

(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。

(3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同对其回归系数分别进行解释。

(4)根据问题(2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少(5)根据问题(2)所建立的估计方程,检验回归系数是否显著(0.05α=)。

解:(1)回归方程为:ˆ88.64+1.6yx = (2)回归方程为:12ˆ83.23 2.29 1.3yx x =++ (3)不相同,(1)中表明电视广告费用增加1万元,月销售额增加万元;(2)中表明,在报纸广告费用不变的情况下,电视广告费用增加1万元,月销售额增加万元。

(4)判定系数R 2= ,调整的2a R = ,比例为%。

(5)回归系数的显著性检验:Coeffici ents标准误差 t Stat P-valu eLower 95%Upper95%下限 % 上限 %Intercept电视广告费用工:x1 (万元)报纸广告费用x2(万元)假设:H 0:1β=0 H 1:1β≠0 t=11S ββ=2.290.304= ()0.0255t =,t >()0.0255t ,认为y 与x 1线性关系显著。

(3)回归系数的显著性检验: 假设:H 0:2β=0 H 1:2β≠0 t=22S ββ=1.30.32= ()0.0255t =,t >()0.0255t ,认为y 与x 2线性关系显著。

7 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下:求:(1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。

(2)解释回归系数的实际意义。

(3)根据你的判断,模型中是否存在多重共线性 解:(1)回归方程为:12ˆ-0.59122.386327.672yx x =++ (2)在温度不变的情况下,降雨量每增加1mm ,收获量增加/hm 2,在降雨量不变的情况下,降雨量每增加1度,收获量增加/hm 2。

(3)1x 与2x 的相关系数12x x r =,存在多重共线性。

相关主题