当前位置:文档之家› 管理统计学习题参考答案第十一章

管理统计学习题参考答案第十一章

十一章1. 解:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。

回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;在线性回归中,按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。

如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多元线性回归分析。

相关分析,相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。

相关分析和回归分析是研究客观现象之间数量联系的重要统计方法。

既可以从描述统计的角度,也可以从推断统计的角度来说明。

所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。

所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。

它们具有共同的研究对象,在具体应用时,相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。

只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。

由于相关分析不能指出变量间相互关系的具体形式,所以回归分析要对具有相关关系的变量之间的数量联系进行测定,从而为估算和预测提供了一个重要的方法。

在有关管理问题的定量分析中,推断统计加具有更加广泛的应用价值。

需要指出的是,相关分析和回归分析只是定量分析的手段。

通过相关与回归分析,虽然可以从数量上反映现象之间的联系形式及其密切程度,但是现象内在联系的判断和因果关系的确定,必须以有关学科的理论为指导,结合专业知识和实际经验进行分析研究,才能正确解决。

因此,在应用时要把定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。

2. 解:进行回归分析通常要设定一定的数学模型。

在回归分析中,最简单的模型是只有一个因变量和一个自变量的线性回归模型。

这一类模型就是一元线性回归模型,又称简单线性回归模型。

该类模型假定因变量Y 主要受自变量X 的影响,它们之间存在着近似的线性函数关系,即有t t u X ββYt ++=21该模型函数式被称为总体回归函数模型。

式中的β1和β2是未知的参数,又叫回归系数。

X t 和Y t 分别是X 和Y 的第t 次观测值。

u t 是随机误差项,又称随机干扰项,它是一个特殊的随机变量,反映未列入方程式的其他各种因素对Y 的影响。

总体回归模型函数事实上是未知的,需要利用样本的信息对其进行估计。

根据样本数据拟合的直线,称为样本回归直线,如果拟合的是一条曲线,则称为样本回归曲线。

显然,样本回归线的函数形式应与总体回归线的函数形式一致。

一元线性回归模型的样本回归线可表示为tt X ββY 21ˆˆˆ+= 式中的t Y ˆ 是样本回归线上与X t 相对应的Y 值,可视为E(Y t )的估计; 1βˆ是样本回归函数的截距系数, 2βˆ是样本回归函数的斜率,它们是对总体回归系数β1和β2的估计。

实际观测到的因变量Y t 值,并不完全等于t Y ˆ ,如果用e t 表示二者之差(e t = Y t -tY ˆ ),则有 ++=tX ββtY 21ˆˆe t t = 1,2,…,n 。

上式称为样本回归函数。

式中e t 称为残差,在概念上,e t 与总体误差项u t 相互对应;n 是样本的容量。

样本回归函数与总体回归函数之间的联系显而易见。

这里需要特别指出的是它们之间的区别:第一,总体回归线是未知的,它只有一条;而样本回归线则是根据样本数据拟合的,有很多条。

第二,总体回归函数中的β1 和β2是未知的参数,表现为常数。

而样本回归函数中的1ˆβ和2ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而不同。

第三,总体回归函数中的误差项u t 是不可直接观测的。

而样本回归函数中的残差项e t 可以计算出具体数值。

综上所述,样本回归函数是对总体回归函数的近似反映。

回归分析的主要任务就是要采用适当的方法,充分利用样本所提供的信息,使得样本回归函数尽可能地接近于真实的总体回归函数。

3. 解:设销售收入X 为自变量,销售成本Y 为因变量。

现已根据某百货公司12个月的有关资料计算出以下数据:(单位:万元)∑(Xˆt -X ) 2 = 425053.73 X =647.88 ∑(Yˆt -Y ) 2 = 262855.25 Y =549.8 ∑(Y i —Y ) 2= 334229.09l xx = 779668 l xy = 452089要求:(1)拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。

y=b 0+b 1xb 0表示销售收入为0时的销售成本 b 1表示每增加一个销售单位,销售成本增加的数量 (2)计算回归估计的标准误差和可决系数。

SST=334229.09 SSR=262855.25 r 2=SSR /SST=0.7865 SSE=SST - SSR=71373.84 MSE=SSE/10=7137.384(3)对回归系数进行显著水平为5%的显著性检验。

b 1= l xy /l xx =0.58 σ可估计为84.7假设H 0:β1=0, H 1:β1≠0 t 检验统计量的观测值为 t =6.04取α=0.05 查t 分布表得t 0.025(10)=2.2281 由于t >t 0.025(10),故拒绝H 0(4)假定明年1月销售收入为800万元,利用拟合的回归方程预测相应的销售成本,并给出置信度为95%的预测区间。

b 0=549.8-0.58×647.88=174.03 y=174.03+0.58x 代入x=800得y=638.03新观测值y 0的预测区间为:)()2(002/0y y s n t y a ))--± 查t 分布表得()2281.210025.0=t22001(800647.88)()18065.2410779668S y y MSE ⎡⎤--=++=⎢⎥⎣⎦)故y 0的预测区间为638.03±2.2281×89.81,即[437.92,838.14]4. 试根据下表的资料,要求:某发展中国家的国内生产总值与最终消费(单位:亿元)年份国内生产总值消费年份国内生产总值消费1996 1997 1998 3605.64073.94551.32239.12619.42976.120062007200814704.016466.018319.59360.110556.511365.21999 2000 2001 2002 2003 2004 2005 4901.45489.26076.37164.48792.010132.811784.03309.13637.94020.54694.55773.06542.07451.2200920102011201220132014201521280.425863.634500.647110.959404.969366.076077.213145.915952.120182.127216.234529.441039.544768.2(1)以消费为因变量,国内生产总值为自变量,拟合线性回归方程。

y=b0+b1x(2)计算回归估计的标准误差和可决系数。

X=271337/20=22483.2 Y=449664/20=13566.85l xx= ∑(X i-X) 2=9927868264SST=∑(Y i-Y) 2=3316717598l xy=5724578433b1= l xy÷l xx=0.577 b0=13566.85-0.577×22483.2=594.04y=0.577x+594.04SSR=3290817119SSE=SST-SSR=25900479r2=SSR/SST=0.992MSE=SSE/18=1438916(3)对回归系数进行显著性水平为5%的显著性检验。

假设H0:β1=0,H1:β1≠0t检验统计量的观测值为t=48.1取α=0.05 查t分布表得t0.025(18)=2.1009由于t > t0.025(18),故拒绝H0(4)假定2016年某发展中国家的国内生产总值为105880亿元,利用拟合的回归方程预测该年可能达到的消费额,并给出置信度为95%的预测区间。

代入x=105880得y=61686.8新观测值y 0的预测区间为:)()2(002/0y y s n t y a ))--± 查t 分布表得t 0.025(18)=2.1009 22001(10588022483.2)()12518103209927868264S y y MSE ⎡⎤--=++=⎢⎥⎣⎦)故y 0的预测区间为61686.8±2.1009×1587,即[58352.67,65020.93]5. 解:研究在线性相关条件下,两个和两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。

多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型相类似,只是在计算上比较麻烦一些而已。

事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。

因此多元线性回归比一元线性回归的实用意义更大。

6. 解:当给模型增加自变量时,复决定系数也随之逐步增大,当自变量足够多时总会得到模型拟合良好,而实际却可能并非如此。

于是考虑对R 2进行调整,记为Ra 2,称调整后复决定系数。

7. 解:(1)Y t 为商业利润率:X 2t 为人均销售额;X 3t 为流通费用率。

β2表示人均销售额每增加一单位,商业利润率增加的数量,符号为负 β3表示流通费用率每增加一单位,商业利润率增加的数量,符号为负 (2)Y t 为粮食销售量;X 2t 为人口数:X 3t 为人均收入。

β2表示人口数每增加一单位,粮食销售量增加的数量,符号为正β3表示人均收入数每增加一单位,粮食销售量增加的数量,符号为正(3)Y t 为工业总产值;X 2t 为占用的固定资产;X 3t 为职工人数。

β2表示占用的固定资产增加一单位,工业总产值增加的数量,符号为正β3表示占用的固定资产增加一单位,工业总产值增加的数量,符号为正(4)Y t 为国内生产总值;X 2t 为工业总产值;X 3t 为农业总产值β2表示工业总产值增加一单位,国内生产总值增加的数量,符号为正 β3表示农业总产值增加一单位,国内生产总值增加的数量,符号为正8. 解:两个因素之间的相关关系叫做单相关,即研究时只涉及一个自变量和一个因变量。

相关主题