当前位置:文档之家› 多元线性回归讲解学习

多元线性回归讲解学习

简要回答题:
1. 在多元线性回归分析中,F检验和t检验有何不同?
答案:
在多元线性回归中,由于有多个自变量,F检验与t检验不是等价的。

F检验主要是检验因变量同多个自变量的整体线性关系是否显著,在k个自变量中,只要有一个自变量同因变量的线性关系显著,F检验就显著,但这不一定意味着每个自变量同因变量的关系都显著。

检验则是对每个回归系数分别进行单独的检验,以判断每个自变量对因变量的影响是否显著。

知识点:多元线性回归
难易度:1
2. 在多元线性回归分析中,如果某个回归系数的t检验不显著,是否就意味着这个自变量与因变量之间的线性回归不显著为什么当出现这种情况时应如何处理?
答案:
(1)在多元线性回归分析中,当t检验表明某个回归系数不显著时,也不能断定这个自变量与因变量之间线性关系就不显著。

因为当多个自变量之间彼此显著相关时,就可能造成某个或某些回归系数通不过检验,这种情况称为模型中存在多重共线性。

(2)当模型中存在多重共线性时,应对自变量有所选择。

变量选择的方法主要有向前选择、向后剔除和逐步回归等。

知识点:多元线性回归
难易度:2
计算分析题:
1. 一家餐饮连锁店拥有多家分店。

管理者认为,营业额的多少与各分店的营业面积和服务人员的多少有一定关系,并试图建立一个回归模型,通过营业面积和服务人员的多少来预测营业额。

为此,收集到10家分店的营业额(万元)、营业面积(平方米)和服务人员数(人)的数据。

经回归得到下面的有关结果(a=)。

(2)写出多元线性回归方程。

(3)分析回归方程的拟合优度。

(4)对回归模型的线性关系进行显著性检验。

答案:
(1)自变量是营业面积和销售人员数,因变量是营业额。

(2)多元线性回归方程为:。

(3)判定系数,表明在营业额的总变差中,有%可由营业额与营业面积和服务人员数
之间的线性关系来解释,说明回归方程的拟合程度较高。

估计标准误差,表示用营业面积和服务人员数来预测营业额时,平均的预测误差为万元。

(4)从方差分析表可以看出,,营业额与营业面积和服务人员
数之间的线性模型是显著的。

知识点:多元线性回归
难易度:2
2. 机抽取的15家超市,对它们销售的同类产品集到销售价格、购进价格和销售费用的有关数据(单位:元)。

设销售价格为y、购进价格为、销售费用为,经回归得到下面的有关结果(a=):
df SS MS F Significance F

2
回归
残差12&
总计14
P-value
Coefficients标准误差~
t Stat
Intercept
X Variable 1!
X Variable 2
(2)计算判定系数,并解释其实际意义。

(3)计算估计标准误差,并解释其意义。

(4)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否都有用请说明理由。

答案:
(1)多元线性回归方程为:。

偏回归系数表示:在销售费用不变的条件下,购进价格每增加1元,销售价格平均增加元;偏回归系数表示:在购进价格不变的条件下,销售费用每增加1元,销售价格平均增加元。

(2)判定系数,表明在销售价格总变差中,有%可由销售价格与购进价格和销售费用之间的线性关系来解释,说明回归方程的拟合程度一般。

(3)估计标准误差,表示用购进价格和销售费用来预测
销售价格时,平均的预测误差为元。

(4)都有用。

因为两个回归系数检验的值均小于,都是显著的。

知识点:多元线性回归
难易度:3
3. 经济和管理专业的学生在学习统计学课程之前,通常已经学过概率统计课程。

经验表明,统计学考试成绩的高低与概率统计的考试成绩密切相关,而且与期末复习时间的多少也有很强的关系。

根据随机抽取的15名学生的一个样本,得到统计学考试分数、概率统计的考试分数和期末统计学的复习时间(单位:小时)数据,经回归得到下面的有关结果(a=):
F Significance F
df SS"
MS
回归2A B D
残差12* C
总计14
@
Coefficients标准误差t Stat P-value
Intercept
X Variable 1【
X Variable 2
(2)计算判定系数,并解释其实际意义。

(3)计算估计标准误差,并解释其意义。

答案:
(1)A=;B=÷2=;C=÷12=;D=÷=。

(2)判定系数,表明在统计学考试成绩的总变差中,有%可由统计学考试成绩与概率统计成绩和期末复习时间之间的线性关系来解释,说明回归方程的拟合程度一般。

(3)估计标准误差,表示概率统计成绩和期末复习时间来预测统计学成绩时,平均的预测误差为分。

知识点:多元线性回归
难易度:3
4. 国家统计局定期公布各类价格指数。

为了预测居民消费价格指数,收集到2002年~2006年间的几种主要价格指数,包括商品零售价格指数、工业品出厂价格指数,原材料、燃料、动力购进价格指数,固定资产投资价格指数等,这些指数都是以上年为100而计算百分比数字。

以居民消费价格指数为因变量,自变量分别为商品零售价格指数(),工业品出厂价格指数(),原材料、燃料、动
力购进价格指数(),固定资产投资价格指数()。

经回归得到下面的有关结果(a=):
R Square Adjusted R Square 标准误差
-
Multiple R
MS F Significance F
df^
SS
回归4
残差-
10
总计14
"
Coefficients标准误差t Stat P-value
Intercept
[
X Variable 1
X Variable 2
X Variable 3|
X Variable 4
答案:
(1)判定系数,调整后的判定系数,回归方程的拟合优度非常高。

估计标准误差,其他4个价格指数来预测居民消费价格指数时,预测的误差较小。

(2)从方差分析表可以看出,,表明居民消费价格指数与其他4个价格指数之间的线性关系显著。

(3)但从各回归系数检验的P值看,4个价格指数中,只有商品零售价格指数是显著的,而其余3个均不显著。

但这并不意味着这3个价格指数与居民消费价格指数之间的线性关系就不显著,产生这种情况的原因,可能是由于模型中存在多重共线性造成的。

因此,可考虑使用逐步回归方法进行回归分析。

知识点:多元线性回归
难易度:3
5. 下面是因变量y与两个自变量和进行逐步回归得到的有关结果。

(1)在上述结果中,两个自变量对预测y都有用吗(a=)?
(2)写出含有两个自变量的二元线性回归方程,它的判定系数是多少估计标准误差是多少回归模型的线性关系是否显著?
答案:
(1)都有用。

因为从两个回归系数检验的P值看,均小于显著性水平。

(2)二元线性回归方程为:。

判定系数,标准误差。

从方差分析表可以看出,,该二元线性回归模型的线性关系
是显著的。

知识点:多元线性回归
难易度:2
{
6. 一家产品销售公司在30个地区设有销售分公司。

为研究产品销售量(y)与该公司的销售价格()、
各地区的年人均收入()、广告费用()之间的关系,搜集到30个地区的有关数据。

利用Excel得到下面的回归结果(a=):
方差分析表
变差来源df SS MS F Significance F 回归
\
残差——
总计29.7<
———
参数估计表
Coefficients标准误差t Stat P-value
Intercept
~
X Variable 1
X Variable 2
}
X Variable 3
(1) 将方差分析表中的所缺数值补齐。

(2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。

(3) 检验回归方程的线性关系是否显著?
(4) 计算判定系数,并解释它的实际意义。

(5) 计算估计标准误差,并解释它的实际意义。

答案:
变差来源df SS MS F Significance F
回归3.1
残差26——
总计29.7———。

表示:在年人均收入和广告费用不变的情况下,销售价格每增加一个单位,销售量平均下降个单位;表示:在销售价格和广告费用不变的情况下,年人均收入每增加一个单位,销售量平均增加个单位;表示:在年销售价格和人均收入不变的情况下,广告费用每增加一个单位,销售量平均增加个单位。

(3)由于Significance F=<a=,表明回归方程的线性关系显著。

(4),表明在销售量的总变差中,被估计的多元线性回归方程所解释的比例为%,说明回归方程的拟合程度较高。

(5)。

表明用销售价格、年人均收入和广告费用来预
测销售量时,平均的预测误差为。

相关主题