当前位置:文档之家› 线性回归习题

线性回归习题

线性回归习题
Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】
第9章一元线性回归练习题
一.选择题
1.具有相关关系的两个变量的特点是()
A.一个变量的取值不能由另一个变量唯一确定
B.一个变量的取值由另一个变量唯一确定
C.一个变量的取值增大时另一个变量的取值也一定增大
D.一个变量的取值增大时另一个变量的取值肯定变小
2.下面的各问题中,哪个不是相关分析要解决的问题
A.判断变量之间是否存在关系B.判断一个变量数值的变化对另一个变量的影响
C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系
3.根据下面的散点图,可以判断两个变量之间存在()
A.正线性相关关系
B. 负线性相关关系
C. 非线性关系
D. 函数关系
4.下面的陈述哪一个是错误的()
A. 相关系数是度量两个变量之间线性关系强度的统计量
B.相关系数是一个随机变量
C.相关系数的绝对值不会大于1
D.相关系数不会取负值
5.根据你的判断,下面的相关系数取值哪一个是错误的()
A. B. 0.78 C. D. 0
6.如果相关系数r=0,则表明两个变量之间()
A.相关程度很低
B. 不存在任何关系
C .不存在线性相关关系 D.存在非线性关系 7.
下列不属于相关关系的现象是( )
A.银行的年利息率与贷款总额
B.居民收入与储蓄存款
C.电视机的产量与鸡蛋产量
D.某种商品的销售额与销售价格
8.设产品产量与产品单位成本之间的线性相关系数为,这说明二者之间存在着( )
A. 高度相关
B.中度相关
C.低度相关
D.极弱相关 9.在回归分析中,被预测或被解释的变量称为( ) A.自变量 B.因变量 C.随机变量 D.非随机变量
10. 对两变量的散点图拟合最好的回归线,必须满足一个基本的条件是( )
A. 2ˆ()y y ∑-最小
B. 2)(ˆy y ∑-最大
C.2ˆ()y y ∑-最大
D.
2)(ˆy y ∑-最小 11. 下列哪个不属于一元回归中的基本假定( )
A.误差项i ε服从正态分布
B. 对于所有的X ,方差都相同
C. 误差项i ε相互独立
D. 0)ˆ=-i i y
y E ( 12.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误( )
A.x y
75.025ˆ-= B. x y 86.0120ˆ+-= C. x y 5.2200ˆ-= D. x y 74.034ˆ--= 13.对不同年份的产品成本拟合的直线方程为,75.1280ˆx y
-=y 表示产品成本,x 表示不同年份,则可知( )
A.时间每增加一个单位,产品成本平均增加个单位
B. 时间每增加一个单位,产品成本平均下降个单位
C.产品成本每变动一个单位,平均需要年时间
D. 产品成本每减少一个单位,平均需要年时间
14.在回归分析中,F 检验主要是用来检验( )
A .相关关系的显着性 B.回归系数的显着性 C. 线性关系的显着性D.估计标准误差的显着性
15.说明回归方程拟合优度的统计量是( )
A. 相关系数
B.回归系数
C. 判定系数
D. 估计标准误差
16.已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R 2=( ) %
17. 判定系数R2值越大,则回归方程( ) A 拟合程度越低 B 拟合程度越高
C 拟合程度有可能高,也有可能低
D 用回归方程进行预测越不准确 18. 居民收入与储蓄额之间的相关系数可能是( ) A B 0.9247 C D
19.在对一元回归方程进行显着性检验时,得到判定系数R 2=,关于该系数的说法正确的是( )
A. 该系数越大,则方程的预测效果越好
B. 该系数越大,则由回归方程所解释的因变量的变差越多
C. 该系数越大,则自变量的回归对因变量的相关关系越显着
D. 该回归方程中自变量与因变量之间的相关系数可能小于 20.下列方程中肯定错误的是( )
A. x y
48.015ˆ-=,r= B. x y 35.115ˆ--=, r= - C. x y
85.025ˆ+-=, r= D. x y 56.3120ˆ-=, r= - 21. 若两个变量存在负相关关系,则建立的一元线性回归方程的判定系数R 2的取值范围是( )
A.【0,1】
B. 【-1,0】
C. 【-1,1】
D.小于0的任意数 二. 填空题
1.
当从某一总体中抽取了一样本容量为30的样本,并计算出某两个变量的相关系数为时,我们是否可认为这两个变量存在着强相关性(不能 ) ,理由是(因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显着尚需检
验 )。

若不能判断,则我们需要进行( t 检验 )检验,构造的检验统计量为( ),它服从( )分布。

在水平下,该相关关系是否显着( )。

2.如下两图中,图(图1 )的相关系数会大一些。

我们能否用相关系数判断哪个图中数据间的相关性会强一些( 不能 ),理由是(因为图1反映的是线性相关关
系,图2反映的是非线性性相关关系,相关系数只能反映线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。


三. 计算题
1. 从n=20的样本中得到的有关回归结果如下:SSR=80,SSE=60。

现要检验x 与y 之间的
线性关系是否显着。

(1)SSR 的自由度是多少SSE 的自由度是多少
.(1
) SSR 的自由度是1,SSE 的自由度是18。

(2)线性关系检验的统计量F 值是多少
(3)判定系数为多少其含义是什么
在y 的总变差中,由%的变差是由于x 的变动说引起的。

(4)假定x 与y 之间是负相关,计算相关系数。


(5)给定显着性水平05.0=α,临界值αF 为,检验x 与y 之间的线性关系是否显着。

因为414
.424=>=αF F
,所以拒绝原假设,x 与y 之间的线性关系显着。

2.从某一行业中随机抽区17家企业,为了解所得产量和生产费用的关系,现对有关数据进行了回归分析,其中所得产量为x (台),生产费用为y (万元),得到如下分析结果:
方差分析表
df SS MS
F Significance
F 回归分析
残差 75
- - 总计 16
500
- -

参数估计表
Coefficients 标准误差 t Stat P-value Intercept X Variable
1
(1) 完成上面的方差分析表。

(1)
(2) 在生产费用的总方差中,有多少可以由产量来解释
表明在维护费用的变差中,有85%的变差可由使用年限来解释。

(3) 生产费用与产量的相关系数是多少(保留四位小数)
(4) 写出估计的回归方程并解释回归系数的实际意义。

回归系数为,表示每增加一个单位的产量,该行业的生产费用将平均增长个单位。

(5) 检验方程线性的显着性(05.0=α)。

线性关系显着性检验:
因为Significance F=<05.0=α,所以线性关系显着。

(6) 当使用年限为20时,预测生产费用是多少 当产量为10时,生产费用为万元。

上表是含有三个自变量的多元线性回归模型的Excel 部分输出结果: (1) 这些数据对应的回归方程是什么 (2) 因变量变差中有多少能被模型解释
因变量总体变差中有%可以用模型中的四个自变量解释 (3) 模型整体在统计上显着吗(显着性水平为)说明理由。

因为=<a=,因此模型整体在统计上显着。

(4)模型中所有的自变量都是显着的吗(显着性水平为)如果不是,哪些
不显着从哪里可以看出来
不是所有自变量都显着。

其中,x2和x3变量不显着。

因为x1对应的P值=<,拒绝原假设,即x1显着。

x2对应的P值=>,不拒绝原假设,即x2不显着
x3对应的P值=>,不拒绝原假设,即x3不显着
(5)在其他变量保持不变的情况下,自变量x1每变化一个单位,对应的因变量会
发生多大变化
在其他变量保持不变的情况下,当自变量x1每变化一个单位时,对应的因变量会平均增加个单位,对应的变化区间为(,)
(6)多重共线性什么含义,衡量多重共线性的方法是什么
可以利用相关系数矩阵进行简单判断,在此基础上,通过方差膨胀因子VIF来检验。

多重共线性越严重,VIF值越大。

如果VIF>5时,认为自变量间的相关性高,存在多重共线性问题。

相关主题