课时跟踪检测(十五) 回归分析的基本思想及其初步应用
一、选择题
1.(重庆高考)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )
A.y ^
=0.4x +2.3 B.y ^
=2x -2.4 C.y ^
=-2x +9.5
D.y ^
=-0.3x +4.4
解析:选A 依题意知,相应的回归直线的斜率应为正,排除C ,D.且直线必过点(3,3.5)代入A ,B 得A 正确.
2.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如下表:
甲 乙 丙 丁 R 2
0.98
0.78
0.50
0.85
哪位同学建立的回归模型拟合效果最好?( ) A .甲 B .乙 C .丙
D .丁
解析:选A 相关指数R 2越大,表示回归模型的拟合效果越好.
3.对变量x ,y 进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )
解析:选A 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
4.某产品的广告费用x 与销售额y 的统计数据如下表:
根据上表可得回归方程y ^=b ^x +a ^中的b ^
为9.4,据此模型预报广告费用为6万元时销售额为( )
A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
解析:选B 样本点的中心是(3.5,42), 则a ^=y -b ^
x =42-9.4×3.5=9.1, 所以回归直线方程是y ^
=9.4x +9.1, 把x =6代入得y ^
=65.5.
5.(福建高考)已知x 与y 之间的几组数据如下表:
假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )
A.b ^>b ′,a ^>a ′
B.b ^>b ′,a ^
<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^
<a ′
解析:选C 由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.
而利用线性回归方程的公式与已知表格中的数据,可求得b ^
=
∑i =1
6
x i y i -6x -·y
-
∑i =1
6
x 2i -6x -
2
=
58-6×72×
13
6
91-6×⎝⎛⎭
⎫722
=57,a ^=y --b ^x -=136-57×72=-13
,所以b ^<b ′,a ^
>a ′. 二、填空题
6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1
2x +1上,则这组样本数据
的样本相关系数为________.
解析:根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1. 答案:1
7.若一个样本的总偏差平方和为80,残差平方和为60,则相关指数R 2为________. 解析:回归平方和=总偏差平方和-残差平方和=80-60=20, 故R 2=20
80=0.25⎝⎛⎭⎫或R 2=1-6080=0.25. 答案:0.25
8.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:
x =72,y =71,∑i =16x 2
i =79,∑i =1
6x i y i =1 481.
则销量每增加1 000箱,单位成本下降________元. 解析:由题意知,b ^
=1 481-6×7
2×71
79-6×⎝⎛⎭
⎫722≈-1.818 2,
a ^=71-(-1.818 2)×72≈77.36,y ^
=-1.818 2x +77.36,销量每增加1 000箱,则单位
成本下降1.818 2元.
答案:1.818 2
9.某中高二某班为了对即将上市的班刊进行合理定价,将对班刊按事先拟定的价格进行试销,得到如下数据:
(1)求线性回归方程y =b x +a .
(2)预计今后的销售中,销量与单价服从(1)中的关系,且班刊的成本是4元/件,为了获得最大利润,班刊的单价定为多少元?
解:(1)x =8+8.2+8.4+8.6+8.8+9
6=8.5,
y =90+84+83+80+75+686
=80,
∑i =1
4
x i y i =8×90+8.2×84+8.4×83+8.6×80+8.8×75+9×68=4 066,
∑i =1
4
x 2i =82+8.22+8.42+8.62+8.82+92
=434.2, b ^=
∑i =1
n
(x i -x )(y i -y )
∑i =1
n
(x i -x )2
=4 066-6×8.5×80434.2-6×8.52
=-20,
a ^=y -
b ^
x =80+20×8.5=250, 所求线性回归方程为y ^
=-20x +250.
(2)获得利润z =(x -4)y =-20x 2+330x -1 000, 当x =8.25时,z max =361.25(元),
所以当单价定为8.25元时,可获得最大利润.
10.(全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:
(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^
=
∑i =1
n
(t i -t )(y i -y )
∑i =1
n
(t i -t )2
,a ^
=y
-b ^
t .
解:(1)由所给数据计算得
t =1
7
×(1+2+3+4+5+6+7)=4,
y =1
7
×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
∑
i=1
7
(t i-t)2=9+4+1+0+1+4+9=28,
∑
i=1
7
(t i-t)(y i-y)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
b
^=
∑
i=1
7
(t i-t)(y i-y)
∑
i=1
7
(t i-t)2
=14
28
=0.5,
a
^=y-b^t=4.3-0.5×4=2.3,
所求回归方程为y^=0.5t+2.3.
(2)由(1)知,b
^=0.5>0,
故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入(1)中的回归方程,得y^=0.5×9+2.3=6.8,
故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
11.假设关于某设备使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:
x 2345 6
y 2.2 3.8 5.5 6.57.0
若由资料知,y对x呈线性相关关系,试求:
(1)回归直线方程;
(2)估计使用年限为10年时,维修费用约是多少?
解:(1)由表格中的数据可得
x=
1
5(2+3+4+5+6)=4
y=
1
5(2.2+3.8+5.5+6.5+7.0)=5.
∑i =1
5
x 2i =22+32+42+52+62
=90, ∑i =1
5
x i y i =2×2.2+3×3.8+4×5.5+5×6.5+6×7.0=112.3,所以回归系数
b ^=
∑i =15
x i y i -5x -y
-
∑i =1
5
x 2i -5x
2
=112.3-5×4×590-5×42
=12.310=1.23.
可得a ^=y -b ^
x =5-1.23×4=0.08. 所以回归直线方程为y ^
=1.23x +0.08.
(2)当x =10时,y ^
=1.23×10+0.08=12.38(万元) 即估计用10年时,维修费约为12.38万元.。