当前位置:文档之家› 《回归分析》课件

《回归分析》课件


8分 9分 10 分 12 分
课内巩固
1.下列属于相关关系的是( ) A.利息和利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 解析: 相关关系指的是自变量一定时,因变量的取值带有 一定的随机性的两个变量间的关系,既不是确定的函数关系 ,也不是没有关系.这里选项A、D是确定的函数关系;C 中两个变量没有关系. 答案: B
根据散点图可知 y 与 x 近似地呈反比例函数关系,设 y=kx,
令 t=1x,则 y=kt,原数据变为:
t
4
2
1
0.5
0.25
y
16
12
5
2
1
4分
例题精讲
6分
例题精讲
由散点图可以看出 y 与 t 呈近似的线性相关关系.列表如
下:
i
ti
yi
tiyi
t2i
y2i
1
4
16
64
16
256
2
2
12
24
4
系. (2)计算,代入公式求出 y=bx+a 中参数 b,a 的值.
(3)写出回归方程并对实际问题作出估计.
课内巩固
编号
1
2
3
4
5
股骨长度x/cm 38 56 59 64 74
肱骨长度y/cm 41 63 70 72 84
求根据股骨估计肱骨的回归方程;并预测股骨的长度为50cm,则 它的肱骨长为多少?
新课探究
可线性化的回归分析:
1.在实际问题中,有时两个变量之间的关系并不是线性 关系,这就需要根据散点图选择适当的函数模型来拟合观测数 据,然后通过适当的变量代换,把非线性问题转化为线性问 题,从而确定未知参数,建立相应的线性回归方程.
新课探究
2.常见的非线性回归模型转化为线性回归模型如下: (1)幂函数曲线y=axb 作变换u=lny,v=lnx,c=lna,得线性函数u=c+bv. (2)指数曲线 y=aebx 作变换 u=lny,c=lna,得线性函数 u=c+bx. (3)对数曲线 y=a+blnx 作变换 u=y,v=lnx,得线性函数 u=a+bv.
b=

,a= y -b x
n
xi- x 2
n
x2i -n x 2
i=1
i=1
①必过样本中心
②线性回归方程求出来的是预测值(估计值)
例题精讲
例 1 弹簧长度 y(cm)随所挂物体的重量 x(g)不同而变化的 情况如下:
x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.96 11.80 (1)画出散点图; (2)求 y 对 x 的回归直线方程; (3)预测所挂物体重量为 27 g 时的弹簧长度(精确到 0.01 cm).
144
3
1
5
5
1
25
4 0.5 2
1
0.25
4
5 0.25 1
0.25
0.62 5
1
∑ 7.75 36 94.25 21.312 5
430
例题精讲
所以 t =1.55, y =7.2.
5
tiyi-5 t y
i=1
所以 b=
t5
2 i
-5
t
2
=4.134 4.
i=1
a= y -b t =0.8, 所以 y=4.134 4t+0.8. 所以 y 对 x 的回归方程是 y=4.13x4 4+0.8.
i=1
i=1

25 054-5×73.2×67.8 27 174-5×73.2223 167-5×67.82
=0.904 3
由于 r 的值接近于 1,故可判断两变量 x 与 y 具有线性相关
关系.
例题精讲
(2)由(1)知,求回归直线方程是有意义的. 回归系数:
5
xiyi-n x y
i=1
b=
5
x2i -5 x 2
知识回顾
2.散点图与曲线拟合
曲线拟合:若变量之间存在某种关系,散点图 有一个大致的趋势,这种趋势通常可以用一条 光滑的曲线来近似,这过程称“曲线拟合”
知识回顾
3.最小二乘法的原理
知识回顾
3.最小二乘法的原理 问题:怎么定义“与所有点都近”?
y
·(xi, yi) y=a+bx
答:设直线 y=a+bx, 任意给定的一个样本点(xi,yi).
()
A.a与r符号相同 C.b与r符号相同
B.a与r符号相反 D.b与r符号相反
[答案] C [解析] 根据b与r的计算公式可知,b与r符号相同.
课内巩固
2.如图是x和y的一组样本数据的散点图,去掉一组数据 ____________后,剩下的4组数据的相关系数最大.
课内巩固
解析: 经计算,去掉D(3,10)这一组数据后,其他4组数据 对应的点都集中在某一条直线附近,即两变量的线性相关性 最强,此时相关指数最大. 答案: D(3,10)
累计确诊
武汉疫情
450
400
350
300
250
200
150
100
50
0
0
2
4
6
8
10
12
14
武汉迁出(万)
第1节 回归分析
知识回顾
知识回顾
1.相关关系的概念
两个变量间的关系可分为确定性关系和_非__确__定__性___关 系,前者又称为___函__数___关系,后者又称为相关关系.
问题:举一两个现实生活中的问题,问题所涉及的变量之间 存在一定的相关关系。
课内巩固
(2)由上面最小二乘法得到的线性回归 方程知,当股骨的长度为50cm时,肱骨 长度的估计值为:
-3.660+1.19750=56.19 56(cm)
新课探究
散点图只是形象地描述点的分布情况,要想把握其特征, 必须进行定量的研究. 问题:如何对一组数据之间的线性相关程度作出定量分析?
新课探究
[答案] D [解析] 本题考查线性回归方程. D 项中身高为 170cm 时,体重“约为”58.79,而不是“确 定”,回归方程只能作出“估计”,而非确定“线性”关系.
3.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3)
,(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),
5
xiyi=88×78+76×65+73×71+66×64+63×61
i=1
=25 054.
例题精讲
5
x2i =882+762+732+662+632=27 174.
i=1 5
y2i =782+652+712+642+612=23 674
i=1
例题精讲
∴r=
5
xiyi-n x y
i=1
5
5
x2i -n x 2y2i -n y 2
2.设某大学的女生体重 y(单位:kg)与身高 x(单位:cm) 具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n), 用最小二乘法建立的回归方程为^y=0.85x-85.71,则下列结论 中不.正.确.的是( )
A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心(-x ,-y ) C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg
例题精讲
-x =16×(50+10+…+30)=17.5, -y =16×(7.25+8.12+…+11.80)≈9.50, ∑x2i =25+100+…+900=2 275, ∑xiyi=36.25+81.2+…+354=1 077.7, b=1 0727.277-5-6×6×171.57×.529.50≈0.183,
统计案例
文科选修1-2第一章 理科选修2-3第三章
湖北加油!中国加油!
湖北加油!中国加油!
武汉迁出人口数与累计确诊人数
省市
河南 湖南 广东 安徽 江西 重庆 北京 上海
1月14日至1月23日 武汉迁出人口数(万)
12.1
7.1
4.1
3.8
3.6
3.6
3.3
2.4
1月30日累计确诊人数 352 332 367 237 240 182 121 128
例题精讲
[解析] (1)散点图如图所示:
例题精讲
(2)采用列表的方法计算 a 与回归系数 b. 序号 x y x2 xy 1 5 7.25 25 36.25 2 10 8.12 100 81.2 3 15 8.95 225 134.25 4 20 9.90 400 198 5 25 10.96 625 274 6 30 11.80 900 354
(xi, a+bxi)
O
x
[yi - (a+bxi)]2 刻画这个样本点与这条直线的
“距离”,表示了两者的接近程度.
[ y1 (a bx1 )]2 [ yn (a bxn )]2
知识回顾
4.线性回归方程 y bx a
n
n
xi- x yi- y xiyi-n x y
i=1
i=1
(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的 线性相关系数,r2表示变量V与U之的线性相关系数,则(
)
A.r2<r1<0 C.r2<0<r1
B.0<r2<r1 D.r2=r1
解析: 对于变量Y与X而言,Y随X的增大而增大,故Y与X
相关主题