当前位置:文档之家› 北师大版高中数学选修2-3第三章 3.1-回归分析 课件

北师大版高中数学选修2-3第三章 3.1-回归分析 课件


7 5 0 25 0 0
0 19 100 75 0
2.计算 相关系数
n
xi2 100
i 1
n
yi2 75
i 1
n
xi yi 0 x 0 y 2.71
i 1
n
xi yi nx y
r
i 1
0 7 0 2.71
0
xi2
2
nx
yi 2
n
2
y
100 7 02 75 7 2.712
(2)由最小二乘法得到的线性回归方程可知, 当股骨的长度为50 cm时,肱骨的长度的估计 值为
-3.660+1.197×50=56.19≈56(cm).
随堂练习
1.一位母亲记录了儿子3~9岁的身高,由此建立的身 高与年龄的回归模型为y=7.19x+73.93
用这个模型预测这个孩子10岁时的身高,则正确的叙 述是( D )
例 计算下表中两变量的线性相关系数r,通过计算,发现 了什么?
x
-5
-4
-3
0
3
4
5
y
0
3
4
5
4
3
0
1.列表
i
xi
yi
xi2 yi2 xi yi
1 -5 0 25 0 0
2 -4 3 14 9 -12
3 -3 4 9 16 -12
4 0 5 0 25 0
5 3 4 9 16 12
6 4 3 16 9 12
166 26569 27556
1288 202944 207484
16 16 xiyi
1 4 23870
24492 25122 25758 25760 26404 26730 27058 205194
16 16 56
x 1274 8
159.25
y 1288 8
161
计算相关系数:
n
__
但在某些情况下,从散点图中不容易判断变量之间 的线性关系,或者数据量大时,我们无法画出散点图.
数据量大时,画散点图比较麻烦
有时散点图不易判断是否线性相关
有没有其它方法来判断两个变量之间是否具有线性 相关关系呢?
假设两个随机变量的数据分别为
(x1, y1), (x2 , y2 ),..., (xn , yn ),
则变量间线性相关系数r的计算公式如下:
n
xi x ( yi y)
r
i 1
n
n
xi x 2 yi y 2
i 1
i 1
n
xi yi nxy
=
i 1

n
n
xi2 nx2
yi2 ny 2
i 1
i 1
相关系数
n
__
xiyi n x y
r
i1
n
xi2 n(x)2
n
yi2
_
n (y)2
A.身高一定是145.83cm; B.身高在145.83cm以上; C.身高在145.83cm以下; D.身高在145.83cm左右.
2、假设关于某设备的使用年限x和所支出 的维修费用y(万元)有如下统计资料:
x
2
3
4
5
6
y
2.2 3.8 5.5 6.5 7.0
(1) 求回归方程;(2)估计使用10年 时,维修费用约是多少?
n
__
xiyi 8 x y
b

1.345
i1
a y b x 53.191
故y对x的线性回归方程为
y 53.1911.345x
新课讲授 三、可线性化的回归分析
若果两个变量之间不具有线性关系,我们又该怎 么处理呢?下面我们看下面的例题.
例 下表按年份给出了1981~2001年我国出口贸易 量(亿美元)的数据,根据此表你能预测2008年我 国的出口贸易量么?
即线性回归方程,记1981年为x =1,1982年为 x =2,…变换后的数据如下表:
对上表数据求线性回归方程得:c 5.056 ,b 0.138 ,
即: u 5.056 0.138x
y eu e5.056 e0.138x
由此可得:y eu e5.056 e0.138x ,曲线如图:
(1)求出肱骨长度y对股骨长度x的线性回归方程; (2)还有1个化石标本不完整,它只有股骨,而肱骨 不见了.现测得股骨的长度为50 cm,请预测它的肱骨 长度.
解:(1)画出散点图(见教材),可以看出,表 中的两个变量呈现出近似的线性关系,我们可以建 立肱骨长度y对股骨长度x的线性回归方程.
根据必修所学,我们可以求出
观察生活
现实生活中存在着某些有关系的不同变量,这 些变量之间的关系不是可以用函数表示的确定性关 系.例如,父母的身高与他们孩子的身高,食物中 所含的脂肪与所含的热量,模拟测验的成绩与实际 考试的成绩,农作物的施肥量与产量.
他们之间是一种非确定性关系,称为相关关系.
由于一个变量与另一个变量之间往往不是确 定的关系,人们也不可能把握与某个变量有关的 所有变量,因此变量间的关系往往会表现出某种 不确定性.回归分析就是研究这种变量之间的关 系的一种方法,通过对变量之间关系的研究,从 而发现蕴含在事物或现象中的某些规律.
y
6 5 4 3 2 1
-6
-4
-2 0
2
4
6
x
-1
例 下表是随机抽取的8对母女的身高数据,试根据这些数 据探讨y与x之间的关系.
母亲身高 15 15 15 15 16 16 16 16 x/cm 4 7 8 9 0 1 2 3
解女: 儿身高
i
xi
列表:y/1cm 154
2 157
3 158
4 159
从散点图中观察,数据与直线的拟合性不好, 若用直线来预测,误差将会很大。
而图像近似指数函数,呈现出非线性相关性。
分析: 考虑函数 y aebx 来拟合数据的变化关系,将其转
化成线性函数,两边取对数:ln y ln a bx
设 u ln y, c ln a ,则上式变为 u c bx,
新课讲授
一、回归分析
例 始祖鸟是一种已经灭绝的动物.在一次考古活 动中,科学家发现了始祖鸟的化石标本共6个,其 中5个同时保有股骨(一种腿骨)和肱骨(上臂的 骨头).科学家检查了这5个标本股骨和肱骨的长 度得到表中的数据:
编号
12 345
股骨长度x/cm 38 56 59 64 74
肱骨长度y/cm 41 63 70 72 84
xiyi n x y
r
i1
n i1
xi2
n
_
x
2
n i1
yi2
n
_
y
2
205194 8159.25161
202944 8159.252 207484 81612
80 0.963 59.5 116
因为r=0.963接近1,所以x与y具有较强的 线性相关关系.
利用最小二乘法求a,b:
i1
i1
x1y1 x2 y2 xn yn nx y
x12 x22
xn2
2
nx
y12 y22
yn2
2
ny
r
x1y1 x2 y2 xn yn nx y
x12
x22
xn2
2
nx
y12 y22
yn2
n
2
y
对相关系数的几点说明:
r 1即-1 r 1. 当r 0 时, 表明两个变量正相关; 当r 0 时, 表明两个变量负相关. r 越接近1, 表明两个变量的线性相关性越强; r 越接近于0, 表明两个变量之间线性相关关系越弱. 通常,当r 大于0.75时认为两个变量有很强的线性相关关系.
x 291 58.2, y 330 66.
5
5
b
20040 5 58.2 66 17633 5 58.22
1.197,
a
66
20040 5 17633
58.2 66 5 58.22
58.2
3.660.
于是,y对x的线性回归方程为
y 3.660 1.197x.
回归直线的斜率的意思是,对于这次发现的始祖 鸟的化石标本来说,股骨的长度每增加1 cm,肱 骨的长度平均增加1.197 cm.
解:(1)作散点图:
根据散点图知 x 与 y 成线性相关关系.
x4
y5
b
112.3 5 4 5 90 5 42
1.23
a 5 1.23 4 0.08
回归直线方程为y 1.23x 0.08
(2)x = 10 , y = 12.38
新课讲授 二、相关系数
通过例题我们知道了,任何数据,不管它们的线 性相关关系如何,都可以求出线性回归方程,为使方 程有意义,在求回归方程之前先要对变量之间的线性 相关关系作一个判断,通常做散点图.
复习回顾
相关关系的判断
y •
•• •
• ••
y a bx
O
X
如何求回归方程 y a bx 中a,b的值?
b
x1 y1 x2 y2 xn yn n x x12 x22 x2n2 n x 2
y
n
i 1
xi
yi
nx y
n
i 1
xi2
2
nx
最小二乘法
a ybx
若两个变量具有线性相关关系则求回归方程步 骤是 ?
(a 0,b 0)
作变换 u ln y, c ln a, 得线形函数 u c bx 。
思考交流
b
3. 倒指数曲线:y ae x
相关主题