当前位置:
文档之家› 变量之间的相关关系-PPT课件
变量之间的相关关系-PPT课件
观察散点图的大致趋势,人的年龄与人体脂肪 含量具有什么相关关系?
观察散点图的大致趋势,人的年龄与人体 脂肪含量具有什么相关关系?
一般地,对于某个人来说,她的体内 脂肪不一定随年龄的增长而增加或减少。 但是如果把很多个体放在一起,这时就 可能表现出一定的规律。大体上来看, 随年龄的增加,人体中脂肪的百分比也 在增加。
如果两个变量成负相关,从整体上看这两个变量 的变化趋势如何?其散点图有什么特点?
一个变量随另一个变量的变大而变小, 散点图中的点散布在从左上角到右下角 的区域.
从刚才的散点图发现:年龄越大,体内脂肪含量越 高,点的位置散布在从左下角到右上角的区域。称它们 成正相关。但有的两个变量的相关,如下图所示:
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考1:对某一个人来说,他的体内脂肪含量不 一定随年龄增长而增加或减少,但是如果把很多 个体放在一起,就可能表现出一定的规律性.观 察上表中的数据,大体上看,随着年龄的增加, 人体脂肪含量怎样变化?
年龄 23 27 39 41 45 49 50 脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
②函数关系是一种因果关系,而另一种不一定 是因果关系,也可能是伴随关系。
联系:
两者均是指两个变量的关系;在一定条件下 可以相互转化。
两个变量间相关关系定义:
当自变量取值一定,因变量的取值带 有一定的随机性时,两个变量之间 的关 系称为相关关系。相关关系是一种非确定 性关系。
即学即练
1:下列各关系中具有相关关系的是( C )
脂肪含量
思考:对一组具有线性相关关系的样本数 据,你认为其回归直线是一条还是几条?
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
思考:在样本数据的散点图中,能否用直尺
准确画出回归直线?
脂肪含量
40
35
30
整体上最接近!
25 20
15
脂肪
40
30
20
脂肪
10
0
0
20
40
60
80
上面的方法虽然有一定的道理,但费时、费力且精度差. 实际上,求回归方程的关键是如何用数学的方法来刻画 “从整体上看,各点与此直线的距离最小”.
假设我们已经得到两个具有线性相关关系的样本 的一组数据:(x1,y1),(x2,y2),…,(xn,yn),
且所求回归直线方程是: yˆ bx a ,其中 a,b 是
待定系数. 当自变量x取xi(i=1,2,…,n)时可以得到回归直
线上的点的纵坐标为:yˆi bxi a(i 1, 2,, n)
它与样本数据yi的偏差是:yi yˆi yi (bxi a)
(x1,y1)
(x2,y2)
(xn,yn)
而 di | yi yˆi | sin ,
这样,用这 n 个偏差的和来刻画“与此直线的整体偏差”
5 0
20 25 30 35 40 45 50 55 60 65 年龄
这些点大致分布在一条直线附近.
思考:如果散点图中的点的分布,从整体上 看大致在一条直线附近,则称这两个变量之 间具有线性相关关系,这条直线叫做回归直 线.对具有线性相关关系的两个变量,其回 归直线一定通过样本点的中心.
40 35 30 25 20 15 10
【学 习 目 标】
1、知识与技能: 会画散点图判断线性相关关系,并对实际问题进
行分析和预测;加强对线性相关关系及回归直线含义 的理解。 2 、过程与方法:
①通过自主探究,体会数形结合、类比的数学思想 方法。
②通过动手操作培养学生观察、分析、比较和归 纳能力,引出利用计算机等现代化教学工具的必要性。 3、情感、态度与价值观:
如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越 少。 作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗1升汽油所行使的 平均路程,称它们成负相关.
O
脂肪含量
初步探索,直观感知
探究三:线性回归方程
散点图有了,又该如何寻找这个相关关系呢?
当人的年龄增加时,体内脂肪含量到底是以什么方式增 加呢
(3)三角形三边长与三角形面积的关系
函数是研究两个变量之间的依存关系 的一种数量形式.
对于两个变量,如果当一个变量的取 值一定时,另一个变量的取值被惟一确 定,则这两个变量之间的关系就是一个 函数关系.
函数关系是一种确定性关系
不同点:
对比得出的异同点:
①一种是确定性关系(函数关系);另一种是 一种非确定性关系。
是比较合适的.
| yi yˆi | di
(x1,y1)
(x2,y2)
(xn,yn)
问题就归结为:
当 a, b 取什么值时 Q 最小.
Q ( y1 bx1 a)2 ( y2 bx2 a)2 L ( yn bxn a)2
运算不方便
n
求 (yi yˆi )2的最小值 i1
避免相互抵消
一路前行
变量间的相 关关系
崭露头角
线性回归分析
B 相关关系 D
F
A
情景导入
C
E
数据分析散点图 例题分析
小学明也不,你物是好数理学数学怎不学成么好,物绩样的理不? 太好, 也?不?太??好?.啊.. .
“如果你的数学成绩好,那 么你的物理学习就不会有 什么大问题”你如何认识 学生的数学成绩与物理成
初步探索,直观感知
探究一: 两个变量间的相关关系
著名案例:吸烟与肺癌有关? 两个变量是有关联的,但关系不确定。 1.现象之间确实存在着数量上的依存关系 2.现象之间数量上的关系是不确定、不严格的依
存关系。
(1)龙生龙、凤生凤、老鼠儿子打地洞(生
物意义上解释)
函数关系
(2)y=2x+1中,y与x的关系
10
5
方案一:
0 20 25 30 35 40 45 50 55 60 65 年龄
画出一条直线,使其过尽可能多的样本点;
方案二:
在图中选取两点画直线,使得直线两侧 的点的个数基本相同。
方案三:
在散点图中多取几组点,确定几条直线的方 程,分别求出各条直线的斜率和截距的平均数, 将这两个平均数作为回归方程的斜率和截距。
年龄 脂肪
53 54
56
57
58 60 61
29.6 30.2 31.4 30.8 33.5 35.2 34.6
根据上述数据,人体的脂肪含量与 年龄之间有怎样的关系?
年龄 23 27 39 41 45 49 50 脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
各点与直线 的整体偏差
人们经过长期的实践与研究,已经找到了计算回归
方程的一般公式 yˆ bˆx a,ˆ 其中:
n
n
(xi x)( yi y) xi yi nx y
bˆ i1 n
(xi x)2
i1 n
xi2
n
2
x
,
i1
i1
aˆ y bˆx.
以上公式的推导较复杂,故不作推导, 但它的原理较为简单:即各点到该直 线的距离的平方和最小,这一方法叫 最小二乘法。
脂肪含量
40 35 30 25 20 15 10 5 0
20 25 30 35 40 45 50 55 60 65 年龄
散点图定义:
在平面直角坐标系中,表示具有相关关系的两个 变量的一组数据图形,称为散点图.
脂肪含量
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考2:为了确定年龄和人体脂肪含量之间的更明 确的关系,我们需要对数据进行分析,通过作图 可以对两个变量之间的关系有一个直观的印象.以 x轴表示年龄,y轴表示脂肪含量,在直角坐标系 中描出样本数据对应的图形.
即学即练
练习:下列图形中两个变量具有相关关系的是(C)
(A) y
(B) y
o
x
o
x
Hale Waihona Puke y (C)y (D)
o
x
o
x
脂肪含量
40 35 30 25 20 15 10
5 0
20 25 30 35 40 45 50 55 60 65 年龄
在上面的散点图中,这些点散布在从左下角到右 上角的区域,对于两个变量的这种相关关系,我 们将它称为正相关.
对具有相关关系的两个变量进行统计 分析的方法叫回归分析
相关关系是进行回归分析的基础,同时, 也是散点图的基础。
初步探索,直观感知 如何进行数据分析? 探究二:散点图
问题2、在一次对人体脂肪含量和年龄的关 系的研究中,研究人员获得了一组样本数据:
年龄
23 27
39
41
45
49 50
脂肪
9.5 17.8 21.2 25.9 27.5 26.3 28.2
绩之间存在的关系?
数学成绩
物理成绩
学习兴趣
学习时间
其他因素
分析: 物理成绩和数学成绩是两个变量,从经验
看,由于物理课程涉及比较多的数学知识。数 学成绩的高低对物理成绩的高低是有一定影响 的。但决非唯一因素,还有其它因素,如是否 喜欢物理,用在物理学习上的时间等等。
总结: 不能通过一个人的数学成绩是多少就准确 地断定他的物理成绩能达到多少。这种关系不 像销售额与销售量的关系(销售额=销售量×价 格)是确定型的,这两个变量之间存在一定的相 互关系,它们之间是一种不确定型的关系。 要找到他们的关系,就需要收集大量的数据, 对数据进行统计分析,分析其中的规律,才能对 他们之间的关系作出判断.