当前位置:文档之家› 两个变量的线性相关_课件

两个变量的线性相关_课件


1.相关关系与函数关系不同,相关关系是一种_不__确___定__性关
系. 2.从散点图上看,点散布在从左下角到右上角的区域内,两个
变量的这种相关关系称为__正__相___关_,点散布在从左上角到右 下角的区域内,两个变量的这种相关关系称为_负__相___关__.
3.从散点图上看,如果这些点从整体上看大致分布在通过散点
(4)写出回归直线方程.
变式训练2:求变式训练1中的回归直线方程.
解:列表: i xi yi
xiyi
x
2 i
1 80 70 5600 6400
2 75 66 4950 5625
3 70 68 4760 4900
4 65 64 4160 4225
5
x 70, y 66, x i yi 23190 i 1
3.如下图所示,有5组(x,y)数据,去掉( 数据的线性相关系数最大.( )
2.两个变量的线性相关 (1)回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归分析. 通俗地讲, 回归分析是寻找相关关系中非确定性关系的某种确定性. (2)散点图 将n个数据点(xi,yi),(i=1,2,…,n)描在平面直角坐标系中,以表示 具有相关关系的两个变量的一组数据的图形叫做散点图. 散点图形象地反映了各对数据的密切程度.
施化肥 15 20 25 30 35 40 45 量x
水稻产 330 345 365 405 445 450 455 量y
(1)画出散点图; (2)求水稻产量y与施化肥量x之间的回归直线方程; (3)当施化肥50 kg时,对水稻的产量予以估计. 分析:解答本题应先画散点图,判断其是否线性相关,再利用 最小二乘法求其回归方程.
题型二 求回归直线方程 例2:每立方米混凝土的水泥用量(单位:kg)与28天后混凝土 的抗压强度(单位:kg/cm2)之间的关系有如下数据:
x 150 160 170 180 190 200 210 220 230 240 250 26 0
y 56.9 58.3 61.6 64.6 68.1 71.3 74.1 77.4 80.2 82. 86. 89 6 4 .7
(1)画出散点图; (2)如果散点图中的各点大致分布在一条直线的附近,求y与x 之间的回归直线方程.
分析:(1)将表中的各对数据在平面直角坐标系中描点,便 得到具有相关关系的两个变量的一组数据的图形,即得散 点图;(2)按照求回归直线方程的步骤和公式,写出回归直 线方程.
解:(1)如下图.
(2)由散点图知,x与y之间具有线性相关关系,下面求回归直 线方程.
制表:
i
1
2
3
4
5
6
xi
150
160
170
180
190
200
yi
56.9 58.3 61.6 64.6 68.1 71.3
xiyi
8535
9328 10472 11628 12939 14260i
i
7
8
9
10
11
12
xi
210
220
230
240
250
260
yi
74.1 77.4 80.2 82.6 86.4 89.7
图中心的一条直线附近,称两个变量之间具有_线__性___相__关__关__ 系 , 这条直线叫__回__归___直线 _.
4.假设我们已经得到两个具有线性相关关系的变量的一组数
据(x1,y1),(x2,y2),…,(xn,yn).且所求回归方程是 yˆ bˆx aˆ,
其中b是回归方程的___斜__率___, aˆ 是___截__距___,则有
a 399.3 4.75 30 257. 即得回归直线方程yˆ 257 4.75x.
(3)施化肥50 kg时,可以估计水稻产量约为495kg.
规律技巧:(1)回归分析是寻找相关关系中非确定性关系的某 种确定性;(2)求回归直线方程,关键在于正确地求出系数a,b, 由于a,b的计算量大,计算时要仔细,避免计算失误.
xiyi 15561 17028 18446 19824 21600 23322
12
x 205, y 72.6, x i2 518600, i 1
12
12
y i2 64572.94, x i yi 182943
i 1
i 1
bˆ 182943 12 205 72.6 4347 0.304. 518600 12 2052 14300
aˆ y bˆx 72.6 0.304 205 10.28, 于是所求的线性回归方程是yˆ 0.304x 10.28.
规律技巧:用公式求回归直线方程的一般步骤:
(1)列表xi,yi,xiyi.
n
n
(2)计算 x, y, x i2, x i yi.
i 1
i 1
(3)代入公式求 bˆ ? aˆ 的值.
(1)画出散点图如图: 由图可见是线性相关的.
(2)借助计算器列表:
i
1
2
3
4
5
6
7
xi
15
20
25
30
35
40
45
yi
330 345 365 405 445 450 455
xiyi 4950 6900 9125 12150 15575 18000 20475
计算得 : b 87175 7 30 399.3 4.75, 7000 7 302
nxBiblioteka yi nx yi 1n
(xi x )( yi y)

__i_n1_x_i2 __nx_2__
,
i 1
n
____i1_(_xi__x_)2____,
aˆ _____y___b_x______ .
通过求Q=_(_y_1_-b_x_1_-_a_)_2+__(y_2_-_b_x_2_-a_)_2_+_…_+_(_y_n_-_b_x_n_-a_)_2_的最小 值而得出回归直线的方法,即使得样本数据的点到回归直线 的距离的平方和最小,这一方法叫做最小二乘法.
年降雨 748 542 507 813 574 701 432 量(mm)
分析:利用散点图进行判别.
解:以x轴为年平均气温,y轴为年降雨量,可得相应的散点图 如下图所示:
因为图中各点并不在一条直线的附近,所以两者不具有相关关系,没必要 用回归直线进行拟合,如果用公式求得回归直线也是没有意义的. 规律技巧:用回归直线进行拟合两变量关系的一般步骤为: (1)作出散点图,判断散点是否在一条直线附近; (2)如果散点在一条直线附近,用公式求出a,b并写出线性回归方程.
(3)最小二乘法 设与n个观测点(xi,yi)(i=1,2,…,n)最接近的直线方程为 yˆ bx a
(注意它与表示一次函数的习惯y=ax+b不同 ; y ˆ表示y的估算值).其中
a,b是待定系数. 用Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2来刻画n个点与回归直线在 整体上的偏差.上式展开后,是一个关于a,b的二次多项式,运用配方法, 可求出使Q取得最小值时a,b的值(即上述公式①中的a,b值).
5 60 62 3720 3600
5
b
xi yi 5x y
i 1
5
xi2
2
5x
9 25
0.36,
i 1
a y bx 40.8.
所求回归直线方程为yˆ 0.36x 40.8.
题型三 利用回归直线方程对总体进行估计 例3:在7块并排、形状大小相同的实验田上进行施化肥量对水
稻产量影响的试验,得数据列表(单位:kg):
②函数关系是一种因果关系,而相关关系不一定是因果关系, 也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小 与阅读能力有很强的相关关系,然而学会新词并不能使脚变 大,而是涉及到第三个因素——年龄,当儿童长大一些,他的 阅读能力会提高,而且由于长大,脚也变大.
(3)相关关系的分析方向 由于相关关系的不确定性,在寻找变量间相关关系的过程中, 统计发挥非常重要的作用.我们可以通过收集大量的数据,在 对数据进行统计分析的基础上,发现其中的规律,对它们的关 系作出判断.
变量之间的相关关系 两个变量的线性相关
1.掌握两个变量间的相关关系及正相关、负相关、不具相关关 系的判定.
2.通过收集实际生活中两个变量的有关数据作出散点图. 3.利用散点图直观地认识变量间的相关关系. 4.正确理解回归直线方程、最小二乘法的概念. 5.能够根据散点图得到回归直线. 6.掌握利用最小二乘法求回归直线方程的方法.
变式训练1:5个学生的数学和物理成绩如下表:
学生
A
B
C
D
E
学科
数学 80
75
70
65
60
物理 70
66
68
64
62
画出散点图,并判断它们是否有相关关系.
分析:解答本题可以以数学成绩为自变量,考察因变量物理成绩的变化趋 势,从而作出判断. 解:以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示: 由散点图可见,图中的点大致在一条直线附近,故两者之间具有相关关系.
n
n
(xi x )( yi y)
xi yi nx y
bˆ i1 n

y
( xi
i 1
bˆx
x)2
i 1 n
xi2
2
nx
i 1
其中,b是回归方程的斜率,a是截距. 所得到的方程 yˆ bx a 叫作回归直线方程,相应的直线叫作 回归直线,而对两个变量所进行的统计分析叫作线性回归分 析.
(3)正相关、负相关 如果从散点图看到点散布的位置是左下角到右上角的区域. 这种相关称为正相关.反之,如果两个变量的散点图中,点散布 的位置是从左上角到右下角的区域.即一个变量的值由小变 大时,另一个变量的值由大变小,这种相关称为负相关. 如果关于两个变量统计数据的散点图呈现如图的形状,则这 两个变量之间不具有相关关系.例如,学生的身高与学生的数 学成绩没有相关关系.
相关主题