当前位置:文档之家› 回归分析北师大版

回归分析北师大版


百万元)之间有如下的对应关系:x 2 4 6 8( Nhomakorabea)
y
30
40
50
70
判断x与y之间是否存在线性相关关系.
解:画出(x,y)的散点图,如图所示,由图可知x,y呈现 线性相关关系.
- x =5,- y =47.5, x2 i =120,
i=1 4 4
4
y2 i =9 i=1

900, xiyi=1 080,
1.(2011· 辽宁高考)调查了某地若干户家庭的年收入x(单位:
万元)和年饮食支出y(单位:万元),调查显示年收入x与年 饮食支出y具有线性相关关系,并由调查数据得到y对x的线 性回归方程:y=0.254x+0.321.由线性回归方程可知,家 庭年收入每增加1万元,年饮食支出平均增加________万
n
2
* r 值越大,误差 Q 越小,则变量的线性相关程度
就越高; r 值越接近于0,Q 越大,线性相关程度就
越低。 * 当 r 0 时,两变量正相关;当 r 0 时,两变量 负相关;当 r 0 时,两变量线性不相关。
4.对四对变量y和x进行线性相关检验,已知n是观测值组 数,r是相关系数,且已知:
拓展思考
相关系数r越大,变量间的线性关系就越 强,那么r的值究竟大到什么程度就认为线性 关系较强??
相关系数
n (xi -x)(yi -y) i=1 r= n n 2 2 (xi -x) × (yi -y) i=1 i=1
r>0正相关;r<0负相关.通常, r∈[-1,-0.75]——负相关很强; r∈[0.75,1]——正相关很强; r∈[-0.75,-0.3]——负相关一般; r∈[0.3, 0.75]——正相关一般; r∈[-0.25, 0.25]——相关性较弱;
i=1
i=1
x - y xiyi-4-
4
r=
4 2 2 2 - xi -4- x y2 - 4 y i i=1 i=1

4

1 080-4×5×47.5 = 120-4×529 900-4×47.52 ≈0.982 7. 故 x 与 y 之间存在线性相关关系.
复习回顾
* 线性相关系数r及性质:
正相关
负相关
思考交流
对于课本P73给出的例题,变量的线性相关系数r 如何求? 我们知道,相关系数的计算公式为:
r
x y
i 1 i 2 2 x n x i i 1 n
n
i
nx y
2 2 y n y i i 1
n
n 2 i n
n
2 x y 要求r,只需求出相关的量: xi yi , , i ,
(3)写回归直线方程 y a bx,并用方程进 行预测说明.
新课探究
任何数据,不管它们的线性相关关系如何,都
可以用最小二乘法求出线性回归方程,为使建立的
线性回归方程有意义,在利用最小二乘法求线性回 归方程之前,先要对变量间的线性相关关系作个判 断,通常可以作散点图。但在某些情况下,从散点 图中不容易判断变量间的线性关系,另外,如果数
据量较大时,画散点图比较麻烦,此时我们有没有
其他方法来刻画变量之间的线性相关关系呢?
新课探究
为解决这个问题,我们可通过计算线性相关系数
r,来判断变量间相关程度的大小,计算公式为:
r lxy lxxl yy
( x x )( y y )
i 1 i i 2 ( x x ) i i 1 n 2 ( y y ) i i 1 n
yi
0 3 4 5 4 3 0 19
x
2 i
y
0 9
2 i
xi yi
0 -12 -12 0 12 12 0 0
25 16 9 0 9 16 25 100

16 25 16 9 0 75
由表可知:
2 2 x 1 00 , y i i 75 , xi yi 0 ,
n
n
n
i 1
i 1
(2)如果y与x之间具有线性相关关系,求线性回归方程.
解:(1)散点图如图.
(2)由散点图可知,y 与 x 呈相关关系,设线性回归方程 为 y=bx+a.
5 2 - 经计算, 得- x =6, y =210.4, xi =220, xiyi=7 i=1 i=1

5

790.
7 790-5×6×210.4 ∴b= =36.95, 2 220-5×6 a=210.4-36.95×6=-11.3. ∴线性回归方程为 y=36.95x-11.3.
相关关系的测度
(相关系数取值及其意义)
完全负相关 无线性相关 完全正相关
-1.0
-0.5
0
+0.5
正相关程度增加
+1.0
r
负相关程度增加
小结
* 线性相关系数r:
r
x y
i 1 i
n
i
nx y
2 2 y n y i i 1 n
,其中 1 r 1 。
x nx
i 1 2 i
x 和 y 。
i 1
i 1
i 1
由数据表,经过计算,可知(P77):
2 2 y x 17633 x y 20040 i i , i , i 22790,
i 1
i 1
n
n
n
i 1
330 291 66 ,可得 x 58.2 , y 5 5
r
20040 5 58.2 66
相关系数
1.计算公式
r=
(x
i=1
n
i
- x)(yi - y)
2
(x
i=1
n
i
- x)
(y
i=1
n

2
x y
i 1 i
n
i
nxy
i
- y)
x
i 1
n
2 i
nx
2
y
i 1
n
2 i
ny 2
2.相关系数的性质 (1)|r|≤1; (2)|r|越接近于1,相关程度越大;|r|越接近 于0,相关程度越小. 问题:达到怎样程度,x、y线性相关呢?它们 的相关程度怎样呢?
就越高; r 值越接近于0,Q 越大,线性相关程度就
越低。 相关系数r的性质
当 r 0 时, b 0 ,两变量的值总体上呈现同
时增加的趋势,则称两变量正相关;
当 r 0 时, b 0 ,一变量增加,另一变量有 减小的趋势,则称两变量负相关; 当 r 0 时,则称两变量线性不相关。
y=bx +a
( xi x)( yi y ) xi yi nx y i 1 i 1 b n n 2 2 2 ( x x ) x n ( x ) i i i 1 i 1 a y bx 1 n 1 n y yi x xi 其中 n i 1 n i 1
新课讲解
下表按年份给出了1981~2001年我国出口贸易 量(亿美元)的数据,根据此表你能预测2008年我 国的出口贸易量么?
回归分析的基本思想及其初步应用
3.1.1
回归分析
回顾复习 问题1:现实生活中两个变量间的关系有哪些呢? 不相关 1、两个变量的关系
函数关系
线性相关 相关关系
非线性相关 相关关系:对于两个变量,当自变量取值一定 时,因变量的取值带有一定随机性的两个变量 之间的关系。
思考:相关关系与函数关系有怎样的不同?
答案:C
复习回顾
* 用线性回归方程进行回归分析: (1)画散点图;
(2)求回归系数 a , b :
b
(x
i 1 n
n
i
x )( yi y )
2 ( x x ) i i 1

x y
i 1 n i i 1
n
i
nx y
2 2 x n x i
a y bx
r
x y
i 1 i
n
i
nx y
2 2 y n y i i 1 n
x nx
i 1 2 i
n
,其中 1 r 1 。
2
* r 值越大,变量的线性相关程度就越高; r 值越接近于0,线性相关程度就越低。
* 当 r 0 时,两变量正相关; 当 r 0 时,两变量负相关; 当 r 0 时,两变量线性不相关。
①n=7,r=0.953 3;②n=15,r=0.301 2;
③n=17,r=0.499 1;④n=3,r=0.995 0. 则变量y和x线性相关程度最高的两组是 A.①和② C.②和④ 程度越高,故选B. 答案:B B.①和④ D.③和④ ( )
解析:相关系数r的绝对值越大,变量x,y的线性相关
5.某厂的生产原料耗费x(单位:百万元)与销售额y(单位:
i 1
x 0 ,y 2.71,则可得
r 0 7 0 2.71 100 7 0 2 75 7 2.712 0
你发现什么了?? r=0,则变量间并不存在线性相关关系。即此时 建立线性回归方程是没有意义的。
实际上,从散点图上我们也可以验证这一点:
易看出,几个样本点都落在同一个半圆上,而不 是条状分布,此时建立线性回归方程无任何意义,这 与相关系数r的计算结果相一致。
n

x y nxy
i 1 i i 2 2 x nx i i 1 n 2 2 y ny i i 1 n
n
新课探究
据前面的分析,回归系数 a , b 使得误差
相关主题