当前位置:文档之家› 统计学相关与回归分析法

统计学相关与回归分析法

结果,是不确定的值。
完全相关
⒈按相关的程度不同分为 不完全相关
不相关
相 关 ⒉按相关的形式不同分为
直线相关

曲线相关

的 种
⒊按相关的方向不同分为

正相关 负相关
单相关
4.按涉及变量的多少分为
复相关
相关分析的概念和内容
研究现象之间是否相关、相关的方 相关分析 向和密切程度的统计分析方法。
内容:
变量之间是否存在相关关系,如果存 在是属于哪种相关关系。 变量之间相关的密切程度,如果是线 性相关,可通过相关系数来体现。
区别:
相关分析不必确定自变量和因变量,所涉 及的都是随机变量;回归分析事先要确定自 变量和因变量,只有因变量为随机变量。
内容上:相关分析研究相关的方向和程度, 不能指出相关的具体形式,无法从一个变量 的变化推测另一个变量的变化;而回归分析 研究变量之间相互关系的具体形式,可根据 回归模型从已知量估计和预测未知量。
24
1600 576 960
28
1764 784 1176
32
2401 1024 1568
31
2704 961 1612
37
2916 1369 1998
40
3481 1600 2360
41
3844 1681 2542
40
4096 1600 2560
47
4225 2209 3055
50
4624 2500 3400
75
平回667方050归和
55
SSE (y yˆ)2 SSR (yˆ y)2
y yˆ
yˆ y

yy
y
体重(Y)
50
45
总离差平方和
SST (y y)2
40
158 160 162 164 166 168 170 172 174 176 178
身高(X)
总离差平方和的分解:
y y ( yˆ y) ( y yˆ)
r
负相关程度增加 正相关程度增加
下表是16家企业的工业总产值与能源消耗量数据:
序号
能源消耗量 (十万吨)x
工业总产值 (亿元)y
x2
y2
xy
1
35
2
38
3
40
4
42
5
49
6
52
7
54
8
59
9
62
10
64
11
65
12
68
13
69
14
71
15
72
16
76
合计
916
24
1225 576 840
25
1444 625 950
由 ( y yˆ)2 min,有 y a bx2 min,
分别对函数中a、b求偏导数,并令其为零,有
2 y a bx1 0
2
y
a
bx
x
0
整理得到由两个关于a、b的二元一次 方程组成的方程组:
y na bx
xy
ax
bx 2
解上述方程组得:
b
nxy xy nx2 (x)2
一元线性回归方程的几何意义
E(Y )
Yˆ X
截距 斜率
X
一元线性回归方程的可能形态
为正
为负
为0
总体一元线性 回归方程:
Yˆ EY X
(估计的回归方以程样) 本统计量估计总体参数
样本一元线性回归方程: yˆ a bx
(一元线性回归方程)
截距 斜率(回归系数)
截距a 表示在自变量x为0时,其它各种因素 对因变量y的平均影响;回归系数b 表明自变
49
4761 2401 3381
51
5041 2601 3621
48
5184 2304 3456
58
5776 3364 4408
625
55086 26175 37887
60
50
40
工业 总产 值
30
20
30
40
50
60
70
80
能源 消耗 量
【例】计算工业总产值与能源消耗量之间的相
关系数。
资料
结解:论已:知工n 业= 1总6, ∑产值x =与91能6,源∑消y =耗62量5,之间存 在∑高xy度= 3的78正87相, ∑关x关2 =系55。086, ∑y2 = 26175
在直线相关的条件下,用以反映两变量间
线性相关密切程度的统计指标,用r表示
r 2xy
x xy y n
x y
2
2
xx n yy n
x xy y (积差法) x x2 y y2

(
x
x
)(
y
y)
xy
1 n
x
y
Lxy
(x x)2
x2 1 ( n
x)2 Lxx
y
估计
yˆ a bx

x0
x
对于 yˆ 6.5142 0.7961 x
若 x = 80(十万吨),则:
yˆ 6.5142 0.7961 80 57.1738 亿元
b与r的关系:
r>0 r<0 r=0 b>0 b<0 b=0
r bx ; b ry
y
x
10名误学生差的身平高方与体和重散点图
第九章 相关与回归分析法
第九章 相关与回归分析法
§9.1 相关与回归分析概述 §9.2 简单线性相关分析 §9.3 简单线性回归分析
第一节 相关与回归分析概述
相关和回归分析是研究事物的相互关系、 测定它们联系的紧密程度、揭示其变化的 具体形式和规律性的统计方法,是构造各 种经济模型、进行结构分析、政策评价、 预测和控制的重要工具。
0<|r|<1表示存在不同程度线性相关:
|r| < 0.3 为微弱相关(基本无关);
0.3≤ |r| <0.5为低度相关; 0.5≤ |r| <0.8为显著相关(中度相关) ; 0.8≤ |r| <1.0为高度相关(强相关) 。
相关系数的取值及其意义图示
完全负相关
无线性相关
完全正相关
-1.0 -0.5 0 +0.5 +1.0
体重(Y)
75 70 65 60 55 50 45 40
158
10名学生的身高与体重散点图
yˆ a bx y a bx
残差:e
163
168
173
178
身高(X)
一元线性回归方程 yˆ a bx
中参数a、b的确定:
最小平方法 基本数学要求:
y yˆ 0 ( y yˆ)2 min
量x每变动一个单位,因变量y平均变动b个 单位。
yˆ a bx是理论模型,表明x与y变量 之间的平均变动关系,而变量y的实际
值应为yi (a bxi ) i yˆi i
x对y的线性影响而形 成的系统部分,反映两 变量的平均变动关系, 即本质特征。
随机干扰:各种偶然 因素、观察误差和其 他被忽视因素的影响
函数关系
指现象间所具有的严格的确定性 的依存关系
相关关系
指客观现象间确实存在,但数量 上不是严格对应的依存关系
函数关系与相关关系在一定条件下可相互转化:有 函数关系的变量间,如果存在测量误差,则可表现 为相关关系;对具有相关关系的变量有深刻了解之 后,相关关系有可能转化为函数关系。
函数关系与相关关系的研究方法
( y y)2 ( yˆ y) ( y yˆ)2
( yˆ y)2 ( y yˆ)2 2 ( yˆ y)( y yˆ)
( yˆ y)(y yˆ) (a bx a bx)e b xe bxe 0
(y y)2 (yˆ y)2 (y yˆ)2

的 种 ⒉按回归方程的形式分为
直线回归

曲线回归
(非线性回归)
三、相关分析与回归分析的关系
联系:
有共同的研究对象:现象之间的相关关系; 互相补充:相关分析要依靠回归分析表明现 象数量相关的具体形式;而回归分析要依靠相 关分析来表明现象数量的相关程度。只有变量 之间存在着高度相关时,进行回归分析寻求其 相关的具体形式才有意义。
0
300~350 2
2
fX 2 2 3 5 4 3 1 20
相关图
又称散点图,用直角坐标系的x轴代表自变量,
y轴代表因变量,将两个变量间相对应的变量 值用坐标点的形式描绘出来,用以表明相关 点分布状况的图形。
y
y
y
y
正 相 关 x 负 相 关 x 曲线相关 x 不 相 关 x
相关系数 (只研究简单相关系数)
简单 相关表Байду номын сангаас
适用于所观察的样本单位数 较少,不需要分组的情况
分组 相关表
适用于所观察的样本单位数 较多,需要分组的情况
简单相关表
八个同类工业企业的月产量与生产费用
企业编号 1 2 3 4 5 6 7 8
月产量(千吨)X 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0
生产费用(万元)Y 62 86 80 110 115 132 135 160
之间关系;对给定的自变量 x,揭示因变量y在数量上的
平均变化并求得因变量的预 测值的统计分析方法。
一元线性回归模型
对于经判断具有显著线性关系的两个变 量y与x,构造一元线性回归模型为:
Y X
式中:与为模型参数, 为随机误差项
假定E()=0,有总体一元线性回归方程: Yˆ EY X
n∑xy - ∑x∑y
相关主题