第五章 相关系数讲解
rs
3 N
1
4 N
(
Rx Ry N 1)
(N
1)
N等级对数
Rx , Ry为两列变量各自排列的等级序数
零相关:A变化时,B或增大或减少,好无规律。
二、相关系数
概念:相关系数是变量之间相关程度的指标。计算相 关系数一般需大样本。
符号:样本相关系数—r,总体相关系数 —ρ 取值:-1~1。 性质:顺序数据。
三、散点图
Y
Y
Y
0
X
完全正相关
0
X
高正相关
0
X
零相关
Y
Y
Y
0
X
完全负相关
方法。 数据来源:一是等级评定的资料,二是等距或比率资
料转化而成的等级评定资料。 优点:使用范围较积差相关更广 缺点:没有积差相关精确
二、斯皮尔曼等级相关
(一)斯皮尔曼等级相关 Spearman’s rank correlation。符号:rR ,rS. 斯皮尔曼等级相关是根据两列变量的成对等级差数计
第五章 相关系数
李金德
第一节 相关系数与散点图 第二节 积差相关 第三节 等级相关 第四节 质与量相关 第五节 品质相关 第六节 相关系数的选用与解释
第一节 相关系数与散点图
一、什么是相关?
(一)事物可能存在的关系
A
1.因果关系
A是引起B的原因,B是A导致的结果。
如:扁桃体发炎导致喉咙十分难受。
又如:努力学习让学习成绩得到了提高。
B
2.共变关系 表面看似有关系的两个事物,实际上是因为两者都与
第三个事物有关的缘故。 如:医疗设备越好居民患病率越高。 又如:研究发现携带火柴的数量与肺癌患病率正相关。
C
A
B
3相关关系 A与B在发展变化的方向与大小方面存在一定关系。 相关关系不同于因果关系,不能确定两者谁是因果;
2.从形状上看 直线相关 曲线相关
3.从相关程度上看 完全相关:A和B变化完全对应。表现为坐标上的一
条直线。
强相关:A变化时,B增大(或减少)的可能性非常大。 表现为散点图较为集中在某条直线的周围。
弱相关:A变化时,B增大(或减少)的可能性较少。 表现为散点图较为分散的集中在某条直线的周围。
Z x为X变量的标准分
Z y为Y变量的标准分
二、计算公式
3.运用原始数据计算积差相关
r
XY
X Y
Y
2
Y
N
2
或者
r
N XY XY
N X 2 X 2 NY 2 Y 2
例题5-1 试问身高与体重有无关系
第1栏
三、相关系数的合并
合并的步骤:
1.rZ,即先将各样本的相关系数r转化为Fisher Z分
数(查附表8);
2.求平均的Z分数:Z 的容量;
ni 3Zi ni 3
,其中n为每个样本
3.Zr,即用附表8再将平均的Z分数转化为平均的相 关系数。
第二节 等级相关
一、等级相关的意义 等级相关是根据等级资料来研究变量之间相互关系的
第2栏 实测记分
编号 身高 体重
第3栏 离差记分
dX
dY
第4栏 积差
d X dY
第5栏 标准记分
ZX
ZY
第6栏 标准积差
ZX ZY
X
Y
X X
Y Y
X X Y Y
dX SX
dY SY
d X×dY S X SY
1
170 72
0
3
2
165 69
-5
0
3
150 66
-20
-3
4
180 70
0
X
高负相关
0
X
零相关
第二节 积差相关
一、概念及适用范围
积差相关,是计算两个变量线性相关的一种方法,由 英国统计学家皮尔逊提出,因此也称为皮尔逊 (Pearson)相关。
适用范围:①数据成对
②两变量总体正态分布或接近正态分布
③两变量是连续变量
④两变量为线性关系
二、计算公式
1.运用标准差与离均差的计算公式
也有理由认为这两者不同时受第三个因素的影响,即 不存在共变关系。
但是,相关关系比较复杂,研究中研究者常常把相关 作为因果和共变关系的研究前奏。
(二)相关的类别 1.从方向上来判断 正相关——变化方向一致,“同增共减” 负相关——变化方向相反,“此增彼减” 零相关——变化没有趋势趋势
课堂练习:用原始数据计算积差相关
编号 1 2 3 4 5 求和
身高X 170 173 160 155 173 831
体重Y 50 45 47 44 50 236
X2
Y2
28900 2500
29929 2025
25600 2209
24025 1936
29929 2500
138383 11170
XY 8500 7785 7520 6820 8650 39275
10
1
5
185 68
15
-1
0
0
1.5
0.00
0
-0.41 0
0.00
60
1.63 -1.5
2.44
10
0.82 0.5
0.41
-15
1.22 -0.5
-0.61
850 345
0
0
55
—
—
2.24
解:采用标准分数计算积差相关 (1)先求标准分数
X 850 170 5
Y 345 69 5
SX
d
2 X
750 12.25
N
5
SY
dY2 20 2
N
5
(2)求两变量的积差 X X Y Y
(3)再求两变量标准分数的成绩 Z x Z y ,对其求
和: ZxZ y 2.24
(4)带入公式:
r 1 N
2.24 Z x Z y 5 0.45
算相关系数,又叫“等级差数法”。 条件:成对;线性相关;无正态假设;无大样本限定 结论:比皮尔逊积差相关应用范围广。
(二)计算公式
1.无相同等级时 (1)利用等级差值计算
6 D2
rs 1 N (N 2 1) N等级对数 D二列成对等级变量的等 级差数
(2)直接运用等级计算
r xy
NSxS y
x, y两个变量的离均差,x X X , y Y Y
N为成对数据的数目
Sx为X的标准差 Sy为Y的标准差
根据Sx
x2
N ,Sy
y2 ,r
N
xy x2 y2
二、计算公式
2.运用标准分数计算积差相关
r 1
N
ZxZ y