当前位置:文档之家› 第四章 相关测量法预测量层次

第四章 相关测量法预测量层次


LOGO
二、dy相关测量法(萨默斯Somers dy系数) Gamma系数属于对称相关测量法 如果认为某定序变项是自变项 (X), 另一个变项是因变项 (Y),最好采用 适宜于简化不对称关系的dy系数。
LOGO
N N dyx= N N T
s d s d
y
(x是自变量、y为因变量) 其中:Ns是同序对数 Nd是异序对数 Ty是只在因变量y上同分的对数
LOGO
①dyx 是非对称的测量 X Y ②-1dyx1 ③具有PRE意义
LOGO
个案众多时同序对、异序对及同分对的求法。 按X、Y由小到大排列的抽象的次数分布表: ns--同序对的数目;右下余子式 nd--异序对的数目;左下余子式 TY--Y的同分对的数目;同排后余子式
LOGO
dy=
Ns N d 6003 2204 N s N d Ty 6003 2204 4141
dy=0.308
LOGO
结论(1)婆媳冲突是与住户人口 密度成正比,即住户的人口密度 愈高会引起婆媳的冲突愈大,
(2)如果以住户人口密度的高低 预测估计婆媳冲突的大小,可以 消减30.8%的误差。
X 2 f12 f22 f32
Y
1 2 3
1
f11 f21 f31
3
f13 f23 f33
例:在某城市调查200户人家,想知道住户的人 口密度与婆媳冲突是否有关系。
交互分类之后的次数分布如下表:
LOGO
婆媳 冲突 高 中 低
住 高 23 11 8 中 20 55 27

密 低 4 28 24

LOGO
第一节 两个定类变量的相关
一、Lambda相关测量法(对称与不对称) 基本逻辑:以一个定类变量值来预测另一个变量 值时,若以众数作为预测的准则,则可减少的误 差是多少。
二、tau-y不对称相关测量法:
其特点是在计算系数值时会包括所有的边缘次数 和条件次数。
(一)Lambda的计算公式
LOGO
第四章 相关测量法与测量层次
如何选择相关测量法
1.考虑变量的测量层次; 2.注意两个变量的关系是否对称; 3.统计值的意义:
LOGO
具有“消减误差比例”(PRE)意义的统计 值在社会学研究中的应用比较广泛。 PRE也是一种相关测量法
LOGO
消减误差比例:
用一个现象来解释另一个现象时能够减少的错误的 比例;
婚姻状况 离婚 没离婚
社会流动 向上 向下 不变 20 10 8 2 2 58
合计 30 70
合计
30
10
60
100
LOGO
第二节 定序变量相关关系 Gamma, dy,rs
一、G系数
LOGO
Ns 同序对的数目 Nd异序对的数目
Ns Nd G Ns Nd
(一)G系数的特征
LOGO
D
E
3
1
1
2
“对”的概念
LOGO
1、总对数T=N(N-1)/2, N为个案数目。
当只有两个定序变量时,可能出现的对的种类有以下五 种(设:个案A在X上的等级为Xa,在Y上的等级为Ya, 个案B在X上的等级为Xb,在Y上的等级为Yb):
同序对Ns:Xa>Xb;Ya>Yb;
(1)只是要求X变化方向和Y的变化方向相同,不要求变化 的大小相同; (2)称变量A,B是同序对;
73 76 (50 54) 149 104 45 0.47 2 100 (50 54) 200 104 96
结论:如果以两个变项互相预测, 可以消减47%的误差。
LOGO
例2.
性别与某种社会态度的条件次数分布表
态度 容忍 反对 总数
性别 男 96 24 120 女 18 62 80

如果E2=0,说明以X来预测Y值不会产生任何的误差,二 者是全相关;


如果E2=E1,说明二者没有关系,则PRE取值为0
PRE数值的意义:表示用一个现象来解释另一个现象时, 能够减少百分之几的错误

PRE测量法的选择标准:变量测量层次
LOGO
两个变量关系的六种情况: 两个定类变量; 两个定序变量; 两个定距变量; 一个定类变量和一个定距变量; 一个定类变量和一个定序变量; 一个定序变量和一个定距变量;
价值取向 物质报酬 人情关系
制造业
职业 服务业
总数
105 40
45 25
150 65
总数
145
70
215
练习题: 为了研究饮食习惯与 地区之间的关系,做
LOGO
南方
北方
边缘 和
40
了共100人的抽样调
查,考察饮食习惯和 地区之间的关系程度
面食
10
30
如何(计算两个系
数)?并解释其PRE 意义?
米食
(3)如果单元A、B,变量x、y具有相同等级,则称为x、 y同分对;
LOGO
练习题: 列出右边单元数据的同序 对、异序对和同分对。
单元 A
B C D E
x 3
3 3 1 2
y 2
1 1 1 3
LOGO

总对数T=N(N-1)/2, N为个案数目。

当只有两个定序变量时,可能出现的对的种类有以下五
2、异序对Nd: Xa>Xb;Ya<Yb;
LOGO
(1)只是要求X变化方向和Y的变化方向相反,不要求变 化的大小相同; (2)称变量A,B是异序对; 3、X同分对Tx: Xa=Xb;Ya不等于Yb; (1)如果单元A、B,变量x具有相同等级,则称为x同 分对;
(2)如果单元A、B,变量y具有相同等级,则称为y同分 对;
种 (设:个案A在X上的等级为Xa,在Y上的等级为Ya,个 案B在X上的等级为Xb,在Y上的等级为Yb):
1.
同序对Ns:Xa大于Xb;Ya大于Yb;
2.
3. 4. 5.
异序对Nd: Xa大于Xb;Ya小于Yb;
X同分对Tx: Xa=Xb;Ya不等于Yb; Y同分对Ty: Xa不等于Xb;Ya=Yb; X与Y同分对Txy: Xa=Xb;Ya=Yb;
工作满足感与归属感
(G=0.28,dyx=0.19,dxy=0.18 )
归属感 工作满足感 低(1)中(2)高(3) 合计
低(1) 中(2) 高(3)
8 6 4
4 5 4
3 1 5
15 12 13
合计
18
13
9
40
Spss输入练习2 工人级别与月总收入(0.399)
LOGO
月总收入 高
高 67
级别 中 低 92 18
具有实际意义,常用于社会科学研究中;
基本公式:PRE=(E1-E2)/E1;
E1:当不知X值的分布时,仅以Y的集中趋势去
预测Y的每个值会产生的误差;
E2:用X预测Y,其误差E2会比E1小; 以X值预测Y值所减少的误差(E1-E2)与原误差
E1之比,就是PRE。
LOGO
PRE取值:
工种
技术工 非技术工 合计
二、Tau-y系数
LOGO
Tau-y系数属于不对称相关测量法,要求两个定类 变项中有一个是自变量(x)另一个是因变量(y)。其 数值介于0与1之间,具有消减误差比例意义。 即:(1) 不对称 (2) [0,1] (3) 具有PRE意义 (4) 定类测量层次
合计 177

低 合计
12
7 86
63
23 178
49
37 104
124
67 368
斯皮尔曼等级相关系数
LOGO
基本逻辑:求出在最大可能的等级差异总值中,实际 的等级差异所占的比例是多少; 对称相关测量法,要求同分的情况不多; 例题:见书上
LOGO
斯皮尔曼等级相关系数rs为:
rs 1
6 20 rs 1 2 1 2 0 n(n 1) 5(5 1)
可见,根据5户的资料计算,并不 存在等级相关
LOGO
例2. 为研究考试中学生交卷的名次是否 与成绩相关,进行12名学生的抽样调查:
交卷 1 名次 考试 成绩 2 3 4 5 6 7 8 9 10 11 12
行业 性别 轻工 重工 合计

男 合计
150
60 210
70
120 190
220
180 400
Lambda相关测量法(缺点)
LOGO
缺点:比较粗略,不够灵敏。它以众值为预测的准则,不 理会众值以外的次数分布。若众值集中在条件次数表上的 同一行或同一列,则Lambda相关系数为0。 工作岗位与工种 工作岗位 一线 二.三线 合计 160 7 167 129 61 190 289 68 357
LOGO
X与Y是非对称,选用dy Ns=23(55+28+27+24)+20(28+24)+11(27 +24)+55*24=6003 Nd=4(55+11+27+87)+20(11+8)+28(27+ 8)+55*8=2204 Ty=23(20+4)+20*4+11(55+28)+55*28+ 8(27+24)+27*24=4141
LOGO
LOGO
青年人与其知心朋友的志愿是相互影响 的,因此,自己志愿与知心朋友志愿是 对称关系。 已知 My=50, Mx=54,
相关主题