当前位置:
文档之家› 社会统计学第四章相关测量法与变量层次
社会统计学第四章相关测量法与变量层次
▪ Lambda 相关测量法有两种形式。一种是对称形式 ,简写是λ系数,即不分自变量与因变量。另一种 是量不 ,对 一称 个形 是式 因, 变简量写。是λy系数,即要求一个是自变
2020/12/1
3
λ系数
E1的定义:
未知y与x有关之前,如果预测y值,唯一可资依据的就是y本 身的分布。由于y与x无关,所以只能根据y的行边缘和(与x 无关)去预测y,也即由y的行边缘和中最大者——众值,去 预测y,可能性最大。
2020/12/1
7
λ系数与尤拉Q系数
Q adbc 9 09-01 010 80 00.9 07 adbc 9 09 01 0108200
my My nMy
( 9 09) 0 -100 80 0 .8 20 -1 000100
2020/12/1
8
λ系数的缺点
Lambda相关测量法的特点是以众值作为预测的准则,不理会 众值以外的次数分布。因此,如果全部众值集中在条件次数 表的同一列或同一行中,则Lambda系数便会等于0.
Gamma系数
▪ 级序相关法的基本逻辑是要求出;根据任何两个 个案在某变量上的等级来预测他们在另一个变量 上的等级时,可以减少的误差是多少。
▪ 同序对与异序对:假设样本的全部个案数目是n ,就会组成1/2n(n-1)对个案。某对个案在两个变 量上的相对等级时相同,则成为同序对;如果是 不相同,则成为异序对。
表 青年人与其知心朋友的志愿
mx2n (m M yx(M Mxy)My) ( 2 8 4 ( 2 4 1 ) 1 ( 2 ) 0 ( - 5 8 4 0 4 5 7 1 ) ) ( -0 5 4 5) 0 0 .4
y
my My nMy
( 2 84 17 ) -5 02 60.52 10 -500 50
E 2
50
3 50
ta-u yE 1E23.5 73 30.12
E 1
3.5 7
2020/12/1
11
练习题1
▪ 题:以下是某高校对高、低年级学生求职意愿的抽 样调查。问:(1)计算不对称Lambda系数;(2) 计算tau-y系数;(3)建立条件百分表。
2020/12/1
12
第二节 两个定序变量
▪ 假设积极性等级是x,产量是Y,求dy
G Ns Nd Ns Nd
▪ 其中:Ns 是同序对数,Nd异序对数。 ▪ G的绝对值越大,就表示所犯的错误可能性越小
,G是负值,则如果知道一对个案在某个变量的 相对等级,就应该估计他们在另一个变量上的相 对等级是相反的。反之亦然。
2020/12/1
16
求下表G系数
G Ns Nd Ns Nd
其中: nn=全部个案书目, nf=某条件次数 nFy=Y变量的某个边缘次数 nFx=X变量的某个边缘次数
10
再以饮食习惯表为例:
E 1 ( 11 0 2 0 0 )2 5 0 5 ( 11 0 7 0 0 ) 7 5 0 5 3.5 7
( 5 5 0 ) 5 ( 5 4 0 ) 4 5 ( 5 2 0 ) 2 0 ( 5 0 3 0 ) 3 00
4-3 0.14 43
nG系数是属于对称相关测量法。如果是非对称,即一个是
自变量,一个是因变量,则适宜于简化不对称关系的萨默
2020斯/12/d1 y系数。
17
萨默斯dy系数
▪ dy的计算公式如下:
dy
Ns Nd Ns Nd Ty
▪ 其中:Ns 是同序对数,Nd异序对数,Ty是 只在因变量上同分的对数。
y
my My nMy
(4530) -750 10-075
2020/12/1
9
tau-y相关测量法
tau-y是不对称相关测量法,这个方法是在
计算系数值时会包括所有的边缘次数和条
件次数。
E 1
(n F y )F y n
E 2
(Fx f ) f Fx
tau - y
2020/12/1
E1 E 2 E1
社会统计学第四章相关测量法与变量层次
相关测量的六种情况
▪ 两个定类变量 ▪ 两个定序变量 ▪ 两个定距变量 ▪ 一个定类变量与定序变量 ▪ 一个定类变量与定距变量 ▪ 一个定序变量与定距变量
2020/12/1
2
第一节 两个定类变量
Lambda 相关测量法
▪ 基本逻辑是计算以一个定类变量的值来预测另一个 定类变量的值时,如果以众值作为预测的准则,可 以减除多少误差。消减的误差在全部误差中所占的 比例愈大,就表示这两个变量的相关越强。
E1 = n – max(n*j) (即总频次n减去y的行边缘和中最大者) 分析: (值极1)大E,1 =异0众(比E率1最为小0,)此当时m众ax值(n代*j) 表= n性时最,高E,1 故= 0E。1为也0即。众 (众值2)为E01,=异n众(比E1率最最大大),当此m时ax众(n值*j)代= 表0 时性,最E低1,= 故n。E1也为即n。
2020/12/1
4
E2的定义:
当已知y与x有关之后,如果再去预测y值,则可借 助x预测y。即用各类x条件下,y的条件分布中的 众值去预测y,可能性最大。
分析:
E2 = n —∑max(nij)
1)E2 = 0 (即∑max(nij) = n,即各类x条件下的 众值皆为最大值)
2)E2 = n (即∑max(nij) = 0,即各类x条件下的 众值皆为最小值)
2020/12/1
13
同序对与异序对
2020/12/1
14
同分对
两个个案在某变量上 次序相对,无法分高 低,即同分对。通常 以Tx代表只在X变量上 同分的对数,以Ty代 表只在Y变量上同分的 对数,而以Txy代表在 两个变量上都是同分 的对数。
2020/12/1
15
Gamma系数
Gamma系数的计算公式如下:
2020/12/1
5
λ系数计算公式
m x m y(M xM y) 2n(M xM y)
yE 1E 1E 2(nM y (n ) (M n y) m y)n m yM M yy
其中,My=Y变量的众值次数, Mx=X变量的众值次数 my=X变量的每个值(类别)之下Y变量的众值次数 mx=Y变量的每个值(类别)之下X变量的众值次数