当前位置:文档之家› 分类变量相关系数

分类变量相关系数

NY
r系数
• 两个定距或定比变量之间的相关测定,最常 用的是积差系数。它是由英国统计学家皮尔 逊(Pearson)用积差方法推导出来的,也 称皮尔逊相关系数,用符号r表示。相关系 数r本身不具有消减误差意义,但是有这一 意义。r的取值范围在-1—1之间。用它判断 两变量间的相关程度,一般有四个标准:
2
Y
j
2
FX
i
N
F
N
Y
j

FY ——因变量Y边缘分布次数平方和。
j 2

系数
• 系数适用于两个定序变量的相关测定,取值 范围-1—+1之间,不具备消减误差比例意义。当 计算值为正,表示变量间正相关;计算值为负, 表示变量间负相关。讨论定序变量的相关测度时, 就是从两变量的变化顺序是否一致或等级之间的 差别去考虑。 系数便属于等级相关。其计算公 2 式为: 6 D 1 2 N ( N 1) • D——两变量中,每对X和Y等级之差,这个差的 正值之和应等于负值之和。

f im

f im FY m N YY m
——x每一类别中Y分布的众数次数; FYm ——Y边缘分布中的众数次数; N ——总体单位数。
系数
• 测定法适用于两个定类变量,或一个定类一 个定序变量的相关测度。取值范围在0-1之间。 计算公式为:


f ij
2



F
N
系数
2
• 系数适用于一个定序变量一个定距变量的相关 分析。取值范围在0-1之间,具有消减误差比例的 意义。计算公式为:
2

2


2
i
N iY Y
2
NY
2
2
N i ——每一类X的单位数; N ——全部单位数; Y i ——每一类X中Y值得算术平均数; Y ——全部Y值得算术平均数。
• r的计算公式为:
( x x )( y y ) r
n x y



• x —x变量的平均数; y —y变量的平均数; • x —x变量的标准差; y —y变量的标准差; • n —全部单位数。 因为 2


x
x

(x x) n
y

( y y) n

2
所以上式又可以变为:
r
( x x )( y y ) Байду номын сангаас (x x) ( y y)
2 2

谢谢!
分 类 变 量 的 相 关 系 数
• 系数 • 系数 • 系数 • G 系数 2 • 系数 • r 系数
系数
• 测定法系数适用于两个定类变量的相关测定, 具有消减误差比例的意义,取值范围在0-1之间。 值越大,表明X和Y两变量的相关程度越大;反 之,则越小。 测定法的计算公式为:
G系数
• G系数适用于两个定序变量的相关测定,取值范围 在-1—+1之间,具有消减误差比例意义。这种测 定方法主要是从两变量的变化顺序是否一致去思 考问题。其计算公式为:
G NS Nd NS Nd
N S ——X和Y两变量变化顺序一致的数目,即同
序对数目; N d ——X和Y两变量变化顺序相反的数目,即异 序对数目。
分类变量
• 分类变量的定义 指地理位置、人口统计等方面的变量, 其作用是将调查响应者分群。其变量值是 定性的,表现为互不相容的类别或属性。
分类变量的分类
• (1)无序分类变量(unordered categorical variable) 无序分类变量是指所分类别或属性之间无程 度和顺序的差别。它又可分为①二项分类,如性 别(男、女),药物反应(阴性和阳性)等;② 多项分类,如血型(O、A、B、AB),职业(工、 农、商、学、兵)等。对于无序分类变量的分析, 应先按类别分组,清点各组的观察单位数,编制 分类变量的频数表,所得资料为无序分类资料, 亦称计数资料。
• (2)有序分类变量(ordinal categorical variable) 有序分类变量各类别之间有程度的差别。如尿 糖化验结果按-、±、+、++、+++分类;疗效按 治愈、显效、好转、无效分类。对于有序分类变 量,应先按等级顺序分组,清点各组的观察单位 个数,编制有序变量(各等级)的频数表,所得 资料称为等级资料。
相关主题