计数资料的相关分析
字体[大][中][小]对计数资料作相关分析的目的是推断两因素间有无相关关系,常用x2检验;必要时再进一步确定相关的密切程度,常用列联系数来说明。
分析时常按配对设计,将单一样本的每一观察单位同时按两种因素(如两种检验方法、两种治疗方法或两种特征等)的不同水平(如类别、等级、程度等)分组。
如甲因素有R个水平,乙因素有C个水平,分组后即得R×C 列联表。
如表1为R与C均等于2的2×2表,有a、b、c、d四个基本数据,特称为四格表。
表3为3×3表。
四格表资料的相关分析推断两因素间有无相关关系一般用x2检验,可按式(1)计算统计量x2值。
式中a、b、c、d为实际频数或对子数,n为样本含量或总对子数。
条目“两样本率比较”中,计算x2值的其他公式亦可选用。
算得x2值后,查x2界值表得P值,按所取检验水准作出推断结论。
当样本含量甚小时宜用四格表的确切概率法直接计算P值(见条目“四格表的确切概率法”)。
经假设检验推断两因素间有相关关系,若须进一步说明相关的密切程度,可按式(2)或式(3)计算相关系数(亦称列联系数) r或rn。
类似普通相关系数,其值在-1与+1之间。
绝对值愈大,相关程度愈高;等于1为完全正相关,等于-1为完全负相关,等于0为无相关。
式中a、b、c、d的意义同式(1)。
K. H. Ives和J. D. Gibbon提出用
式中符号意义同式(1),(a+d)为反应相同的对子数,(b+c)为反应不同的对子数。
由式(3)可见:如例1,若所有对子两法结果全相同,即b、c均为零,则rn=1,为完全正相关;若所有对子两法结果全不同,即a、d均为零,则rn=-1,为完全负相关;若结果相同与结果不同的对子数各占1/2,即α+d=b+c,则rn=0,为无相关。
例1 就表1资料说明两种方法检查食品沙门菌的结果是否一致。
表1用两法检查同一批鸭样的结果
荧光抗体法常规培养法合计
+ -
+ - 160(a)
5(c)
26(b)
48(d)
186
53
合计165 74 239
(1) 推断相关关系:
H0:两法无相关,
H1:两法有相关。
α=0.05。
按式(1)
查x2界值表得P<0.005,按α=0.05水准拒绝H0,接受H1。
说明两法检查结果有相关,用荧光抗体法检查为阳性的其常规培养法的阳性率亦高。
(2)确定相关的密切程度:按式(2)
或按式(3)
例2 就表2资料说明拍胸部X线片和痰结核菌培养两种检查方法之间的相关关系。
表2 16例肺结核患者分别用两种方法检查的结果
X 线片痰培养合计
+ -
+ - 7(a)
1(c)
2(b)
6(d)
9
7
合计8 8 16
(1)推断相关关系:本例样本含量较少,宜用四格表的确切概率法。
H0:两法无相关,H1:两法有相关。
α=0.05。
按α=0.05水准拒绝H0,接受H1。
说明肺结核患者胸部X线片和痰结核菌培养两种检查的结果有相关。
(2)确定相关的密切程度:按式(2)
或按式(3)
R×C表资料的相关分析推断两因素间有无相关关系常用x2检验,可按式(4)计算统计量x2值。
式中A为R×C表中每格的实际频数或对子数,nR与nC分别为实际频数所在行R、列C的合计,n为样本含量或总对子数,R为行数,C为列数。
条目“样本构成比的比较”中,计算x2的其他公式亦可选用。
算得x2值后,查x2界值表得P值,按所取检验水准作出推断结论。
经x2检验推断两因素间有相关关系,若须进一步说明相关的密切程度,可在计算x2值的基础上,按式(5)或式(6)计算列联系数。
其值在0~1之间,0表示完全独立,1表示完全相关,愈近于0,说明几乎没有关系,愈近于1,说明关系愈密切。
列联系数有多种,常用的如下:
(1) Pearson列联系数(P)
(2) Cramér (修正)列联系数(C)
式中x2为R×C表的x2值,n为样本含量,min(R-1,C-1)表示取(行数-1)或(列数-1)中的较小值。
例3 以眼为单位观察20岁以上居民眼睛的晶状体点状混浊程度与年龄间的关系,得资料见表3,试分析两者之间的相关关系。
表3 某地居民眼晶状体混浊度与年龄的关系
年龄(岁) 晶状体混浊程度合计
+ ++ +++
20~30~40~215
131
148
67
101
128
44
63
132
326
295
408
合计494 296 239 1029
(1)推断相关关系:
H0:晶状体的混浊度与年龄无关(即相互独立),
H1:晶状体的混浊度与年龄有关。
α=0.05。
按式(4)
查x2界值表得P<0.005,按a=0.05水准拒绝H0,接受H1。
说明晶状体混浊度与年龄之间存在相关。
(2) 确定相关的密切程度:按式(5)。