分类资料统计推断
表1 用药组和对照组的流感发病率
组别 观察人数 发病人数 发病率(%)
用药组
100
14
14.0
对照组
120
30
25.0
合计
220
44
20.0
此为两大样本率的比较,可用u检验。
假设检验过程:
设
α= 0.05
计算统计量u值:
u
p1 p2 p0 (1 p0 )(1/ n1 1/ n2 )
2.031
u
0.14 0.25
愈合率差别显著,呋喃硝胺的愈合率高于甲氰咪胍。
(2)四格表资料χ2检验应用注意:
①当n>40,且任意T≥5时,可 直接使用 四格表专用公式。
②当n>40,且任意1<T<5时,应计算校正χ2值
,其计算公式
为:
ad bc n 2 n
2
2
(a b)(c d )(a c)(b d )
例5. 某医生欲比较胞磷胆碱与脑益嗪治疗脑动脉硬化的疗效,观
312 51 80
142 1980
1
=14.29
确定P值,作结论:
查χ2界值表, 按υ=(R-1)(C-1)求得υ=
2,
, 2 0.005, 2
10.60
因而P <0.005 。按α=0.05水准,拒绝H0 ,可以认为两所医院
病例的梗塞部位的分布(构成比)不同,因而可比性较差。
例11 某市和某两县进行地方性甲状腺肿普查,查出各 型患者如表9,问三地间地方性甲状腺肿的型别构成是否不 同?
1、χ2检验的基本思想
例4:某医生用国产呋喃硝胺治疗十二指肠球部溃疡,以甲氰咪胍 作对照组,结果如表5,问两种方法治疗效果有无差别?
表2. 两种药物治疗十二指肠球部溃疡的效果
处理组
愈合
未愈合
合计
愈合率(%)
呋喃硝胺组
54(48.2)
8 (13.8)
62
87.10
甲氰咪胍组
44 (49.8)
20 (14.2)
传统疗法 162
43
205
79.02
新疗法
121
13
134
90.30
合计
283
56
339
83.48
2 162 13 43 1212339 = 7.47
205 134 56 283
3、行×列表(R×C表)资料的χ2检验
行×列表资料即基本数据在四个以上,如多个率的比较,其基本数 据为R行×2列;两组构成比的比较,其基本数据为2行×C列;多组构 成比的比较,其基本数据为R行×C列。
检验统计量计算公式为:
1)]
2 n
A2 nR nC
1
,[υ=(R-1)(C-
其应用条件是 T < 5 的格子数不超过 1/5 和没有任意格的 T<1 。 如果出现上述情况应作如下处理:
①根本办法是增加观察例数,使各格基本数据增大;②将T较小的 行或列与性质相近的行或列作合理的合并。
例9 某地在流行性脑脊髓膜炎流行期间进行了带菌 调查,结果如表7,问不同人群带菌率是否不同?
市级医院
65
52
13
80.00
乡镇医院
53
22
31
41.51
合计
118
74
44
62.71
采用χ2检验
2 52 31 13 222 118
65 53 44 74
= 18.50
例8 某医生用两种疗法治疗某病,结果如表6 ,问可 否认为新疗法优于传统疗法?
表6 两种疗法治疗某病治愈率比较
疗 法 治愈数 未治愈数 合计 治愈率(%)
P (1 P)
SP
n
Sp
0.25 (1 0.25) 0.0153 1.53 % 800
阳性率的95 % 可信区间为:
0.25 1.96 0.0153 , 0.25 1.96 0.0153
( 0.22 , 0.28 ) 或
25 % 1.96 1.53 % , 25 % 1.96 1.53 %
=
0.20 0.80 (1/100 1/120)
确定P值,作结论:
2可.5以7查5认8t为界, 因两值而组表发0中.病0,5率υ>=P不∞>同0时.,0,1用,u药则0.0组P5<发=α1病,.9拒率6绝低, uH于00.,对01接照=受组H,1, 说明该草药有预防流感的作用
三、χ2 检验
χ2检验(Chi-square test)用途极广,这里 仅介绍它在分类变量资料中用于推断两 个或两个以上总体率(或构成比)之间 有无差别或有无关联的分析方法。
察结果如表3,问两种药物的疗效有无差别?
处理组
有表效3.
两种药物治疗脑动脉硬化的疗效
无效
合计
有效率(%)
胞磷胆碱
41(38.18) 3(5.82)
44
93.18
脑益嗪
18(20.82) 6(3.18)
24
75.00
合计
59
9
68
86.76
表3显示有一个理论频数T< 5,因此应用校正χ2检验。
(3)四格表资料χ2检验与 u 检验的关系
例4:某医生用国产呋喃硝胺治疗十二指肠球部溃疡,以甲氰咪 胍作对照组,结果如表5,问两种方法治疗效果有无差别?
表2. 两种药物治疗十二指肠球部溃疡的效果
处理组
愈合
未愈合
合计 愈合率(%)
呋喃硝胺组Leabharlann 54862
87.10
甲氰咪胍组
44
20
64
68.75
合计
98
28
126
77.78
假设检验过程:
设 H0 :1 2
地区 表9弥不漫同型地区地结方节性型甲状腺混肿合的型型别分布合计
某市 14791
4815
1509 21115
甲县
486
2
4
492
乙县
133
260
51
444
合计 15410
5077
1564 22051
检验方法同例10 。
甲 63
20
5
88
乙 35
31
14
80
合计 98
51
19
168
采用R×C表资料χ2检验。
设 H0:两所医院病例的梗塞部位的总体分布(构成比)相同 H1:两所医院病例的梗塞部位的总体分布(构成比)不同 α= 0.05
计算统计量χ2值
2
168
632 9888
202 51 88
52 1988
352 9880
(2)两个样本率比较
检验统计量计算公式如下:
u
p1 p2
p0 (1 p0 )(1/ n1 1/ n2 )
u p1 p 2 (1/ n1 1/ n2 ) / 2 p0 (1 p0 )(1/ n1 1/ n2 )
式中P0为合并阳性率,P0 =(X1 + X2)/(n 1 + n 2 )
例3 某中药研究所试用某种草药预防流感,观察用药 组和对照组(未用药组)的流感发病率,结果如下表,问两 组的流感发病率是否不同?
分类资料的统计推断
一、率的抽样误差与标准误
抽样研究所得的率同样存在抽样误差, 描述其大小的指标是率的标准误(standard error of proportion),其计算公式如下:
当 已知时 p
(1)
n
当 未知时
SP
P (1 P) n
二、总体率的估计和率的u检验
1、总体率的估计:
总体率的估计有两种方法,一是正态分布法,二是 查表法。 ★正态分布法 适用于样本较大,且p和/或1-p都不太小, 如np和n(1-p)都大于5时。计算公式为:
,
因而P <0.005 。按α=0.05水准,拒绝H0 ,可以认为不同人 群带菌率不同或不全相同。
例10 两个医院合作进行脑梗塞疗效试验中,各医院受试 病例的脑梗塞部位如表8所示,问两所医院病例的梗塞部位 的分布(构成比)是否不同?
表8 甲乙两医院病例的脑梗塞部位的分布
医院 皮层 基底节 混合型 合计
四格表资料即基本数据只有四个,为两行两列,如 两个率的比较。
检验统计量专用计算公式为:
2
ad bc2 n
(a b)(c d)(a c)(b d)
1)]
,[υ=(R-1)(C-
式中a , b , c , d 分别代表四个实际频数,n 为总例数;υ 为自由度,R为行数,C为列数。
(1)四个表资料χ2检验实例 :
α= 0.05
H1 :1 2
计算统计量χ2值:
2
54 20 8 44
62 6498
2126 28
6.13
确定P值,作结论:
查χ2界值表中,υ=
1
时,
χ2 0.05,1
=
3.84
,
χ2 0.01,1
=
6.63
,
因而
0.05 >P >0.01 , 即 P<α, 因而拒绝 H0 , 接受 H1 , 可以认为两组溃疡
p u sp , p u sp
★查表法 适用于小样本。利用样本含量n和阳性数x查 “百分率的可信区间”表获得。
例1 检查居民800人粪便中蛔虫阳性200人,阳性率为25 %,试求 当地居民粪便蛔虫阳性率的95 % 可信区间和99 % 可信区间。
公式:
p u sp , p u sp
其中, 即:
表7 某地流行性脑脊髓膜炎流行期不同人群带菌率
职 业 调查人数 阳性数 阴性数 阳性率(%)