当前位置：文档之家› 分类资料统计推断

分类资料统计推断

表1 用药组和对照组的流感发病率
组别观察人数发病人数发病率（%）
用药组
100
14
14.0
对照组
120
30
25.0
合计
220
44
20.0
此为两大样本率的比较，可用u检验。
假设检验过程：
设
α= 0.05
计算统计量u值：
u
p1 p2 p0 (1 p0 )(1/ n1 1/ n2 )
2.031
u
0.14 0.25
愈合率差别显著，呋喃硝胺的愈合率高于甲氰咪胍。
（2）四格表资料χ2检验应用注意：
①当n>40，且任意T≥5时，可直接使用四格表专用公式。
②当n>40，且任意1<T<5时，应计算校正χ2值
，其计算公式
为：
ad bc n 2 n
2
2
(a b)(c d )(a c)(b d )
例5. 某医生欲比较胞磷胆碱与脑益嗪治疗脑动脉硬化的疗效，观
312 51 80
142 1980
1
=14.29
确定P值，作结论：
查χ2界值表, 按υ=（R-1)(C-1）求得υ=
2，
， 2 0.005, 2
10.60
因而P <0.005 。按α=0.05水准，拒绝H0 ，可以认为两所医院
病例的梗塞部位的分布（构成比）不同,因而可比性较差。
例11 某市和某两县进行地方性甲状腺肿普查，查出各型患者如表9，问三地间地方性甲状腺肿的型别构成是否不同？
1、χ2检验的基本思想
例4：某医生用国产呋喃硝胺治疗十二指肠球部溃疡，以甲氰咪胍作对照组，结果如表5，问两种方法治疗效果有无差别？
表2. 两种药物治疗十二指肠球部溃疡的效果
处理组
愈合
未愈合
合计
愈合率（%）
呋喃硝胺组
54（48.2）
8 (13.8)
62
87.10
甲氰咪胍组
44 (49.8)
20 (14.2)
传统疗法 162
43
205
79.02
新疗法
121
13
134
90.30
合计
283
56
339
83.48
2 162 13 43 1212339 = 7.47
205 134 56 283
3、行×列表(R×C表)资料的χ2检验
行×列表资料即基本数据在四个以上，如多个率的比较，其基本数据为R行×2列；两组构成比的比较，其基本数据为2行×C列；多组构成比的比较，其基本数据为R行×C列。
检验统计量计算公式为：
1）]
2 n
A2 nR nC
1
，[υ=（R-1）（C-
其应用条件是 T < 5 的格子数不超过 1/5 和没有任意格的 T<1 。如果出现上述情况应作如下处理：
①根本办法是增加观察例数，使各格基本数据增大；②将T较小的行或列与性质相近的行或列作合理的合并。
例9 某地在流行性脑脊髓膜炎流行期间进行了带菌调查，结果如表7，问不同人群带菌率是否不同？
市级医院
65
52
13
80.00
乡镇医院
53
22
31
41.51
合计
118
74
44
62.71
采用χ2检验
2 52 31 13 222 118
65 53 44 74
= 18.50
例8 某医生用两种疗法治疗某病，结果如表6 ，问可否认为新疗法优于传统疗法？
表6 两种疗法治疗某病治愈率比较
疗法治愈数未治愈数合计治愈率（%）
P (1 P)
SP
n
Sp
0.25 (1 0.25) 0.0153 1.53 % 800
阳性率的95 % 可信区间为：
0.25 1.96 0.0153 , 0.25 1.96 0.0153
（ 0.22 , 0.28 ）或
25 % 1.96 1.53 % , 25 % 1.96 1.53 %
=
0.20 0.80 (1/100 1/120)
确定P值，作结论：
2可.5以7查5认8t为界, 因两值而组表发0中.病0，5率υ>=P不∞>同0时.，0，1用,u药则0.0组P5＜发=α1病,.9拒率6绝低, uH于00.,对01接照=受组H，1, 说明该草药有预防流感的作用
三、χ2 检验
χ2检验(Chi-square test)用途极广，这里仅介绍它在分类变量资料中用于推断两个或两个以上总体率（或构成比）之间有无差别或有无关联的分析方法。
察结果如表3，问两种药物的疗效有无差别？
处理组
有表效3.
两种药物治疗脑动脉硬化的疗效
无效
合计
有效率（%）
胞磷胆碱
41（38.18） 3（5.82）
44
93.18
脑益嗪
18（20.82） 6（3.18）
24
75.00
合计
59
9
68
86.76
表3显示有一个理论频数T< 5，因此应用校正χ2检验。
（3）四格表资料χ2检验与 u 检验的关系
例4：某医生用国产呋喃硝胺治疗十二指肠球部溃疡，以甲氰咪胍作对照组，结果如表5，问两种方法治疗效果有无差别？
表2. 两种药物治疗十二指肠球部溃疡的效果
处理组
愈合
未愈合
合计愈合率（%）
呋喃硝胺组Leabharlann 54862
87.10
甲氰咪胍组
44
20
64
68.75
合计
98
28
126
77.78
假设检验过程：
设 H0 :1 2
地区表9弥不漫同型地区地结方节性型甲状腺混肿合的型型别分布合计
某市 14791
4815
1509 21115
甲县
486
2
4
492
乙县
133
260
51
444
合计 15410
5077
1564 22051
检验方法同例10 。
甲 63
20
5
88
乙 35
31
14
80
合计 98
51
19
168
采用R×C表资料χ2检验。
设 H0：两所医院病例的梗塞部位的总体分布（构成比）相同 H1：两所医院病例的梗塞部位的总体分布（构成比）不同 α= 0.05
计算统计量χ2值
2
168
632 9888
202 51 88
52 1988
352 9880
（2）两个样本率比较
检验统计量计算公式如下：
u
p1 p2
p0 (1 p0 )(1/ n1 1/ n2 )
u p1 p 2 (1/ n1 1/ n2 ) / 2 p0 (1 p0 )(1/ n1 1/ n2 )
式中P0为合并阳性率，P0 =（X1 + X2）/(n 1 + n 2 )
例3 某中药研究所试用某种草药预防流感，观察用药组和对照组(未用药组)的流感发病率，结果如下表，问两组的流感发病率是否不同？
分类资料的统计推断
一、率的抽样误差与标准误
抽样研究所得的率同样存在抽样误差，描述其大小的指标是率的标准误(standard error of proportion)，其计算公式如下：
当已知时 p
(1)
n
当未知时
SP
P (1 P) n
二、总体率的估计和率的u检验
1、总体率的估计：
总体率的估计有两种方法，一是正态分布法，二是查表法。 ★正态分布法适用于样本较大，且p和/或1-p都不太小，如np和n(1-p)都大于5时。计算公式为：
，
因而P <0.005 。按α=0.05水准，拒绝H0 ，可以认为不同人群带菌率不同或不全相同。
例10 两个医院合作进行脑梗塞疗效试验中，各医院受试病例的脑梗塞部位如表8所示，问两所医院病例的梗塞部位的分布（构成比）是否不同？
表8 甲乙两医院病例的脑梗塞部位的分布
医院皮层基底节混合型合计
四格表资料即基本数据只有四个，为两行两列，如两个率的比较。
检验统计量专用计算公式为：
2
ad bc2 n
(a b)(c d)(a c)(b d)
1）]
，[υ=（R-1）（C-
式中a , b , c , d 分别代表四个实际频数，n 为总例数；υ 为自由度，R为行数，C为列数。
（1）四个表资料χ2检验实例：
α= 0.05
H1 :1 2
计算统计量χ2值：
2
54 20 8 44
62 6498
2126 28
6.13
确定P值，作结论：
查χ2界值表中，υ=
1
时，
χ2 0.05，1
=
3.84
,
χ2 0.01,1
=
6.63
,
因而
0.05 >P >0.01 , 即 P＜α, 因而拒绝 H0 , 接受 H1 , 可以认为两组溃疡
p u sp , p u sp
★查表法适用于小样本。利用样本含量n和阳性数x查 “百分率的可信区间”表获得。
例1 检查居民800人粪便中蛔虫阳性200人，阳性率为25 %，试求当地居民粪便蛔虫阳性率的95 % 可信区间和99 % 可信区间。
公式：
p u sp , p u sp
其中，即：
表7 某地流行性脑脊髓膜炎流行期不同人群带菌率
职业调查人数阳性数阴性数阳性率（%）

e商务文档

分类资料统计推断

相关文档推荐：