当前位置:文档之家› 10-医学统计学卡方检验

10-医学统计学卡方检验


配对四格表资料的χ2检验
概述 计数资料的配对设计常用于两种检验方法、培养方法、 诊断方法的比较。 特点是对样本中各观察单位分别用两种方法处理,然 后观察两种处理方法的某两分类变量的计数结果,整理为
一致:a(+)和 d(-);不一致:b(甲+,乙-) 和 c(甲-,乙+)。
概述
配对四格表资料的χ2检验,又称为McNemar test检验。
卫生部“十二五”规划教材
医学统计学
χ2检验
χ2 检验
是现代统计学的创始人之一,英国统 计学家Karl Pearson于1900年提出的一种 具有广泛用途的假设检验方法。常用于 推断两个总体率(或构成比)之间有无 差别。
四格表资料的χ2检验
基本思想
实际频数(actual frequency,A):a、b、c、d 理论频数(theoretical frequency,T )
多个样本率间多重比较
采用Bonferroni法进行多个样本率的两两比较,步骤如下:
• 对需要比较的行×列表资料进行χ2分割,变成多个四格 表;
• 对每个四格表进行χ2检验; • 采用(α‘=α/比较次数 )计算调整的水准,其中α为事
先确定的水准; • 以α‘调整作为检验检验水准,作出结论。
多组间的两两比较
2 n(
A2 nR nC
- 1) ,
(行数 - 1)(列数 - 1)
【例】某研究者欲比较甲、乙、丙3家医院住院病人院 内感染情况,随机抽查同一时期各医院住院病人院内感 染情况结果见表。试比较三家医院院内感染率有无差别。
医院
感染
未感染
合计

43
188
231

19
170
189

15
151
• T<1或n<40,用四格表资料的Fisher确切概率法。
【例】某医生研究比较A、B两种药物对急性细菌性肺炎 的疗效,甲药治疗42例,有效40例, 乙药治疗22例,有 效16例。问两种药物的疗效差别有无统计学意义?
处理 A药 B药 合计
有效 40(36.75) 16 (19.25)
56
无效 2(5.25) 6(2.75)
2
(
AT
0.5)2
T
2 ( ad bc n / 2)2 n
(a b)(c d)(a c)(b d)
四格表资料χ2检验的校正公式
在实际工作中,对于四格表资料,通常规定:
• T≥5,且n≥40时,直接计算χ2值,用基本公式或专用 公式;
• 1≤T<5,且n≥40时,用连续性校正公式( continuity correction ),或四格表资料的Fisher确切概率法;
假设H0:πA=πB=π,即A组与B组治疗的总体有效率相等
A组:理论有效者=(a+b)×(a+c)/n; 理论无效者=(a+b)×(b+d)/n
B组:理论有效者=(c+d)×(a+c)/n; 理论无效者=(c+d)×(b+d)/n
TRC

nR nc n
TRC为第R行第C列的理论频数,nR为相应行的合计, nC为相应列的合计。


k( k

1) / 2
实验组与同一对照组的比较


k
1
【例】某医院用三种穴位针刺治疗急性腰扭伤,结果见 表。试比较三种穴位针刺效果有无差别。
穴位 后溪穴 人中穴 腰痛穴
合计
治愈数 80 20 24 124
未愈数 18 20 38 76
合计 98 40 62 200
穴位 后溪穴 人中穴 合计
【例】用两种血清学方法对100例肝癌患者进行检测,有 关检测结果见表。问两种血清学方法检测结果有无差别?
甲法
+ 合计
乙法
+
-
50
32
15
3
65
35
合计
82 18 100
⑴H0 :b = c,两种方法检出率相同;H1 :b≠c; α=0.05

2 32 152 6.14
32 15
⑵计算各组合概率 在四格表周边合计数不变的条件下,共有“周边合计
数中最小数+1”中组合。
组合i Pi
1
23
45
6
0 16 1 15 2 14 3 13 4 12 5 11
5 6 4 7 3 8 2 7 1 10 0 11
0 . 0 0 5 7 2 20 . 0 6 5 4 0 30 . 2 4 5 2 6 20 . 3 8 1 5 1 90 . 2 4 7 9 8 70 . 0 5 4 1 0 6
(b
c) 40, 2

(b b
c)2 c
,
1
(b
c)<40, 2
(b

c 1)2 b c
,
1
由于该检验只考虑了不一致的情况(b与c),而未考虑 样本含量n及一致结果(a与d)。因此,当n很大且两法一 致率较高(即a与d数值较大),b与c的数值相对较小时, 即使检验结果有统计学意义,但实际意义并不大。
⑶ 2 0.0 5,1

3.84

2 ,则P<0.05,拒绝H0 ,接受H1
R×C列联表资料的χ2检验
概述
行×列表资料的χ2检验,用于多个样本率的比较、 两个或多个构成比的比较。
基本数据为: ⑴多个样本率比较时,有R行2列; ⑵两个样本构成比比较时,有2行C列; ⑶多个样本构成比比较时,有R行C列。
166 509
⑶ 2 0.0 5,2
5.99
2
,则P<0.05,拒绝H0 ,接受H1 ,
故可认为甲、乙、丙三家医院院内感染率总体有差别。
多个样本率间多重比较
进行多个样本率比较时,如果拒绝H0 ,多个样本 率间差异有统计学意义,表明至少有某两个率之间 有差异。为了获得哪两个率之间有差异,需要进行 多个率的两两比较。
a、若有1/5以上的格子出现1≤T<5,则 • 增大样本含量,以达到增大理论频数的目的; • 结合专业,删去理论频数太小的格子对应的行或列; • 结合专业,将理论频数太小的行或列与性质相近的行 或列合并; • 用双向无序R×C表资料的Fisher确切概率法。
行×列表 χ2检验注意事项
b、多个样本率比较,若统计推断为拒绝H0 ,接受H1 , 只能认为各总体率或构成比之间总的来说有差别。若要 进一步了解哪两者之间有差别,可用卡方分割法,或者 调整检验水准。
⑶确定P值,作出结论
原样本四格表对应的概率为P3=0.245262,小于或等于 P3的四格表为i=1,2,3,6,故双侧检验P值为
P =P1+ P2 + P3 + P6 =0.370 > 0.05,不拒绝H0 。
左侧概率为P =P1+ P2 + P3 =0.316,右侧概率为P =P3+ P4 + P5 + P6 =0.929,故单侧检验P值为0.316。
d)!
“!”为阶乘符号,n !=1×2×…×n,0 !=1,∑Pi=1。
【例】某医生用新旧两种药物治疗某病患者27人,治疗 结果见表。问两种药物的疗效有无差别?
组别 旧药 新药 合计
治愈数 2 3 5
未愈数 14 8 22
合计 16 11 27
治愈率(%) 12.5 27.3 18.5
⑴设H0 :π1=π2 ,即两药疗效相同;H1 : π1≠π2 α=0.05
T
大小。ν愈大, χ2值也越大。
自由度取决于可以自由取值的基本格子数,而不是样 本含量。
对于四格表资料( ν=1),计算一个理论值TRC后,其他 3个理论值可用周边合计数减去相应的理论值T得出。
χ2检验的自由度
• χ2检验,根据自由度ν和检验水α准查表得χ2界值。
• 当ν确定后, χ2分布曲线下右侧尾部的面积为α时,横
166
合计
77
509
586
⑴设H0 :三家医院院内感染率相同;H1 : 感染率不同; α=0.05
⑵ 2 586 ( 432 188 2 19 2 170 2 152
231 77 231 509 189 77 189 509 166 77
151 2

1) 10.09
治愈数 80 20 100
未愈数 18 20 38
合计 98 40 138
穴位 人中穴 腰痛穴
合计
治愈数 20 24 44
穴位 后溪穴 腰痛穴 合计
治愈数 80 24 104
未愈数 18 38 56
未愈数 20 38 58
合计 40 62 102
合计 98 62 160
⑴设H0 :任意两个对比组的总体治愈率相等;H1 : 总体 治愈率不等; α=0.05
6.4 8
⑶ 2 0.0 5,1

3.84

2
,则P<0.05,拒绝H0 ,接受H1 ,
故认为甲、乙两药的疗效不同,乙药疗效要好于甲药。

四格表资料χ2检验的校正公式
χ2分布是一种连续性分布,而计数资料属离散性分布, 由此得到的统计量也是不连续的。为改善χ2统计量分布的 连续性,英国统计学家Yates F建议将实际频数和理论频 数之差的绝对值减去0.5以作校正。

2 0.0
1
6
7,1
,故可认为后溪穴与人中穴、后溪穴与
腰痛穴治愈率之间有统计学意义,而人中穴与腰痛穴治愈
率之间无统计学意义。
若把人中穴针刺治疗急性腰扭伤设为对照组,另两组 为试验组,则
相关主题