当前位置：文档之家› 祝晓明《医学统计学》医统-第九章卡方检验共58页

祝晓明《医学统计学》医统-第九章卡方检验共58页

×Ô ÓÉ ¶È £½ 3
0.1
×Ô ÓÉ ¶È £½ 6
0.0
0
3
6
9 12 15 18
¿¨·½ Öµ
Ý×ß¸
当自由度ν确定后，χ2分布曲线下右侧尾部的面积为α时，横轴上相应的χ2值记作χ2α,ν
查χ2界值表，得χ20.05,1=3.84,按α =0.05 水准，拒绝H0 , 接受H1 , P＜0.05，可以认为两组治疗原发性高血压的总体有效率不同，即可认为吲达帕胺片治疗原发性高血压是有效的。
3.确定P值，作出推断结论 P >0.05,不拒绝H0，尚不能认为两种培养基的
阳性培养率不同
第三节行×列表资料的χ2检验
行×列表资料
① 多个样本率比较时，
有 R 行 2 列，称为 R ×2表；
② 两个样本的构成比比较时，
有 2 行 C 列，称 2×C 表；
③ 多个样本的构成比比较，
有 R 行 C 列，称为 R ×C 表。
例9-3 某研究者为研究乙肝免疫球蛋白预防白兔胎儿宫内感染HBV的效果，将17例HBsAg阳性白兔随机分为预防注射组和非预防组，观察两组所产出的新生白兔HBV感染情况，结果见表9-3。问两组新生白兔的HBV总体感染率有无差别？
1.建立检验假设并确定检验水准
H
：
0
1
2
，即两组新生白兔HBV的总体感染率相等
表9-5 A、B两种培养基的培养结果
上述配对设计实验中，就每个对子而言，两种处理的结果不外乎有四种可能:
a ① A、B两种检测方法皆为阳性数(？)； d ② A、B两种检测方法皆为阴性数 (？)； b ③ A法为阳性、B法为阴性数 (？)； c ④ A法为阴性、B法为阳性数 (？)。
其中，a, d 为两法观察结果一致的两种情况，
果有统计学意义，其实际意义往往也不大。
1.建立检验假设并确定检验水准 H0:B=C，即两种培养基的阳性培养率相等 H1:B≠C，即两种培养基的阳性培养率不相等 α =0,05
2.计算检验统计量本例b+c>40，用非校正公式计算得
2 （24 - 20）2 0.36， 1
24 20
第二节配对四格表资料的 χ2 检验
与计量资料推断两总体均数是否有差别有成组设计和配对设计一样，计数资料推断两个总体率（构成比）是否有差别也有成组设计和配对设计，即四格表资料和配对四格表资料。
例9-4 现有198份痰标本，每份标本分别用A、 B两种培养基培养结核菌，问A、B两种培养基的阳性培养率是否不等？
检验的自由度取决于可以自由取值的格子数目，
而不是样本含量n。四格表资料只有两行两
列,ν=1，即在周边合计数固定的情况下，4个基本数据当中只有一个可以自由取值。
检验步骤： 1.建立检验假设并确定检验水准 H0:π1=π2 即试验组与对照组的总体有效率相等 H1:π1≠π2 即试验组与对照组的总体有效率不等
A 为实际频数，T 为理论频数，为自由度。
理论频数计算公式
Tij

nin j n
Tij 为第 i 行第 j 列的理论频数，ni 和nj 分别为
相应行与列的周边合计数，n 为总例数。
检验统计量χ2 值反映了实际频数与理论频数的吻合程度。
若检验假设H0:π1=π2成立，四个格子的实际频数A 与理论频数T 相差不应该很大，即
b, c为两法观察结果不一致的两种情况。
检验统计量(McNemar test)
注意：
本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况
(b, c)，而未考虑样本含量n和两法结果一致的两种情况(a, d)。所以，当 n 很大且 a 与 d 的数值很大（即两法的一致率较高）， b 与 c 的数值相对较小时，即便是检验结
表9-7 三个不同地区血型样本的频分布
地区
A
B
AB
O
亚洲
321
369
95
295
欧洲
258
43
22
194
北美洲
408
106
37
444
合计
987
518
154
933
H0? H1?
合计 1080 517 995 2592
行×列表资料 χ2 检验的注意事项
1.理论频数：行列表中的各格T≥1，并且1≤T
＜5的格子数不宜超过1/5格子总数，否则可能产生偏性。处理方法有三种： 1) 增大样本含量以达到增大理论频数的目的，属首选方法，只是有些研究无法增大样本含量，如同一批号试剂已用完等。
χ2连续性校正仅用于ν =1 的四格表资料，当ν≥2
时，一般不作校正。
校正公式：

2 c

( A T 0.5)2 T
c2
=
(| ad (a +b)(c
Hale Waihona Puke - bc | -n / + d )(a +
2)2 n c)(b +
d
)
Frank Yates
四格表资料χ2 检验公式的选择：
n 40, T 5，基本公式/专用公式；
2) 根据专业知识，删去理论频数太小的行或列，或将理论频数太小的行或列与性质相近的邻行或邻列合并。例如：不同年龄组可以合并，但不同血型就不能合并。
3) 改用双向无序R×C表的Fisher确切概率法（可用SAS软件实现）。
2.多个样本率比较：若所得统计推断为拒绝 H0，接受H1时，只能认为各总体率之间总的来说有差别，但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间有差别，需进一步做多个样本率的多重比较。
有效 51 35 59 145
无效 49 45 15 109
合计 100
80 74 254
有效率（%） 51.00 43.75 79.73 57.09
H0? H1?
例9-6 某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料，结果见表9-7，问不同地区人群ABO血型分类构成比是否不同。
要求：两样本的两分类个体数排列成四格表资料
要考查西安医学院临床专业01班和02班的系统解剖的及格率，从01班抽取20人（其中15人及格，5人挂科），从02班抽取30人（其中20人及格，10人挂科）。问这两个班级的及格率有无不同？哪个班级学习成绩更好？
四格表资料的基本形式
处理组发生数未发生数合计
2 (20 25.77)2 (24 18.23)2 (2115.23)2 (5 10.77)2 8.40
25.77
18.23
15.23
10.77
(2 1)(2 1) 1
3.确定P 值，作出推断结论
0.5
0.4
0.3
×Ô ÓÉ ¶È £½ 1
0.2
×Ô ÓÉ ¶È £½ 2
四、四格表资料的Fisher确切概率法(自学)
当四格表资料中出现n<40 或T <1，需改用四格表资料的Fisher确切概率法。该法是一种直接计算概率的假设检验方法，其理论依据是超几何分布（hypergeometric distribution）。四格表的确切概率法不属于检验的范畴，但常作为四格表资料假设检验的补充。
甲
a
b
a+b
乙
c
d
c+d
合计 a+c
b+d
n
例9-1 吲达帕胺片治疗原发性高血压疗效，将70名高血压患者随机分为两组，试验组用吲达帕胺片加辅助治疗，对照组用安慰剂加辅助治疗。试分析有效性。
一、 2检验的通用公式
通用公式：
2 ( A T )2
T
=(行数-1)(列数-1)
阳性
8 0
阴性
1 8
a-Ta -3.76
7
2
2
1
7
-2.76
3
6 2
3 6
-1.76
5
4
4
3
5
-0.76
4
5
5
4
4
0.24
3
6
6
5
3
1.24
7*
2
7
6
2
2.24*
8
1 7
8 1
3.24
0
9
9
8
0
4.24
* 为实际数据的四格表
P 0.000370 0.011847 0.096750 0.290251 0.362814 0.193501 0.041464* 0.002962 0.000041
二、四格表资料χ2检验的专用公式
专用公式：
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
2 (20 5 24 21)2 70 8.40
44 26 41 29
结论同前。
三、四格表资料χ2检验的校正公式
χ2分布是一连续型分布，而四格表资料属离散型分布，由此计算得的 χ2统计量的抽样分布亦呈离散性质。为改善χ2 统计量分布的连续性，则需行连续性校正。
H1：1 2 即两种药物治疗脑血管疾病的有效率不相等
0.05
2.计算检验统计量
c2

6
25
3 24 49 9
58 / 22
28 30

58

0.376
(2 1)(2 1) 1
3.确定P 值，作出推断结论
不拒绝H0,尚不能认为两种药物治疗脑血管疾病的有效率不相等

e商务文档

祝晓明《医学统计学》医统-第九章卡方检验共58页

相关文档推荐：