实验6-1 卡方检验
20
3. 配对四格表资料卡方检验
例4 用两种不同方法检查已确诊的乳腺癌患者120名,检 查结果见下表,问两种方法何者为优?
表3 两种乳腺癌诊断方法结果比较
乙法
甲法Leabharlann 合计+-
+
42
18
60
-
30
30
60
合计
72
48
120
21
data aa;
do a=1 to 2;
do b=1 to 2;
input x@@;
实际频数和理论频数。
;
proc freq;
weight x;
tables a*b/chisq expected norow nocol nopercent;
run;
因为有一个格子的理论频 数1<T<5,所以选择连续 性校正的结果。
此时,SAS结果中 会给出相应提示
行×列表卡方检验 关联性检验
双向无序分类资料的关联性检验
有序分组资料的线性趋势检验
例:某研究者欲研究年龄与冠状动脉粥样硬化等级间的关 系,将 278 例尸解资料整理成表 6-13,问年龄与冠状动脉 粥样硬化等级间是否存在线性变化趋势?
表 6-13 年龄与冠状动脉硬化的关系
年龄 (岁) (X)
冠状动脉硬化等级(Y) - + ++ +++ 合计
20~ 30~ 40~ ≥50 合计
• 有序分组
3
1. 完全随机设计四格表资料 (两样本率的比较)
• 例1 对甲、乙两种降压药进行临床疗效评价,将某时 间段内入院的高血压病人随机分为两组,每组均为100 人。甲药治疗组80位患者有效,乙药治疗组50位患者 有效,两种降压药有效率有无差别?
四格表资料专用公式: 2
(a
(ad bc)2 n b)(c d )(a c)(b
Φ系数(phi coefficient)
山东大学公卫学院 Liu Yunxia
14
双向无序分类资料的关联性检验
行×列表卡方检验 关联性检验
Cramer氏V系数(Cramer’s V coefficient)
山东大学公卫学院 Liu Yunxia
15
行×列表卡方检验 关联性检验
双向无序分类资料的关联性检验
表1 手术治疗前列腺癌患者合并症发生情况
手术方法
电切术 开放手术 合计
合并症
+
-
11
71
1
38
12
109
合计
82 39 121
12
data aa;
do a=1 to 2;
do b=1 to 2;
input x@@;
output; end; end; cards;
为了简化,仍然只输出
11 71 1 38
• 对于其它三类R*C表及其分析过程,因涉及方法太多,如 有兴趣可参考相关书籍。
6. Cochran Armitage 趋势检验
• 例 为了解某市中学生的吸烟状况,抽样调查了891名中学 生,结果见下表,问该市中学生吸烟率是否有随年级增加 而增高的趋势?
山东大学公卫学院 Liu Yunxia
27
Cochran Armitage 趋势检验
d)
四格表资料校正公式:
c
2=
(|ad-bc|-n/ 2)2 n (a+b)(c+d )(a+c)(b+d
)
4
data aa;
do a=1 to 2;
do b=1 to 2;
input x@@; output; end; end;
ab为行和列 循环语句输入表格数据
cards; 20 80 50 50
data aa; do a=1 to 3; do b=1 to 3; input x@@; output; end; end; cards; 34 62 28 27 28 20 57 105 52 ; proc freq; weight x; tables a*b/chisq expected norow nocol nopercent; run;
25
所有格子的理论频数均 大于5,选择一般卡方 检验的结果即可
26
5. 多个样本率及构成比的比较
• 对于R*C表资料多样本率及构成比的比较,在SAS中所用 程序与前述程序相同,在此不再重复。多个样本率两两比 较时,因为SAS过程可以给出确切概率值,所以可用所得 的每个四格表的概率值与调整后的检验水准比较即可。
output; end; end; cards; 42 18 30 30 ;
用agree选项替换chisq选 项,在结果中将输出 McNemar检验和Kappa一 致性检验结果。
proc freq;
weight x;
tables a*b/agree norow nocol nopercent;
run;
70 22 4 2 98 27 24 9 3 63 16 23 13 7 59 9 20 15 14 58 122 89 41 26 278
29
在tables语句后加选择项 expected,输出理论频数
输出理论频数
9
输出结果的第一部分:
在每个格子中输 出了该格子对应 的理论频数,为 格子中的第二个 数据,其它数据 不变。
10
data aa;
do a=1 to 2;
do b=1 to 2;
input x@@;
output; end; end;
输出原表格
McNemar检验的统计量值和 概率值
Kappa一致性检验结果:给出 Kappa值、渐进标准误和其可信区 间。因可信区间不包含0,因此若 是两种方法比较的话,则说明两 种方法的检测结果具有一致性。
1960年Cohen等提出用Kappa值作为评价判断的 一致性的指标。 经验法则:Kappa大于0.75表示好的一致性 (Kappa最大为1); 小于0.4表示一致性差。 Kappa不考虑评价人间的意见不一致性的程度, 只考虑他们一致与否。 Kappa取值在[-1,1]
cards;
20 80 50 50
;
proc freq;
weight x;
tables a*b/chisq expected norow nocol nopercent;
run;
不输出行和列的百分比以及总百分比, 只输出实际频数和理论频数
11
• 例2 121名前列腺癌患者中,82名接受电切术治疗,术 后有合并症者11人;39名接受开放手术治疗,术后有合 并症1人。试分析两种手术的合并症发生率有无差异?
上述SAS程序的输出结果:
结果第三部分:为Fisher精确概率法结果,第二到第五 行分别为左侧概率、右侧概率、(当前的)表概率和 双侧概率。最下面为总的样本含量。
data aa; do a=1 to 2; do b=1 to 2; input x@@; output; end; end; cards; 20 80 50 50 ; proc freq; weight x; tables a*b/chisq expected; run;
表 2 乙肝免疫球蛋白预防胎儿宫内感染 HBV 的效果
组别 预防注射组
阳性 4
阴性 18
合计 22
感染率(%) 18.18
非预防组
5
6
11
45.45
合计
9
24
33
27.27
18
data aa;
do a=1 to 2;
do b=1 to 2;
input x@@;
output; end; end;
cards; 4 18 5 6 ;
为了简化,仍然只输出 实际频数和理论频数。
proc freq;
weight x;
tables a*b/chisq expected norow nocol nopercent;
run;
总的样本例数小于40,所以要 选择精确概率法的检验结果。 本例选择双侧检验的概率。
此时SAS结果中仍然 会有相应的提示
卡方检验
DIVISION OF BIOSTATISTICS SCHOOL OF PUBLIC HEALTH
SHANDONG UNIVERSITY
2
实验内容
• 四格表资料的 χ2 检验 • 四格表资料的Fisher确切概率法 • 配对四格表资料的 χ2 检验 • 行×列表资料的 χ2 检验 • Cochran-Armitage 趋势检验
Weight指明频数变量 Tables a*b 为行乘列的表格
;
proc freq; weight x;
进行四格表资 料的卡方检验
tables a*b/chisq;
run;
5
上述SAS程序的输出结果:
输出结果的第一部分: 为列联表的内容,每个格中 从上到下4个数值分别为: 实际频数、该格实际频数占 总频数的百分比、每格的实 际频数占行合计的百分比和 每格的实际频数占列合计的 百分比。 列联表右侧为行合计部分, 最下方为列合计部分。
列联系数 (contingency coefficient)
山东大学公卫学院 Liu Yunxia
16
17
2. 四格表资料Fisher确切概率法
• 例3 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染 HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射 组和非预防组,结果见下表。问2组新生儿的HBV总体 感染率有无差别?
6
上述SAS程序的输出结果:
结果第二部分:第一列为各种检验方法,第一到三分别为专 用公式、似然比法、连续性校正、mantel-haenszel法;后面 三列分别为自由度、卡方值及概率值; 第一列四到六分别为关联性统计量phi系数、列联系数和 cramer`s V统计量,绝对值越大说明关系越密切。