9第八章_卡方检验
3.确定P值、做出推论
ν =(2-1)(2-1)=1,χ
2 0.05,1=3.84。
本例χ 2>χ 20.05,1 ,则P<0.05。 按 α =0.05 水准,拒绝H 0 ,接受H 可认为两种方法的总治愈率不等。
三、用四格表专用公式求χ 2值
(ad bc) n (a b)(c d )(a c)(b d )
χ
2
界值
• ν 确定后,如果分布曲线下右侧尾部的 面积为α 时,则横轴上相应的 χ 2值就记 作χ 2 α ,ν ,即χ 2界值。其右侧部分的 面积 α 表示:自由度为 ν 时, χ 2 值大 于界值的概率大小。 χ 2 值与 P 值的对应 关系见χ 2界值表(附表6)。χ 2值愈大,P 值愈小;反之,χ 2值愈小,P值愈大。
(a b)! (c d )! (a c)! (b d )! 12! 12! 16!8! P(1) 0.0007 a!b!c!d!n! 4!8! 12!0!24! P( 2 ) (a b)! (c d )! (a c)! (b d )! 12! 12! 16!8! 0.0129 a!b!c!d!n! 5!7! 11! 1!24!
⑴
4 8 12 0 16 8 12 12 24
⑵
5 7 11 1 16 8 12 12 24 6 10 16
⑶
6 2 8 12 12 24 7 9 16
⑷
5 3 8 12 12 24 8 8 16
⑸
4 4 8 12 12 24
│A-T│=4
│A-T│=3
│A-T│=2
│A-T│=1
│A-T│=0
⑹
χ 2检验的基本思想
• χ 2 检验实质上是检验 A 的分布与 T 的分 布是否吻合及吻合的程度,χ 2越小,表 明实际观察次数与理论次数越接近。 • 若检验假设成立,则 A 与 T 之差不会很 大,出现大的χ 2值的概率 P是很小的, 若 P ≤ α ,就怀疑假设成立,因而拒绝 它;若P>α ,则没有理由拒绝它。
两种疗法对偏头痛的治疗结果
疗 法 针 灸 药 物 合 计 有效例数 无效例数 合计 有效率(%) 33(30.15) 2(4.85) 23(25.85) 7(4.15) 56 9 35 30 65 94.29 76.67 86.15
1.建立假设、确定检验水准 • H0:π 1=π 2, • H1:π 1≠π 2; • α =0.05
不同自由度的χ2分布曲线图
图 8-1 不同自由度的χ 分布曲线图
2
二、χ 2检验的基本思想
• 例 8-1 某中医院将 112 例急性肾炎 病人随机分为两组,分别用西药和 中西药结合方法治疗,结果见表8-1, 问两种方法的疗效有无差别?
表8-1
组 西 别 药
两种方法治疗急性肾炎的结果
治愈例数 43(47.5) 52(47.5) 95 未愈例数 13(8.5) 4(8.5) 17 合计 56 56 112 治愈率(%) 76.79 92.86 84.82
• PC =a+c/n=43+52/112=0.8482 • T11=(a+b)×PC=(a+b)×(a+c)/n = 56×95/112=47.5 • T12=(a+b)×(1-PC)=(a+b)×(b+d)/n = 56×17/112=8.5 • T21=(c+d)×PC=(c+d)×(a+c)/n = 56×95/112=47.5 • T22=(c+d)×(1- PC)=(c+d)×(b+d)/n = 56×17/112=8.5
五、四格表的确切概率法
• 四 格 表 的 确 切 概 率 法 ( exact probabilities for 2×2 table ) 即 Fisher 确 切 概 率 法 ( Fisher′s exact probabilities test),也称 四格表直接计算法。是对两个小样 本或样本率偏小 ( 或偏大 ) 的资料进 行比较的统计分析方法。
例8-3
• 某医院将24例乙型脑炎重症病人随 机分为两组,用同样的中药方治疗, 但其中一组加一定量的人工牛黄, 另一组不加,结果如表8-4,问人工 牛黄能否增强乙脑方剂的疗效?
两法治疗乙型脑炎重症患者的疗效 治疗方法 治愈 乙脑方 5 乙脑方+牛黄11 合计 16 未愈 7 1 8 合计 12 12 24
(一)适用条件
• 在四格表资料中,当出现下列情况 之一时,应选用四格表的确切概率 法。 • 1.n<40 • 2.有A=0 • 3.有T≤1 • 4.用其它检验方法所得P 接近α 。
(二)基本思想
• 无需计算检验统计量,直接计算原表 及比原表更极端情况(│ A - T │≥ 原表的│A-T│)的累计概率,与检 验水准比较作出推断。
第一节 χ 2检验的基本思想
• 一、χ 2分布及特点 • 由n 个服从标准正态分布的随机变量 的平方和构成一新的随机变量,其分 布规律称为χ 2分布。 • 参数n 称为自由度,用希腊字母ν 表 示。χ 2检验的ν 取决于可以自由取值 的格子数目,而不是n。
χ 2分布的特点
• ⑴ χ 2 分布的形状依赖于 ν 的大小:当 ν ≤2 时,曲线呈 L 型;随着 ν 的增加, 曲线逐渐趋于对称;当 ν →∞时,分布 趋近于正态分布。 • ⑵χ 2分布具有可加性:如果两个独立的 随机变量X1和X2分别服从ν 1和ν 2的χ 2分 布,那么它们的和(X1+X2)也服从(ν 1+ ν 2)的χ 2分布。
第八章 χ 2检验 (Chi-square test)
χ 2 检验也称卡方检验。是英国统计 学家 Pearson 于 1900 年提出的一种应 用范围很广的假设检验方法,可用于 检验两个率间的差异;检验多个率 (或构成比)间的差异;判断两种属性 或现象间是否存在关联性;了解实际 分布与某种理论分布是否吻合;判断 两个数列间是否存在差异等。
中西结合 合计
χ 2检验的计算公式
•
2
A T 2
T
• TRC=(nR· n C )/ n • 式中 A 为实际频数; T 为理论频数,是 按无效假设两总体率相等,均等于两样 本的合计率时算出的; T RC 表示 R 行 C 列格子的理论频数;nR为第R行的合计数; nC 为第 C 列的合计数; n 为总例数; R 为 行数;C为列数。
[1]建立假设、确定检验水准
• H0:π 1=π 2 ; • H1:π 1<π 2; • α =0.05
[2]选择检验方法、计算统计量
• 本例n<40,宜用四格表的确切概 率法。 • 按公式8-2求T,结果见表8-4括号 内数字。 • 列出周边合计数不变的各种组合之 四格表,共9个,并计算│A-T│。
表8-2
分组
甲组 乙组
四格表资料的模式
+ - 合计
a c
b d
a+ b c+ d
合计
a+ c
b+ d
n
二、用基本公式求χ
2值
应用条件: n> 40 ,且四个格子的T>5。 1.建立假设、确定检验水准 H0:π 1=π 2; H1:π 1≠π 2; α =0.05
2.选择检验方法、计算统计量
2 2 2 2 2 ( A T ) ( 43 47 . 5 ) ( 13 8 . 5 ) ( 52 47 . 5 ) ( 4 8 . 5 ) 2 5.617 T 47.5 8.5 47.5 8.5
9 7 3 5 12 12 10 6
⑺
2 6 12 12 11 5
⑻
1 7 12 12 12 4
⑼
0 8 12 12
16 8
24
16
8
24
16
8
24
16
8
24
│A-T│=1
│A-T│=2
│A-T│=3
│A-T│=4
[3]确定P值、做出推论
• 本例是推测加入人工牛黄的疗效是否高于不加人 工牛黄组,属于单侧检验。
四、四格表资料χ 2值的校正
• 应用条件: n > 40 ,但有 1 < T < 5 。
2
( AT T
0.5) 2
2
2
( ad bc n / 2) n (a b)(c d )(a c)(b d )
例8-2 • 某医师将门诊的偏头痛病人随机 分为两组,分别采用针灸和药物 两种方法治疗,结果见表8-3 , 问两种疗法的有效率有无差别?
• P=P(1)+P(2) =0.0007+0.0129=0.0136 • 按 α =0.05 水准拒绝 H 0 ,接受 H 1 。认为加入 人工牛黄能增强乙脑方剂的疗效。
第三节 配对四格表资料的χ 2检验
一、配对四格表资料的模式 • 若配对设计的两分类变量,每对受 试对象分别接受甲、乙两种处理,或 同一样品经甲、乙两法检测,每一对 子的计数情况有 4 种可能:即甲+乙 +、甲+乙-、甲-乙+、甲-乙-。 可将其排成表8-5的形式。
χ
2
检验的自由度
• χ 2 值的大小,除决定于 A-T 的差 值外,还与格子数(严格地说是自由 度 ) 的多少有关,故在查 χ 2 界值表 时要考虑自由度的大小。 • χ 2检验的自由度:
ν =(R-1)(C-1)
第二节 四格表资料的χ 2检验
一、四格表资料的模式 对于完全随机设计的两组资料,如 果其结果是两分类变量,通常可列成 表8-2的形式。由于a 、b、c 、d 4个数据是表格中的基本数据,其余数 据都可从这4个数据推算出来,这种资 料称为四格表资料。
33 7 2 23 65 / 2 65