当前位置：文档之家› 9第八章_卡方检验

9第八章_卡方检验

3.确定Ｐ值、做出推论
ν ＝(2－1)(2－1)＝1，χ
2 0.05，1＝3.84。
本例χ 2＞χ 20.05，1 ，则Ｐ＜0.05。按 α ＝0.05 水准，拒绝Ｈ０，接受Ｈ可认为两种方法的总治愈率不等。
三、用四格表专用公式求χ 2值
(ad bc) n (a b)(c d )(a c)(b d )
χ
2
界值
• ν 确定后，如果分布曲线下右侧尾部的面积为α 时，则横轴上相应的 χ 2值就记作χ 2 α ，ν ，即χ 2界值。其右侧部分的面积 α 表示：自由度为 ν 时， χ 2 值大于界值的概率大小。 χ 2 值与 P 值的对应关系见χ 2界值表(附表6)。χ 2值愈大，P 值愈小；反之，χ 2值愈小，P值愈大。
(a b)! (c d )! (a c)! (b d )! 12! 12! 16!8! P(1) 0.0007 a!b!c!d!n! 4!8! 12!0!24! P( 2 ) (a b)! (c d )! (a c)! (b d )! 12! 12! 16!8! 0.0129 a!b!c!d!n! 5!7! 11! 1!24!
⑴
4 8 12 0 16 8 12 12 24
⑵
5 7 11 1 16 8 12 12 24 6 10 16
⑶
6 2 8 12 12 24 7 9 16
⑷
5 3 8 12 12 24 8 8 16
⑸
4 4 8 12 12 24
│Ａ-Ｔ│＝4
│Ａ-Ｔ│＝3
│Ａ-Ｔ│＝2
│Ａ-Ｔ│＝1
│Ａ-Ｔ│＝0
⑹
χ 2检验的基本思想
• χ 2 检验实质上是检验 A 的分布与Ｔ的分布是否吻合及吻合的程度，χ 2越小，表明实际观察次数与理论次数越接近。 • 若检验假设成立，则Ａ与Ｔ之差不会很大，出现大的χ 2值的概率Ｐ是很小的，若Ｐ ≤ α ，就怀疑假设成立，因而拒绝它；若Ｐ＞α ，则没有理由拒绝它。
两种疗法对偏头痛的治疗结果
疗法针灸药物合计有效例数无效例数合计有效率(%) 33(30.15) 2(4.85) 23(25.85) 7(4.15) 56 9 35 30 65 94.29 76.67 86.15
1.建立假设、确定检验水准 • Ｈ０：π 1＝π 2， • Ｈ１：π 1≠π 2； • α ＝0.05
不同自由度的χ2分布曲线图
图 8-1 不同自由度的χ 分布曲线图
2
二、χ 2检验的基本思想
• 例 8-1 某中医院将 112 例急性肾炎病人随机分为两组，分别用西药和中西药结合方法治疗，结果见表8-1，问两种方法的疗效有无差别？
表8-1
组西别药
两种方法治疗急性肾炎的结果
治愈例数 43(47.5) 52(47.5) 95 未愈例数 13(8.5) 4(8.5) 17 合计 56 56 112 治愈率(%) 76.79 92.86 84.82
• PC =a+c/n=43+52/112=0.8482 • T11=(a+b)×PC=(a+b)×(a+c)/n = 56×95/112=47.5 • T12=(a+b)×(1-PC)=(a+b)×(b+d)/n = 56×17/112=8.5 • T21=(c+d)×PC=(c+d)×(a+c)/n = 56×95/112=47.5 • T22=(c+d)×(1- PC)=(c+d)×(b+d)/n = 56×17/112=8.5
五、四格表的确切概率法
• 四格表的确切概率法 ( exact probabilities for 2×2 table ) 即 Fisher 确切概率法 ( Fisher′s exact probabilities test)，也称四格表直接计算法。是对两个小样本或样本率偏小 ( 或偏大 ) 的资料进行比较的统计分析方法。
例8-3
• 某医院将24例乙型脑炎重症病人随机分为两组，用同样的中药方治疗，但其中一组加一定量的人工牛黄，另一组不加，结果如表8-4，问人工牛黄能否增强乙脑方剂的疗效？
两法治疗乙型脑炎重症患者的疗效治疗方法治愈乙脑方 5 乙脑方+牛黄11 合计 16 未愈 7 1 8 合计 12 12 24
（一）适用条件
• 在四格表资料中，当出现下列情况之一时，应选用四格表的确切概率法。 • 1.ｎ＜40 • 2.有Ａ＝0 • 3.有Ｔ≤1 • 4.用其它检验方法所得P 接近α 。
（二）基本思想
• 无需计算检验统计量，直接计算原表及比原表更极端情况(│ Ａ - Ｔ │≥ 原表的│Ａ-Ｔ│)的累计概率，与检验水准比较作出推断。
第一节 χ 2检验的基本思想
• 一、χ 2分布及特点 • 由n 个服从标准正态分布的随机变量的平方和构成一新的随机变量，其分布规律称为χ 2分布。 • 参数n 称为自由度，用希腊字母ν 表示。χ 2检验的ν 取决于可以自由取值的格子数目，而不是n。
χ 2分布的特点
• ⑴ χ 2 分布的形状依赖于 ν 的大小：当 ν ≤2 时，曲线呈 L 型；随着 ν 的增加，曲线逐渐趋于对称；当 ν →∞时，分布趋近于正态分布。 • ⑵χ 2分布具有可加性：如果两个独立的随机变量X1和X2分别服从ν 1和ν 2的χ 2分布，那么它们的和(X1＋X2)也服从(ν 1＋ ν 2)的χ 2分布。
第八章 χ 2检验 (Chi-square test)
χ 2 检验也称卡方检验。是英国统计学家 Pearson 于 1900 年提出的一种应用范围很广的假设检验方法，可用于检验两个率间的差异；检验多个率 (或构成比)间的差异；判断两种属性或现象间是否存在关联性；了解实际分布与某种理论分布是否吻合；判断两个数列间是否存在差异等。
中西结合合计
χ 2检验的计算公式
•
2

A T 2
T
• TRC＝(ｎR· ｎ C )／ｎ • 式中Ａ为实际频数；Ｔ为理论频数，是按无效假设两总体率相等，均等于两样本的合计率时算出的；Ｔ RC 表示Ｒ行Ｃ列格子的理论频数；nR为第R行的合计数； nC 为第 C 列的合计数； n 为总例数； R 为行数；C为列数。
[1]建立假设、确定检验水准
• Ｈ0：π 1＝π 2 ； • Ｈ1：π 1＜π 2； • α ＝0.05
[2]选择检验方法、计算统计量
• 本例ｎ＜40，宜用四格表的确切概率法。 • 按公式8-2求Ｔ，结果见表8-4括号内数字。 • 列出周边合计数不变的各种组合之四格表，共9个，并计算│Ａ-Ｔ│。
表8-2
分组
甲组乙组
四格表资料的模式
＋－合计
ａｃ
ｂｄ
ａ+ ｂｃ+ ｄ
合计
ａ+ ｃ
ｂ+ ｄ
ｎ
二、用基本公式求χ
2值
应用条件：ｎ＞ 40 ，且四个格子的Ｔ＞５。 1.建立假设、确定检验水准Ｈ０：π 1＝π 2；Ｈ１：π 1≠π 2； α ＝0.05
2.选择检验方法、计算统计量
2 2 2 2 2 ( A T ) ( 43 47 . 5 ) ( 13 8 . 5 ) ( 52 47 . 5 ) ( 4 8 . 5 ) 2 5.617 T 47.5 8.5 47.5 8.5
9 7 3 5 12 12 10 6
⑺
2 6 12 12 11 5
⑻
1 7 12 12 12 4
⑼
0 8 12 12
16 8
24
16
8
24
16
8
24
16
8
24
│Ａ-Ｔ│＝1
│Ａ-Ｔ│＝2
│Ａ-Ｔ│＝3
│Ａ-Ｔ│＝4
[3]确定Ｐ值、做出推论
• 本例是推测加入人工牛黄的疗效是否高于不加人工牛黄组，属于单侧检验。
四、四格表资料χ 2值的校正
• 应用条件：ｎ＞ 40 ，但有 1 ＜Ｔ＜ 5 。

2
( AT T
0.5) 2
2

2
( ad bc n / 2) n (a b)(c d )(a c)(b d )
例8-2 • 某医师将门诊的偏头痛病人随机分为两组，分别采用针灸和药物两种方法治疗，结果见表8-3 ，问两种疗法的有效率有无差别？
• Ｐ＝Ｐ(1)＋Ｐ(2) ＝0.0007＋0.0129＝0.0136 • 按 α ＝0.05 水准拒绝Ｈ 0 ，接受Ｈ 1 。认为加入人工牛黄能增强乙脑方剂的疗效。
第三节配对四格表资料的χ 2检验
一、配对四格表资料的模式 • 若配对设计的两分类变量，每对受试对象分别接受甲、乙两种处理，或同一样品经甲、乙两法检测，每一对子的计数情况有 4 种可能：即甲＋乙＋、甲＋乙－、甲－乙＋、甲－乙－。可将其排成表8-5的形式。
χ
2
检验的自由度
• χ 2 值的大小，除决定于Ａ－Ｔ的差值外，还与格子数(严格地说是自由度 ) 的多少有关，故在查 χ 2 界值表时要考虑自由度的大小。 • χ 2检验的自由度：
ν ＝(Ｒ－1)(Ｃ－1)
第二节四格表资料的χ 2检验
一、四格表资料的模式对于完全随机设计的两组资料，如果其结果是两分类变量，通常可列成表8-2的形式。由于ａ、ｂ、ｃ、ｄ 4个数据是表格中的基本数据，其余数据都可从这4个数据推算出来，这种资料称为四格表资料。

33 7 2 23 65 / 2 65

e商务文档

9第八章_卡方检验

相关文档推荐：