医学统计方法之卡方检验
2 连续性校正仅用于 1的
四格表资料,当 2 时,一般不 作校正。
例8.2 某医学院抽样调查资料仅供大参考,不学当之处四,请联系年改正。级和五年级学生近视 眼患病情况,四年级学生的近视率为7.14%,五年级学 生的近视率为35.71%,调查结果见下表,试问该大学四 年级与五年级学生的近视眼患病率是否一样?
例8.1 为了解某中药治疗原发性高血压的疗效, 将70名高血压患者随机分为两组,试验组用该 药加辅助治疗,对照组用安慰剂加辅助治疗, 观察结果见表8-1。
问:该药治疗原发性 高血压是否有效?
资料仅供参考,不当之处,请联系改正。
表 8-1 两 种 药 物 治 疗 原 发 性 高 血 压 的 疗 效
组别 对照组 试验组
(ab)(ac)(bd)(cd)
11
资料仅供参考,不当之处,请联系改正。
3、查界值表,确定P值,做出推断结论 自由度=1,Χ20.05(1)=3.84, Χ2> Χ20.05(1), 所以 , P<0.05,在α=0.05的检验水准下,拒绝H0, 差异有统计 学意义,也就是试验组与对照组的总体有效率不等.
资料仅供参考,不当之处,请联系改正。
连续性校正公式
c2
( AT 0.5)2 T
1
c2=(a+b()|(acd+-db)c(a |-+ n 2c)2)(nb+d) 1
资料仅供参考,不当之处,请联系改正。
四格表资料χ2公式的正确选择
1)当n≥40,所有T ≥ 5时,用专用公式或普通公式; 2)当n≥40,但有理论频数1≤T<5时,用校正公式; 3) n<40或有T<1,或P≈α时,用确切概率法。
2(2 052 42)1 270 8.40
4 42 64 129
推倒过程 资料仅供参考,不当之处,请联系改正。
基本公式: 2 (AT)2
T
a(aabb)(acdc)2 b(aabb)(bcdd)2 d(acbd)(bcdd)2
(ab)(ac)
(ab)(bd)
(cd)(bd)
abcd
abcd
abcd
资料仅供参考,不当之处,请联系改正。
基本计算公式
2 (A T T )2 ,自 由 度 行 数 - 1 列 数 - 1
式中,A为实际频数(actual frequency),T为理论频数 (theoretical frequency)
T nRnC
RC
n
back
资料仅供参考,不当之处,请联系改正。
资料仅供参考,不当之处,请联系改正。
ν个相互独立的标准正态变量ui(i=1,2,…, ν)的平方和
称为 变2 量,即
2 u12 u22 ... u2
u1
Xi
它的分布即为卡方分布,其自由度为υ。
0.3
0.2
0.1
0.0 0
资料仅供参考,不当之处,请联系改正。
2
4
6
8
10
卡方分布
资料仅供参考,不当之处,请联系改正。
资料仅供参考,不当之处,请联系改正。
1、建立检验假设并确定检验水准 H0:π1=π2 ,即试验组与对照组的总体有效率相等 H1 :π1≠π2 ,即试验组与对照组的总体有效率不等 α=0.05 2、计算检验统计量
T1147404125.8
T1244702918.2
T2127604115.2 T2226702910.8
资料仅供参考,不当之处,请联系改正。
主要内容:
第一节 四格表 2 检验 第二节 配对四格表 2检验 第三节 行×列表 2 检验
2
分布 资料仅供参考,不当之处,请联系改正。
是一种连续型分布,可用于检 验资料的实际频数和按检验假设计 算的理论频数是否相符等问题。早 在1875年,F. Helmet即得出来自正 态总体的样本方差的分布服从卡方 分布。1900年,K. Pearson也独立 Karl Pearson (1857-1936) 地从检验分布的拟合优度发现这一 相同的卡方分布。
α=0.05
2、计算检验统计量
(2926542)242
2
2
3.62
(25)2 ( 69)2 (26 )5(9)
资料仅供参考,不当之处,请联系改正。
3、查界值表,确定P值,做出推断结论 自由度=1, Χ20.05(1)=3.84, Χ2< Χ20.05(1), 所以 , P>0.05,在α=0.05的检验水准下,不拒绝H0,说明四年 级与五年级学生近视眼患病率差别没有统计学意义,可 认为尚未发现四年级与五年级学生近视眼患病率有显著 性差异。
合计
有效 20 21 41
无效 24 5 29
合计 44 26
70
有 效 率 (%) 45.45 80.77 58.57
样本 1 样本 2 合计
表 8-2 2×2 表 格 式
反应结果
阳性
阴性
a
b
c
d
a+c
b+d
观察 总频数
a+b c+d a+b+c+d
阳性 频 率 (%) P1=a/(a+b) P2=c/(c+d) (a+c)/n
χ2检验的用途
Χ2检验读作卡方检验,是一种用途广泛的统计方 法,主要用于: 检验两个(或多个)总体率或构成比之间是否有统计 学意义,从而推断两个(或多个)总体率或构成比是 否相同。
资料仅供参考,不当之处,请联系改正。
χ2检验的基本思想
检验实际频数(A)和理论频数(T)的差别是否由抽 样误差所引起的, 也就是由样本率(或样本构成比) 来推断总体率(或总体构成比)。
表8-2 两个年级大学生的近视眼患病率比较
年级
近视
非近视
合计 近视率(%)
四年级
2
五年级
5
合计
7
26
28
7.14
9
14
35.71
35
42
16.67
资料仅供参考,不当之处,请联系改正。
1、建立检验假设并确定检验水准
H0: π1=π2 ,即四年级与五年级学生的近视眼患病率相同 H1 :π1≠π2 ,即四年级与五年级学生的近视眼患病率不同
资料仅供参考,不当之处,请联系改正。
用基本公式计算卡方值:
2 ( 2 02.8 5) 2 ( 2 41.2 8) 2 ( 2 11.2 5) 2 ( 51.8 0) 2
2.8 5
1.2 8
1.2 5
1.8 0
8.40
资料仅供参考,不当之处,请联系改正。
四格表卡方检验的专用1 公式:
2
(adbc)2n
(adbc)2 n
(ab)(cd)(ac)(bd)
1 ; (四格表专用公式)
资料仅供参考,不当之处,请联系改正。
四格表χ2值的连续性校正
卡方分布是连续型的分布,卡方界值是由其分布 计算而来的。而卡方检验用于分类资料比较时,原始 数据是不连续的,用卡方界值表确定P值时可能存在误 差。四格表资料中,当n≥40,有理论频数1≤T<5时, 因为理论值太小,会导致χ2值变大,易出现假阳性结 论。