当前位置：文档之家› 第7章卡方检验

第7章卡方检验

2
A为实际数 T为理论数
X2值是一个反映假设的理论数（T）和观察的实际数（A）符合程度的指标。
卡方检验的基本原理
若检验假设H0:π1=π2成立，四个格子的实际
频数 A 与理论频数 T 相差不应该很大，即统
计量 X2 不应该很大。如果 A 和 T 差距大， X2值就会很大，即相对应的 P 值很小，若 P
0.2 0.1 0.0 0 3 6 9 12 ¿ ¨· ½ Ö µ
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
15
18
四格表卡方检验基本步骤

建立检验假设：H0
，
H1
确定显著性水准：α= 0.05

计算各格子的理论数 T
计算统计量(X2 值)
（ P－uα Sp， P＋uα Sp）
uα为概率为α的u界限值
u0.05＝1.96
u0.01＝2.58

查表法当n 较小时（ n≤ 50），需查附表（百分率的可信区间表），得到总体率的可信区间。
第二节
率的u检验
一、样本率与总体率的比较
Z u p 0 0 (10 ) n
P324/例10-7
二、两个样本率的比较设：两样本率分别为p1和p2，当n1与n2均较大，且 p1 、 1-p1 及 p2 、 1-p2 均不太小，如 n1p1 、
n1(1-p1) 及 n2p2 、 n2(1-p2) 均大于 5 时，可采用
正态近似法对两总体率作统计推断。
p1 p 2 Zu S p1 p 2
0.3
0.2
0.1
0.0
0

2
4
6
2
8
2 0 . 0 5 / 2
10
2 0 . 0 5 ( 1 ) 2 0 . 0 1 ( 1 )
3 . 8 4 ( 1 . 9 6 ) Z
2 2 6 . 6 3 ( 2 . 5 7 5 8 ) Z 0 . 0 1 / 2
χ2分布（chi-square distribution）
P325/例10-8
Zu
p1 p 2 S p1 p 2
两个率之差的合并标准误Sp1－p2
1 1 S p ( 1 p )( ) p p c c 1 2 n n 1 2
合并发生率PC
pc
X1 X 2 n 1 n 2
第三节
卡方检验
(chi-square test)
X 2检验是现代统计学的创始人之一，英国
人K . Pearson（1857-1936）于1900年提出的一种具有广泛用途的统计方法。可用于两
个或多个率或构成比间的比较、配对计数资
料及两种属性或特征之间是否有关系等等。
卡方检验

四格表资料的卡方检验配对资料的卡方检验行×列表卡方检验

一、四格表资料的X2检验适用于两个样本率的比较
率的标准误用“σp”表示。
p
( 1 )
n
π为总体率； n为样本含量
由于实际工作中，总体率π往往未知，常常用样本率P来近似代替总体率π，则：
Sp
p 1 p n
Sp为样本率的标准误； P 为样本率；n 为样本含量
例如：抽取居民300人的粪便，检出蛔虫
阳性60人，求其抽样误差的大小。
两个样本率的比较既可以选用u 检验，
也可用四格表的X2检验。 • • • • 基本公式法专用公式法连续性校正公式确切概率法（直接概率法）
自由度为 1 的分布
2
若 Z ~ N ( 0,1), 则 Z 2 的分布称为自由度为 1 的 2 分布. (chi-square distribution),记为 (21) 或 2 (1) . 图形:从纵轴某个点开始单调下降,先凸后凹.
Sp
p 1 p n
Sp
60 240 300 300 300
=0.0231=2.31%
率的标准误的应用

表示样本率的抽样误差大小。
估计总体率的可信区间。
进行率的差别的假设检验。
二、总体率的置信区间估计

正态近似法
当n 足够大，且np和n（1－p）均大于
5时，P 的分布接近正态分布，可用：

基本公式法：
2 2 2 A T ( A T ) ( A T ) ( A T ) 1 1 1 1 2 12 12 21 21 22 22 2
T 1 1
T 1 2
T 2 1
T 2 2
(AT ) , ( 行数 1 ) ( 列数 1 ) T
＝ 4.13
P325/例10-9
(三)四格表资料的连续性校正公式
适用条件：n≥40，1≤T＜5 P327/例10-10

2 c
(A T 0 . 5 ) T
n2 2
2
( |a d b c |- ) n = ( a + b ) ( c + d ) ( a + c ) ( b + d )
1、建立假设：H0： π1= π 2、确定检验水准：α=0.05
2
H1： π1 ≠ π 3、计算各格子理论数 T
2
T11=100×44／220=20；
T21=120×44／220=24
4、计算统计量X2值： X2=（14－20）2／20＋（86 －80）2／80
＋(30 － 24）2／24＋（90 － 96）2／96 = 4.13
式中，A为实际频数（actual frequency） T为理论频数（theoretical frequency）
2
用药组和对照组流感发病率比较
组别用药组发病人数 14（20）未发病人数 86（80）合计发病率（%） 100 14
对照组
合
30（24）
90（96）
176
120
220
25
—
计 44

n≥40，T≥5 ，专用公式或基本公式 n≥40，1≤T＜5，连续性校正公式

n＜40 ，或T＜1，确切概率法直接计算概率
( Fisher确切概率)
注意： X2 连续性校正仅用于 1 的四
格表资料，当
2
时，一般不作校正。
二、配对资料的卡方检验

P327/例10-11
配对资料数据表甲种属性乙种属性＋－合计
（二）
2
专用公式法
2
( a d b c )n ( a b ) ( a c ) ( b d ) ( c d )
发生数样本 1 样本 2 合计未发生数合计 a+b c+d n
a c a+c
b d b+d
前例：用药组和对照组流感发病率比较组别发病人数未发病人数合计发病率（%）
用药组
对照组合计
14（a）
30（c） 44 a+c
86（b）
90（d） 176 b+d
100 a+b
120 c+d 220 n
14
25
—
检验步骤同前
( a d b c )n ( a b ) ( a c ) ( b d ) ( c d )
2
2
X
2
=
(14×90—86×30）2×220 100×120×44×176
发病人数
14（20） 30（24）
未发病人数
86（80） 90（96） 176
合计发病率（%）
100 120 220 14 25 —
计 44
表中：
Байду номын сангаас14
86
30
90
是整个表的基本数字。
19世纪末Pearson 提出卡方检验统计量X2
值的基本公式（也称为Pearson X2值）
(AT) 2 T
行×列表资料卡方检验的注意事项
1、R×C表X2检验中，不需要进行连续性校正，但如果有1/5以上格子的T＜5 ，或有一格T
＜1，应设法增加理论数，否则可能产生偏
性。处理方法有三种：

增大样本含量
合并（并组需注意合理性）
根据专业知识删去其所在行或所在列
2、R×C表X2检验，得到P≤0.05有统计学
＋－
合计
a c
a＋c
b d
b＋d
a+b c+d
n
式中，a、d 为两法观察结果一致的两种情况，
b、c为两法观察结果不一致的两种情况。
检验统计量X2为：
(b c) b+c＞40, , bc
2 2
1
2
b+c≤40,
2 c
( b c 1) bc
,
=1
2 结果比较两种血清学检验
0.5 0.4 0.3
1 f( ) 2 2 ( /2 )
2 2
( /2 1 )
e
2 /2
ß ×¸ Ý
× Ô Ó É ¶ È £ ½ 1
0.2 0.1 0.0 0 3
3.84 7.81
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6

确定概率 P
统计推断结论
TRC
n R nC n
TRC
式中：
n R nC n
TRC—R行C列格子的理论数

e商务文档

第7章卡方检验

相关文档推荐：