当前位置:文档之家› 第7章卡方检验

第7章卡方检验


2
A为实际数 T为理论数
X2值是一个反映假设的理论数(T)和观察 的实际数(A)符合程度的指标。
卡方检验的基本原理
若检验假设H0:π1=π2成立,四个格子的实际
频数 A 与理论频数 T 相差不应该很大,即统
计量 X2 不应该很大。 如果 A 和 T 差距大, X2值就会很大,即相对 应的 P 值很小,若 P
0.2 0.1 0.0 0 3 6 9 12 ¿ ¨· ½ Ö µ
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
15
18
四格表卡方检验基本步骤

建立检验假设:H0

H1
确定显著性水准:α= 0.05


计算各格子的理论数 T
计算统计量(X2 值)
( P-uα Sp, P+uα Sp)
uα为概率为α的u界限值
u0.05=1.96
u0.01=2.58

查表法 当n 较小时( n≤ 50),需查附 表(百分率的可信区间表),得到总 体率的可信区间。
第二节
率的u检验
一、样本率与总体率的比较
Z u p 0 0 (10 ) n
P324/例10-7
二、两个样本率的比较 设:两样本率分别为p1和p2,当n1与n2均较大, 且 p1 、 1-p1 及 p2 、 1-p2 均 不 太 小 , 如 n1p1 、
n1(1-p1) 及 n2p2 、 n2(1-p2) 均大于 5 时,可采用
正态近似法对两总体率作统计推断。
p1 p 2 Zu S p1 p 2
0.3
0.2
0.1
0.0
0

2
4
6
2
8
2 0 . 0 5 / 2
10
2 0 . 0 5 ( 1 ) 2 0 . 0 1 ( 1 )
3 . 8 4 ( 1 . 9 6 ) Z
2 2 6 . 6 3 ( 2 . 5 7 5 8 ) Z 0 . 0 1 / 2
χ2分布(chi-square distribution)
P325/例10-8
Zu
p1 p 2 S p1 p 2
两个率之差的合并标准误Sp1-p2
1 1 S p ( 1 p )( ) p p c c 1 2 n n 1 2
合并发生率PC
pc
X1 X 2 n 1 n 2
第三节
卡方检验
(chi-square test)
X 2检验是现代统计学的创始人之一,英国
人K . Pearson(1857-1936)于1900年提出 的一种具有广泛用途的统计方法。可用于两
个或多个率或构成比间的比较、配对计数资
料及两种属性或特征之间是否有关系等等。
卡方检验

四格表资料的卡方检验 配对资料的卡方检验 行×列表卡方检验

一、四格表资料的X2检验 适用于两个样本率的比较
率的标准误 用“σp”表示。
p
( 1 )
n
π为总体率; n为样本含量
由于实际工作中,总体率π往往未知, 常常用样本率P来近似代替总体率π,则:
Sp
p 1 p n
Sp为样本率的标准误; P 为样本率;n 为样本含量
例如:抽取居民300人的粪便,检出蛔虫
阳性60人,求其抽样误差的大小。
两个样本率的比较既可以选用u 检验,
也可用四格表的X2检验。 • • • • 基本公式法 专用公式法 连续性校正公式 确切概率法(直接概率法)
自由度为 1 的 分布
2
若 Z ~ N ( 0,1), 则 Z 2 的分布称为自由度为 1 的 2 分布. (chi-square distribution),记为 (21) 或 2 (1) . 图形:从纵轴某个点开始单调下降,先凸后凹.
Sp
p 1 p n
Sp
60 240 300 300 300
=0.0231=2.31%
率的标准误的应用

表示样本率的抽样误差大小。
估计总体率的可信区间。
进行率的差别的假设检验。
二、总体率的置信区间估计

正态近似法
当n 足够大,且np和n(1-p)均大于
5时,P 的分布接近正态分布,可用:

基本公式法:
2 2 2 A T ( A T ) ( A T ) ( A T ) 1 1 1 1 2 12 12 21 21 22 22 2
T 1 1
T 1 2
T 2 1
T 2 2
(AT ) , ( 行 数 1 ) ( 列 数 1 ) T
= 4.13
P325/例10-9
(三)四格表资料的连续性校正公式
适用条件:n≥40,1≤T<5 P327/例10-10

2 c
(A T 0 . 5 ) T
n2 2
2
( |a d b c |- ) n = ( a + b ) ( c + d ) ( a + c ) ( b + d )
1、建立假设:H0: π1= π 2、确定检验水准:α=0.05
2
H1: π1 ≠ π 3、计算各格子理论数 T
2
T11=100×44/220=20;
T21=120×44/220=24
4、计算统计量X2值: X2=(14-20)2/20+(86 -80)2/80
+(30 - 24)2/24+(90 - 96)2/96 = 4.13
式中,A为实际频数(actual frequency) T为理论频数(theoretical frequency)
2
用药组和对照组流感发病率比较
组别 用药组 发病人数 14(20) 未发病人数 86(80) 合计 发病率(%) 100 14
对照组

30(24)
90(96)
176
120
220
25

计 44

n≥40,T≥5 ,专用公式或基本公式 n≥40,1≤T<5,连续性校正公式

n<40 ,或T<1,确切概率法直接计算概率
( Fisher确切概率)
注意: X2 连续性校正仅用于 1 的四
格表资料,当
2
时,一般不作校正。
二、配对资料的卡方检验

P327/例10-11
配对资料数据表 甲种属性 乙种属性 + - 合计
(二)
2
专用公式法
2
( a d b c )n ( a b ) ( a c ) ( b d ) ( c d )
发生数 样本 1 样本 2 合 计 未发生数 合计 a+b c+d n
a c a+c
b d b+d
前例: 用药组和对照组流感发病率比较 组别 发病人数 未发病人数 合计 发病率(%)
用药组
对照组 合 计
14(a)
30(c) 44 a+c
86(b)
90(d) 176 b+d
100 a+b
120 c+d 220 n
14
25

检验步骤同前
( a d b c )n ( a b ) ( a c ) ( b d ) ( c d )
2
2
X
2
=
(14×90—86×30)2×220 100×120×44×176
发病人数
14(20) 30(24)
未发病人数
86(80) 90(96) 176
合计 发病率(%)
100 120 220 14 25 —
计 44
表中:
Байду номын сангаас14
86
30
90
是整个表的基本数字。
19世纪末Pearson 提出卡方检验统计量X2
值的基本公式(也称为Pearson X2值)
(AT) 2 T
行×列表资料卡方检验的注意事项
1、R×C表X2检验中,不需要进行连续性校正, 但如果有1/5以上格子的T<5 ,或有一格T
<1,应设法增加理论数,否则可能产生偏
性。处理方法有三种:

增大样本含量
合并(并组需注意合理性)
根据专业知识删去其所在行或所在列
2、R×C表X2检验,得到P≤0.05有统计学
+ -
合 计
a c
a+c
b d
b+d
a+b c+d
n
式中,a、d 为两法观察结果一致的两种情况,
b、c为两法观察结果不一致的两种情况。
检验统计量X2为:
(b c) b+c>40, , bc
2 2
1
2
b+c≤40,
2 c
( b c 1) bc
,
=1
2 结果比较 两 种 血 清 学 检 验
0.5 0.4 0.3
1 f( ) 2 2 ( /2 )
2 2
( /2 1 )
e
2 /2
ß ×¸ Ý
× Ô Ó É ¶ È £ ½ 1
0.2 0.1 0.0 0 3
3.84 7.81
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6


确定概率 P
统计推断结论
TRC
n R nC n
TRC
式中:
n R nC n
TRC—R行C列格子的理论数
相关主题