卡方检验基本公式检验办法
1122.59 15
18
卡方值
性质:若 2 (1 ), 2 (2 )互相独立,
则
2 (1 ) 2 (2 ) 服从 2分布, 自由度 1 2 2 (1 ) 2 (2 )服从 2分布, 自由度 1 2
称该分布具有可加性。
卡方检验的基本思想
四格表
(fourfold table)
Pi
a!b!c!d !n!
原理:P值为在无效假设成立的前提下,得到现有 样本四格表以及更极端情况下的四格表的概率。
四格表资料分析小结(重要)
Fisher’s exact probability法均适用 卡方检验是一种近似检验
(1)当n≥40,T>5时,可用。然而当P值接近0.05时最好用
Fisher’s exact probability法;
卡方检验
(Chi-square test)
2 检验(Chi-square test)是现代统计学的创始人
K. Pearson提出的一种具有广泛用途的统计方法。 该检验可用于两个及多个率(或者构成比)之间
的比较,分类资料的关联度分析,拟合优度检验等。
一、卡方检验的基本思想
首先介绍一个抽样分布:卡方分布 属连续型分布 可加性是其基本性质
TRC
行(row)合计 列(column)合计 总例数
nR nC n
2
( A T )2 ,
(R 1)(C 1)
T
2 (99 90.48)2 (5 13.52)2 (75 83.52)2 (21 12.48)2
90.48
13.52
8பைடு நூலகம்.52
12.48
12.86
v (2 1)(2 1) 1
表7-1 两组降低颅内压有效率的比较(P112)
组别
试验组 对照组 合计
有效
99 75 174
无效
5 21 26
合计
104 96 200
有效率(%)
95.20 (p1) 78.13 (p2) 87.00 (pc)
实际频数A (actual frequency) 理论频数T (theoretical frequency)
二、四格表资料专用公式
为了省去计算理论频数T, 可由基本公式推导出,直接 由各格子的实际频数(a、b、c、d)计算卡方值的公式:
基本公式: 2 ( A T )2 T
a
(a b)(a abc
c) 2 d
b
(a b)(b d ) 2 a b c d
(a b)(a c)
(a b)(b d )
2
,
2 (
)服从均数为,方差为2的正态分布
χ2分布(Chi-square distribution)
0.5 0.4
f
( 2)
1 2(
/ 2)
2 2
( / 21)
e2 / 2
纵高
0.3 0.2 0.1 0.0
0
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
校正公式:
一般认为: 四格表在n>40时出现有任一格
1 ≤ T<5时,需要校正。
c2
( A T 0.5)2 T
2 c
(a
( ad bc n / 2)2 n b)(c d )(a c)(b
d)
例7-2 P114
例子
2 c
(
46
8 52
6
18 26
78 2)2 64 14
78
2 0.005,1
7.88;
P 0.005
查附表8,P715
如果 2
2 0.05,1
3.84;
P
0.05
如果 2
2 0.05,1
3.84;
P 0.05
三、连续性校正公式
χ2分布是一连续型分布,而四格表资料属离散型资料,
对 其 进 行 校 正 称 为 连 续 性 校 正 (correction for continuity),亦称Yates校正(Yates' correction)。
3 3.84 6 7.81 9
1122.59 15
18
卡方值
χ2检验的基本公式
2
(A T )2 ,
T
(R 1)(C 1)
上述检验统计量由K. Pearson提出,因此许多统计软 件上常称这种检验为Pearson’s Chi-square test,下面将要 介绍的其他卡方检验都是在此基础上发展起来的。
(2) 当n≥40,有任一格1≤T<5时,可用Yates校正公式;
(3) 当n<40或有T<1时,用Fisher’s exact probability。
2 0.01(1)
6.63
(2.5758)2
Z2 0.01/ 2
(2) Z1 , Z2 ,..., Z 互相独立,均服从 N (0,1) ,
则 Z12
Z
2 2
...
Z2的分布称自由度为 的
2 分布,
记为
2 (
)
或
2
(
) ,或简记为
2.
图形:
自由度
很大时,
2 (
)
近似地服从正态分布.有
Z
2 ( )
3.14
,
1
因为有一格1<T<5,且n>40时,所以应用连续性校
正χ2检验。
四、精确概率法(Fisher’s exact probability)
在无效假设成立的前提下且周边合计固定时,产生任意 一个四格表(i)的概率Pi 服从于超几何分布,其计算式为:
a b!c d !a c!b d !
d
(c a
d b
)(b c
d) d
2
(c d )(b d )
abcd
abcd
abcd
(ad bc)2 n
(a b)(c d )(a c)(b d )
1 ; (四格表 2检验专用公式)
上面的例子
2 (99 21 5 75)2 200 12.86 , 1
104 96 174 26
它反映了理论数与实际数的吻合情况,该统计量近似
地服从自由度为ν的卡方分布。
查附表8,P715
χ2分布(Chi-Square distribution)
0.5 0.4
f
( 2)
1
2(
/ 2)
2
2
( / 21)
e2 / 2
纵高
0.3 0.2 0.1 0.0
0
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
唯一参数,即自由度
(1) 自由度为 1 的 2分布
若 Z ~ N (0,1),则 Z 2的分布称为自由度为 1 的 2分布.
(Chi-square
distribution),记为
2 (1)
或
2
(1)
.
图形:
0.3
0.2
0.1
0.0
0
2
4
6
8
10
2 0.05(1)
3.84
(1.96)2
Z2 0.05/ 2