统计学卡方检验
例8-1(P150)。 表8-1两种药物治疗消化道溃疡4周后疗效
处理
愈合 未愈合 合计
愈合率(%)
奥美拉唑 64(57.84) 21(27.16) 85
75.29
雷尼替丁 51(57.16) 33(26.84) 84
60.68
合计 115
54
169
68.05
基本格子只有四个的列联表称为四格表 (four fould table),或 22 表。
AR1(TR1)
AR2(TR2)
… YC
…
A1C (T1C )
… A2C (T2C )
…
…
…
ARC (TRC )
合计
n1(固定值) n2(固定值)
…
nR (固定值)
合计
m1
m2 …
mc
n
统计量公式:
(二)多个独立样本频率的比较(例8-3)
表8-5三种不同治疗方法治疗慢性支气管炎的疗效
组别 A药 B药 C药
ni 为 i 行的合计数
n 为总的合计数
T11
85115 169
57.84
T21
84115 169
57.16
T12
8554 169
27.16
T22
8454 169
26.84
x2 (AT ) T
(6457.84)2 (2127.16)2 (5157.16)2 (3326.84)2 4.13
法阳性率。
二、配对 R R 列联表资料的 x2 检验
可用于 RC 列联表资料的差异检验、关联性检验。
8-9
例8-6(P159)。
8-10
0.05
k 为类别数 ni 和 mi 分别为第行合计和第列合计
k 131 2
查 2 界值表得
2 02.05,2
02.05,2 5.99
139.48,标准差为7.30的正态分布。
知识回顾 Knowledge Review
P 0.05
按 0.05 检验水准,不拒绝 H0,尚不能认为甲法测定
结果的概率分布与乙法测定结果的概率分布不同。
第四节 四格表的确切概率法
基本思想:在四格表四个周边合计不变的条件下,计 算获得现有数值以及更不利于H0 的数值的概率,再
根据 水准对 H0作出推断。
例8-7(P160)。
22
138.0
33
142.0
20
146.0
11
150.0
6
154.0
5
合计
120
0.00832 0.03240 0.09704 0.22642 0.41967 0.63503 0.811411 0.92522 0.97665
0.03240 0.09704 0.22642 0.41967 0.63503 0.81411 0.92522 0.97665 0.99441
8-11
8-12
P 0.114224 0.023797 0.0000010.213749 0.214
按 0.05 检验水准,不拒绝 H0 ,尚不能认为甲药治疗
精神抑郁症的效果与乙药不同。
第五节 卡方检验用于拟合优度检验
1. 原理
判断样本观察频数(Observed frequency) 与理论(期望)频数(Expected frequency )之差
× Ô ÓÉ ¶È £½ 1 × Ô ÓÉ ¶È £½ 2 × Ô ÓÉ ¶È £½ 3 × Ô ÓÉ ¶È £½ 6
P=0.05的临界值
3 3.84 6 7.81 9
1212.59 15
18
¿¨· ½ Öµ
2分布随自由度不同而变化。记为 (2, )。
查附表8: (20.05,1) 3.84
0.05
表8-13 120名男生身高(cm)的频数分布表及拟合优度检验统计量的计算
组段 (1)
观察频数 Ai
(2)
(li u)
( (3))
(ui u)
(4)
pi 理论频数
(5)
Ti
=(4)-(3) (6)
(Ai Ti ) Ti
(7)
122.0
5
126.0
8
130.0
10
134.0
57.84
27.16
57.16
26.84
(R1)(C1) R表示行数 C表示列数
R
查 2界值表(附录三附表)得
2 4.13 02.05,1 3.84
02.05,13.84
故P 0.05
按 0.05检验水准,拒绝 H0,接受 H1,两样本频率
的差异优统计学意义。因为奥美拉唑的愈合率为75%, 雷尼替丁的愈合率为60.71%,可以认为奥美拉唑的愈合 率比雷尼替丁的愈合率高。
第八章 2 检验
可用于单个频数分布的拟合优度检验,两组定 性资料(两率、两构成比)的差异检验、关联性检 验,多组定性资料(多个率、多个构成比)的差异 检验、配对设计定性资料的差异检验、列联表资料 的差异检验、关联性检验,多个方差的齐性检验等。
第一节 独立样本四格表资料的 2检验
2检验不仅可以用于推断单个样本的频率 分布是否等于某种给定的理论分布, 还可以检 验两个样本的总体分布是否相同。
0.02408 0.06463 0.12939 0.19325 0.21536 0.17908 0.11111 0.05143 0.01776
-
2.8900 1.54053 7.7557 0.00769 15.5263 1.96698 23.1898 0.06104 25.8433 1.98188 21.4898 0.10328 13.3331 0.40827 6.1717 0.00477 2.1309 3.86289
是否由抽样误差所引起。
2分布和拟合优度检验
一、 2 分布
2分布是一种连续型随机变量的概率分布。
χ2分布(chi-square distribution)
Ý×߸
0.5 0.4 0.3 0.2 0.1 0.0
0
f
( 2)
2
2
(
/ 21)
e2 / 2
四格表专用公式:
例8-1按该式得:
x2
(64332151)2169
4.13
(6421)(5133)(6451)(2133)
适用条件:1. n 40 2 . T 5
计算最小理论数即可确定。
当资料条件:1. n 40
需校正:
2.5 T 1
当资料条件:1. n 40 2. 或 T 1
总上所述,要比较两种检验方法阳性率有无差别, 只要对其中的频数b与c做 2检验即可。
H0 :1 2,
H1:1 2
0.05
即两种检验方法的阳性率相同 即两种检验方法的阳性率不相同
适用条件:
bc40
适用条件: b c 40
x2 (bc) (1031)2 10.76
应选用Fisher确切概率法。
例8-2(P153)。
8-3
T11
1216 40
4.8
2141014 40 240
2
2 2.62
12281624
查 2界值表(附录三附表8)得 02.10(1) 2.71
2 02.10(1)
P 0.10
若 2太大,超出一定范围时,就有理由认为H0不成
立,从而拒绝 定的分布。
H0 ,接受 H1
,认为资料不服从所假
v k 1 s
例8-8(P162)。
H0 : 总体分布等于均数为139.48,s 7.30 的正态分布
H1 :总体分布不等于均数为139.48,s 7.30的正态分 布
2
32.74
2
0.005,2
10.60
P 0.005
按 0.005 检验水准,拒绝 H0 ,可以认为这三种药物的治疗效果不同或不全 相同。
(三)多个独立样本频率分布的比较
例8-4试分析儿童急性白血病患者与成年人急性白血病 患者的血型分布(表8-6)有无差别?
表8-6 儿童急性白血病患者与成年人急性白血病患者的血型分布
分组
A型
儿童
30
B型
O型
38
32
AB型 12
合计 112
成人
19
30
19
9
77
合计
49
68
51
21
189
H0 : 儿童急性白血病患者与成年人急性白血病患者的血型分布相同
H : 儿童急性白血病患者与成年人急性白血病患者的血型分布不相同 1
a 0.05
=0.695
v (21)(41) 3
按 0.05检验水准,不拒绝H0 ,尚不能认为
两种治疗方案的总体缓解概率不同。
第二节 独立样本R×C列联表资料的 2 检验
(一)R×C列联表 2 检验的基本思想和计算步骤
处理
1 2 … R
表8-4 独立样本R×C列联表
属性
Y1
A11(T11) A21(T21)
Y2
A12(T12) A22(T22)
v 1
bc 1031
查x2界值表,02.005,1 7.88 2 02.005,1 P 0.005 按 0.05 检验水准,拒绝 H0,可以认为两种检验方
法的阳性结果有差别。鉴于甲法阳性率为90/132=68.20%,乙
法阳性率为111/132=84.09%,可以认为乙法阳性率高于甲