当前位置：文档之家› 第十一章_卡方检验精编版

第十一章_卡方检验精编版

v k 1 s (R 1)(C 1)
式中，k为格子数，s为估计的参数个数，R为行数， C为列数。如本例中，4个格子，估计甲乙两药的有效率，则k=4， s=2，v=4-1-2=(2-1)(2-1)=1。
2 检验的基本公式:
2 (A T)2 T
一定自由度下，如果假设检验H0 (π1=π2)成立，则实际频数和理论频数之差一般不会相差太大，值2 相应也不会太大; 反之，实际频数和理论频数之差相差很大，则值相2应也会很大，大到什2么程度认为不是抽样误差造成的而是两个不同总体呢？
n为总例数，A为每个格子的实际频数，nR为与A同行的行合计，nC为与A同列的列合计。
(一) 多个样本率的比较
例11.3 某研究者欲比较A、B、C 三种方案治疗轻、中度高血压的疗效，将年龄在50~70岁的240例轻、中度高血压患者随机等分为3组，分别采用三种方案治疗。一个疗程后观察疗效，结果见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别？
表11.4 三种方案治疗轻、中度高血压的效果
① 建立假设
H0：π1＝π2＝π3
H1：三种方案治疗轻、中度高血压的有效率不等或不全等
② 确定检验水准
α=0.05
③ 计算统计量2值
2 n(
A2 1)
nR nC
742
62
92
240 (
...
1) 13.868
80 203 80 37
若H0成立，则理论上：
甲药组有效人数为：T11
45
67 90
33.5
甲药组无效人数为：
T12
45
23 90
11.5
乙药组有效人数为：
T21
45
67 90
33.5
乙药组无效人数为：
T22
45
23 90
11.5
T nRnC n
T nRnC n
n R为相应行的合计
nC为相应列的合计
n 为总例数。
表11.1 甲、乙两药治疗小儿上消化道出血的效果
一、卡方检验的基本思想
表11.1中，27、18、40、5 是整个表的基本数据，是
实际观察得到的，其余数据都是从这四个基本数据相加而得的，这种资料是两组两分类资料，称为四格表 (fourfold table)，亦称2×2表(2×2 table)。（画黑板）
表两独立样本率比较的四格表
无效假设H0为π1=π2，即两种药物治疗小儿消化道出血的有效率相同，两样本的有效率的差别仅有抽样误差所致。由于此时总体情况未知，故用样本合计有效率对总体有效率进行估计，即H0为π1=π2=74.44％，在此基础上，可以推算每个格子的期望频数，称为理论频数，用符号T表示；从样本观察到的频数称为实际频数，用符号A表示。
① 建立假设 H0: π1＝π2 H1 : π1≠π2
② 确定检验水准
α=0.05
③ 计算统计量 2值
本例
Tmin =T12
32 10 65
4.92，
1 T12
5，而n>40,
故应计算校正的卡方值。
χ2=
( ad-bc -n/2)2n
( 24 2 - 8 31 - 65 / 2)2n
=
3.140
1. 当n≥40，且T≥5时，不须校正，直接用基本公式 (11.2)或专用公式(11.5)计算。
2. 任一格子的1≤T<5，且n≥40时，需计算校正值2 ，
或使用四格表的确切概率法。
2 ( A T 0.5)2
T
2
( ad - bc - n / 2)2n
(a b)(c d)(a c)(b d)
用途
完全随机设计下两个或多个样本率(或构成比配对设计下两组频数分布线性趋势卡方检验推断两变量间有无相关关系等。
本章内容
第一节独立样本列联表资料的卡方检验第二节配对设计资料的卡方检验第三节拟合优度的卡方检验第四节线性趋势卡方检验第五节四个表的确切概率法
第一节完全随机设计(独立样本)列联表资
(a+b)(c+d)(a+c)(b+d) 32 33 5510
④ 确定P值自由度＝(行数－1)(列数－1)＝(2－1)(2－1)＝1,
查 2界值表得P>0.05。
⑤ 下结论
因为P>0.05，按α=0.05的水准，还不拒绝H0，即差异没有统计学意义。即还不能认为两药治疗下
呼吸道感染的有效率有差别。
d
当n＜40或Tmin＜1时，改用四格表确切概率计算法。（χ2检验所得概率P≈α时）
• 完全随机设计四格表资料χ2检验适用条件
例：
组别
两组人群尿棕色阳性率比较
阳性数
阴性数
合计
铅中毒病人
29
对照组
9
合计
83
7
36
28
37
35
73
阳性率％
80.56 24.32 52.05
• 完全随机设计四格表资料χ2检验适用条件
① 建立假设 H0：π1＝π2 H1：π1≠π2
② 确定检验 7 36 - 71 / 2)2 71 2.75 33 38 62 9
④ 确定P值
υ＝(2－1)x(2－1)＝1，查界2 值表得P>0.05。
⑤ 下结论因为P>0.05，按α=0.05的水准，不拒绝H0，差异无统计学意义。尚不能认为甲、乙两疗法对小儿单纯性消化不良的治愈率不等。
(27 33.5)2 (18 11.5)2 (40 33.5)2 (5 11.5)2
9.870
33.5
11.5
33.5
11.5
④ 确定P值
自由度＝(行数－1)(列数－1)＝(2－1)(2－1)＝1,
查 2界值表得P<0.01。
⑤ 下结论
因为P<0.01，按α=0.05的水准，拒绝H0，接受 H1，差异有统计学意义。即可认为两药治疗小儿上消化道出血的有效率有差别，其中乙药的有效
阳性例数 3 5 （2.9） 8
阴性例数 32 15 47
阳性率％ 8.57 40.00 14.55
三、R×C列联表资料的 2检验。
当基本数据的行数或列数大于2时，统称为行列表或 RC表。
RC表的 2检验主要用于多个样本率(或构成比)的比
较。
行列资料 2检验的专用公式
2 n(
A2 1)
nRnC
当P≤，则有理由认为无效假设不成立，
继而拒绝H0，作出统计推断。
二、2×2列联表资料的 2检验。 (一) 2×2列联表资料 2检验的步骤
现以例11.1说明2×2列联表资料 2检验的步骤
① 建立假设 H0: π1＝π2 H1 : π1≠π2
② 确定检验水准 α=0.05
③ 计算统计量 2值
2 (A T)2 T
表11.1 甲、乙两药治疗小儿上消化道出血的效果
研究目的: P1 P2
1 ？ 2
表11.1 甲、乙两药治疗小儿上消化道出血的效果
两组的有效率不同有两种可能： 1. 两药的总体有效率无差别，两样本率的差别仅由抽
样误差所致。 2. 两种药物的有效率确有不同。
一、χ2检验基本思想
（1）建立检验假设 H0：π1= π2 两药的有效概率相同 H1： π1≠π2 两药有效概率不同检验水准=0.05 （2）计算检验统计量
80 37
④ 确定P值
υ＝(3－1)(2－1)＝2，查界2 值表得P<0.01。
⑤ 下结论
因为P<0.01，按α=0.05的水准，拒绝H0，接受 H1，差异有统计学意义。即可认为三种方案治疗轻、中度高血压的有效率不等或不全等
例：
组别
男性
女性
合计
实验组
35
65
100
对照组
40
合计
75
60
100
125
200
• 完全随机设计四格表资料χ2检验适用条件
例：肝硬化与再障性贫血血清中抗血小板抗体阳性率（％）
组别
观察例数
阳性例数
阳性率％
肝硬化
35
3
8.57
再障
20
5
40.00
合计
55
8
16.67
组别肝硬化再障合计
观察例数 35 20 55
率高于甲药。
(二) 四格表的专用公式
2
(ad - bc)2n
(a b)(c d)(a c)(b d)
a、b、c、d 分别为四格表中的四个实际频数，n为总
例数。本例：
2 (27 5 -18 40)2 90 9.870 45 45 67 23
(三) 四格表 2 统计量的连续性校正
2检验的基本公式:
2 (A T)2 T
从基本公式可以看出， 2 统计量值反映了实际频数和理论频数的吻合程度。
2 值与什么有关？ 1.与A与T的差别/吻合程度有关。 2.与格子数，严格地说是自由度有关。
由 2 统计量的公式(11.2)可以看出， (A T)2 0，格
T
子数越多，非负数之和，则卡方值越大，即卡方值的大小除了与A与T的差别大小有关外，还与格子数量有关。因而考虑卡方值大小的同时，应同时考虑格子数的多少。引入自由度v。
实例1 已知北方农村儿童前囟门闭合月龄为14.1 月。某研究者从东北某县抽取36名儿童，得囟门闭合月龄均值为14.3月，标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否与一般儿童不同？
问题1: 研究目的是什么? 问题2: 用什么方法解决?
实例2：某军区总医院欲研究A、B、C三种降血脂药物对家兔血清肾素血管紧张素转化酶（ACE）的影响，将26只家兔随机分为四组，均喂以高脂饮食，其中三个试验组，分别给予不同的降血脂药物，对照组不给药。一定时间后测定家兔血清ACE浓度（u/ml），如表1，问四组家兔血清ACE浓度是否相同？

e商务文档

第十一章_卡方检验精编版

相关文档推荐：