当前位置:文档之家› 第十一章_卡方检验精编版

第十一章_卡方检验精编版

v k 1 s (R 1)(C 1)
式中,k为格子数,s为估计的参数个数,R为行数, C为列数。 如本例中,4个格子,估计甲乙两药的有效率,则k=4, s=2,v=4-1-2=(2-1)(2-1)=1。
2 检验的基本公式:
2 (A T)2 T
一定自由度下,如果假设检验H0 (π1=π2)成立,则实际频数和 理论频数之差一 般不会相差太大, 值2 相应也不会太大; 反之, 实际频数和理论频数之差相差很大,则 值相2应也会很大,大 到什2么程度认为不是抽样误差造成的而是两个不同总体呢?
n为总例数,A为每个格子的实际频数,nR为与A同 行的行合计,nC为与A同列的列合计。
(一) 多个样本率的比较
例11.3 某研究者欲比较A、B、C 三种方案治疗轻、中 度高血压的疗效,将年龄在50~70岁的240例轻、中度高 血压患者随机等分为3组,分别采用三种方案治疗。一 个疗程后观察疗效,结果见表11.4。问三种方案治疗轻、 中度高血压的有效率有无差别?
表11.4 三种方案治疗轻、中度高血压的效果
① 建立假设
H0:π1=π2=π3
H1: 三种方案治疗轻、中度高血压的有效率不等或 不全等
② 确定检验水准
α=0.05
③ 计算统计量2值
2 n(
A2 1)
nR nC
742
62
92
240 (
...
1) 13.868
80 203 80 37
若H0成立,则理论上:
甲药组有效人数为:T11
45
67 90
33.5
甲药组无效人数为:
T12
45
23 90
11.5
乙药组有效人数为:
T21
45
67 90
33.5
乙药组无效人数为:
T22
45
23 90
11.5
T nRnC n
T nRnC n
n R为相应行的合计
nC为相应列的合计
n 为总例数。
表11.1 甲、乙两药治疗小儿上消化道出血的效果
一、卡方检验的基本思想
表11.1中,27、18、40、5 是整个表的基本数据,是
实际观察得到的,其余数据都是从这四个基本数据相加 而得的,这种资料是两组两分类资料,称为四格表 (fourfold table),亦称2×2表(2×2 table)。 (画黑板)
表 两独立样本率比较的四格表
无效假设H0为π1=π2,即两种药物治疗小儿消化道出血 的有效率相同,两样本的有效率的差别仅有抽样误差所 致。由于此时总体情况未知,故用样本合计有效率对总 体有效率进行估计,即H0为π1=π2=74.44%,在此基础 上,可以推算每个格子的期望频数,称为理论频数,用 符号T表示;从样本观察到的频数称为实际频数,用符 号A表示。
① 建立假设 H0: π1=π2 H1 : π1≠π2
② 确定检验水准
α=0.05
③ 计算统计量 2值
本例
Tmin =T12
32 10 65
4.92,
1 T12
5,而n>40,
故应计算校正的卡方值。
χ2=
( ad-bc -n/2)2n
( 24 2 - 8 31 - 65 / 2)2n
=
3.140
1. 当n≥40,且T≥5时,不须校正,直接用基本公式 (11.2)或专用公式(11.5)计算。
2. 任一格子的1≤T<5,且n≥40时,需计算校正 值2 ,
或使用四格表的确切概率法。
2 ( A T 0.5)2
T
2
( ad - bc - n / 2)2n
(a b)(c d)(a c)(b d)
用途
完全随机设计下两个或多个样本率(或构成比 配对设计下两组频数分布 线性趋势卡方检验 推断两变量间有无相关关系等。
本章内容
第一节 独立样本列联表资料的卡方 检验 第二节 配对设计资料的卡方检验 第三节 拟合优度的卡方检验 第四节 线性趋势卡方检验 第五节 四个表的确切概率法
第一节 完全随机设计(独立样本)列联表资
(a+b)(c+d)(a+c)(b+d) 32 33 5510
④ 确定P值 自由度=(行数-1)(列数-1)=(2-1)(2-1)=1,
查 2界值表得P>0.05。
⑤ 下结论
因为P>0.05,按α=0.05的水准,还不拒绝H0,即 差异没有统计学意义。即还不能认为两药治疗下
呼吸道感染的有效率有差别。
d
当n<40或Tmin<1时,改用四格表确切概率计算法。 (χ2检验所得概率P≈α时)
• 完全随机设计四格表资料χ2检验适用条件
例:
组别
两组人群尿棕色阳性率比较
阳性数
阴性数
合计
铅中毒病人
29
对照组
9
合计
83
7
36
28
37
35
73
阳性率 %
80.56 24.32 52.05
• 完全随机设计四格表资料χ2检验适用条件
① 建立假设 H0:π1=π2 H1:π1≠π2
② 确定检验 7 36 - 71 / 2)2 71 2.75 33 38 62 9
④ 确定P值
υ=(2-1)x(2-1)=1,查 界2 值表得P>0.05。
⑤ 下结论 因为P>0.05,按α=0.05的水准,不拒绝H0,差 异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良的治愈率不等。
(27 33.5)2 (18 11.5)2 (40 33.5)2 (5 11.5)2
9.870
33.5
11.5
33.5
11.5
④ 确定P值
自由度=(行数-1)(列数-1)=(2-1)(2-1)=1,
查 2界值表得P<0.01。
⑤ 下结论
因为P<0.01,按α=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为两药治疗小儿 上消化道出血的有效率有差别,其中乙药的有效
阳性例数 3 5 (2.9) 8
阴性例数 32 15 47
阳性率% 8.57 40.00 14.55
三、R×C列联表资料的 2检验。
当基本数据的行数或列数大于2时,统称为行列表或 RC表。
RC表的 2检验主要用于多个样本率(或构成比)的比
较。
行列资料 2检验的专用公式
2 n(
A2 1)
nRnC
当P≤,则有理由认为无效假设不成立,
继而拒绝H0,作出统计推断。
二、2×2列联表资料的 2检验。 (一) 2×2列联表资料 2检验的步骤
现以例11.1说明2×2列联表资料 2检验的步骤
① 建立假设 H0: π1=π2 H1 : π1≠π2
② 确定检验水准 α=0.05
③ 计算统计量 2值
2 (A T)2 T
表11.1 甲、乙两药治疗小儿上消化道出血的效果
研究目的: P1 P2
1 ? 2
表11.1 甲、乙两药治疗小儿上消化道出血的效果
两组的有效率不同有两种可能: 1. 两药的总体有效率无差别,两样本率的差别仅由抽
样误差所致。 2. 两种药物的有效率确有不同。
一、χ2检验基本思想
(1)建立检验假设 H0:π1= π2 两药的有效概率相同 H1: π1≠π2 两药有效概率不同 检验水准=0.05 (2)计算检验统计量
80 37
④ 确定P值
υ=(3-1)(2-1)=2,查 界2 值表得P<0.01。
⑤ 下结论
因为P<0.01,按α=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为三种方案治疗轻、 中度高血压的有效率不等或不全等
例:
组别
男性
女性
合计
实验组
35
65
100
对照组
40
合计
75
60
100
125
200
• 完全随机设计四格表资料χ2检验适用条件
例:肝硬化与再障性贫血血清中抗血小板抗体阳性率(%)
组别
观察例数
阳性例数
阳性率%
肝硬化
35
3
8.57
再障
20
5
40.00
合计
55
8
16.67
组别 肝硬化 再障 合计
观察例数 35 20 55
率高于甲药。
(二) 四格表的专用公式
2
(ad - bc)2n
(a b)(c d)(a c)(b d)
a、b、c、d 分别为四格表中的四个实际频数,n为总
例数。 本例:
2 (27 5 -18 40)2 90 9.870 45 45 67 23
(三) 四格表 2 统计量的连续性校正
2检验的基本公式:
2 (A T)2 T
从基本公式可以看出, 2 统计量值反映了实际频数和理 论频数的吻合程度。
2 值与什么有关? 1.与A与T的差别/吻合程度有关。 2.与格子数,严格地说是自由度有关。
由 2 统计量的公式(11.2)可以看出, (A T)2 0,格
T
子数越多,非负数之和,则卡方值越大,即卡方值的 大小除了与A与T的差别大小有关外,还与格子数量 有关。因而考虑卡方值大小的同时,应同时考虑格子 数的多少。引入自由度v。
实例1 已知北方农村儿童前囟门闭合月龄为14.1 月。某研究者从东北某县抽取36名儿童,得囟门 闭合月龄均值为14.3月,标准差为5.08月。问该 县儿童前囟门闭合月龄的均数是否与一般儿童不同?
问题1: 研究目的是什么? 问题2: 用什么方法解决?
实例2:某军区总医院欲研究A、B、C三种降 血脂药物对家兔血清肾素血管紧张素转化酶 (ACE)的影响,将26只家兔随机分为四组, 均喂以高脂饮食,其中三个试验组,分别给予 不同的降血脂药物,对照组不给药。一定时间 后测定家兔血清ACE浓度(u/ml),如表1, 问四组家兔血清ACE浓度是否相同?
相关主题