当前位置:文档之家› 培训_11第十一章卡方检验

培训_11第十一章卡方检验


卡方界值 表
第一节 2检验的基本思想
1.2分布的密度函数
f
(
2)

1
2 Γ


2
2
1 2
2

e 2

2
参数:自由度
2. 2分布的图形 (=1,2,3,4,6,10)
2. 2分布的图形
(=10,20,30,50,60)
3. 2分布的分位数

(11-6)
式 11-6 称为四格表资料2 检验的 Yates 校正公式,适用条件是总例数 n40 且 1T<5。
H0:1 =2,即两个科室用药不当的发生率相同 H1: 12,即两个科室用药不当的发生率不同 =0.05 软件计算结果:最小理论频数为 3.14,因此,应用 Yates 校正的2 检验公式 计算检验统计量2 值。 2 2.87 ,P=0.0900。从而按=0.05 的检验水准不拒绝 H0,尚不能认为该医院内一科、内二科用药不当发生率不同。本例若不进行 Yates 连续性校正,而用式 11-5,则计算得 2 4.22 ,得 P=0.0399,结论相反。
∵ 137/425=0.322>0.267
第三节 两独立样本率比较
(四格表资料)的2检验
一、两独立样本率比较的频数表四格表
二、四格表资料2检验的专用公式
三、四格表资料2检验的校正公式
一、两独立样本率比较的频数表四格表
两独立样本率比较时,基本事件对应四个频数,即每个样本中的阳性事件数和阴性
小若。由现有样本得到了较大的 2值(大
于界值2(, )),则按 检验水准拒绝
H0,接受H1;否则不拒绝H0 。
2(,)
Pearson 2的Yates连续性校正(Yates correction for
continuity)
当总例数
n
太小或有的格子理论频数
T
较小时,基于
H0
假设计算的
获取途径
获取健康知识内容
合计 慢性病预防 传染病预防 安全与急救 基本医疗
传统大众媒体
18
19
22
68
127
互联网
72
18
15
11
116
社区健康教育
36
25
83
27
171
合计
126
62
120
106
414
H0:社区居民获取健康知识的内容与途径无关联 H1:社区居民获取健康知识的内容与途径有关联 =0.05 经软件计算, 2 149.92 ,P<0.0001。因此按=0.05 的检验水准拒绝 H0,接受 H1,认为该地社区居民获取健康知识的内容与途径有关联。
事件数,因此相应的频数表通常称为四格表(fourfold table)或 22 表,四个格子分别对
应四个基本事件的频数,样本中观察到的实际频数可用 a,b,c,d 表示,见表 11-3。
表 11-3 两独立样本率比较的四格表
样本
阳性事件
阴性事件
合计
样本 1
a
样本 2
c
合计
a+c
b
a+b取了若干医院,并将两地医院按级别和规模进行配对,共 66 对。
在每家医院随机对门诊及住院患者进行问卷调查,调查内容包括医疗水平、服务态度、
收费合理性等,按照最后的综合评价指标将医院服务质量分为合格与不合格,评价结果
见表 11-7。问两地医院的合格率是否不同?
H0:两地医院的合格率相同,即总体 B=C H1:两地医院的合格率不同,即总体 BC

6.28 ,
=1
3. 确定 P 值,做出推断结论。
2 1,0.05

3.84

2 1,0.01

6.63 ,本例
2 1,0.05

2

2 1,0.01
,因此得
0.01<P<0.05,从而
按=0.05 的检验水准拒绝 H0,接受 H1,认为内科医生的季节性流感疫苗接种率高于全 体医疗卫生工作人员的总接种率。
——行列表资料的2检验
1.多个独立样本率的比较
2.样本构成比的比较
3.两个无序分类变量的关联性检验
*4.多个样本率/构成比的两两比较
行列表资料的2检验
多个独立样本率的比较、样本构成比的比较,以及推断
两无序分类变量有无关联性的检验,其资料均可整理成
多行多列的二维频数表形式,所用的 检验公式也完全
第十一章 2检验
本章要求: 掌握 2检验基本思想与应用条件;率之间的比较以及PSS实现 熟悉 两样本率比较的精确概率计算法(fisher确切概率法) 了解 趋势性2检验方法;频数分布拟合优度检验
第一节 2检验的基本思想
一、2 分布
2分布是一种连续型随机变量的概率分布。
若Zi ~ N (0,1)
区/县
两周内患病人数
两周内未患病人数
合计
A区
591
B区
105
C区
267
D县
371
1790 2195 983 879
2300 2300 1250 1250
合计
1334
5766
7100
患病率(%) 25.7 4.6 21.4 29.7 18.8
H0:该地四区县居民的两周患病率相同,即1 =2=3 =4 H1:该地四区县居民的两周患病率不同或不全相同 =0.05
根据题意,首先列出四格表,见表 11-4。
表 11-4 某地区男、女两周患病情况调查结果
性别
患病人数
未患病人数
合计
患病率(%)
男性
604 (649.9)
2855 (2809.1)
3459
17.46
女性
730 (684.1)
2911 (2956.9)
3641
20.05
合计
1334
5766
7100
18.79
二、2检验的基本思想
首先根据检验假设H0计算各格子的理论频数,用
2 ( A T )2
T
反映各格实际频数与理论频数的吻合程度。
若 H0 成立,理论上实际频数与理论频数应相等,但由
于抽样误差的存在,样本中的 A 与 T 不会完全相等,
但应相差不大,即在一次抽样中得到较大2值的概率很
,
则称
2

Z
2 1

Z
2 2

Z
2 3
...
Z
2 v
为服从自由度为v 的 2 分布。
记作
2


。 2分布的形状依赖于自由度 的大小,当自由度 2
时,随着
的增加,曲线逐步趋于对称,当自由度无穷大时, 2分布逼近正态分布。
各种自由度的 2分布右侧尾的面积为 的临界值见附表。
为此,需进行假设检验(McNemar test),其检
验统计量为 2 :
2 (b c)2 , 1 , (b c) 40 (11-7)
bc

2 c

( b c 1)2 bc

1, (b c)

40
(11-8)
例 11-4 某卫生行政部门为了解甲、乙两地医疗卫生机构的服务质量,从两地用分
相同,因此通常可称此类频数表为行列表(或RC
表),式11-9则称为行列表 检验的专用公式。
2 n(
A2 1)
nr nc
(11-9)
=(行数-1)(列数-1)
1.多个独立样本率比较
例 11-5 对于本章章前案例(3),整理出频数表,见表 11-9。
表 11-9 某地四个区/县居民两周患病率的比较
第二节 单样本率比较的2检验
2

a n 0 2 n 0 1 0
例 11-1 据了解,某年某地所有从事医疗卫生工作的专业人员季节性流感疫苗的
接种率为 26.7%。现随机抽查了综合性医院的内科医生 425 人,接种流感疫苗者有 137
人,问内科医生的接种率与医疗卫生工作人员的总接种率是否相同?
软件计算结果: 2 479 .45 ,P<0.0001。从而按=0.05 的检验水准拒绝 H0,接受 H1, 认为该地四区县居民的两周患病率不同或不全相同。
2. 样本构成比的比较
例 11-6 本章章前案例(4),按表 11-1 资料,比较中心城区与郊区/县的调查对象参加 社会医疗保险类别的构成比是否相同。
c+d (n2)
b+d
a+b+c+d (n)
二、四格表资料2检验的专用公式
专用公式:
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
例 11-2 本章章前案例(2)的调查对象中,男性 3459 人,两周内患病者 604 人,
女性 3641 人,两周内患病者 730 人。问该地区男、女两周患病率是否不同?
=0.05
甲地
表 11-7 两地医院综合评价结果的比较
乙地
合计
合格
不合格
合格
23
20
43
不合格
8
15
23
合计
31
35
66
软件计算结果: 2 4.32 ,P=0.036。从而按=0.05 的检验水准拒绝 H0,认为患者
对两地医院综合评价结果的合格率不同,甲地高于乙地。
第五节 多个独立样本率或构成比比 较
三、四格表资料2检验的校正公式
四格表资料2 检验时,如果某个格子理论频数较小,但又不至于太小,比如 1T<5, 可对2 统计量经 Yates 校正后,再查2 界值表以确定 P 值。即用式 11-2 计算2 值,对
相关主题