当前位置:文档之家› 第十一章 卡方检验

第十一章 卡方检验


第一节 独立样本列联表的χ2检验
四格表资料: 1.完全随机设计的两样本率比较的χ2检验
2. 2 × 2列联表资料的χ2检验
3.R × C列联表资料的χ2检验
一、 χ2检验的基本思想
例11.1 某研究者欲比较甲、乙两药治疗小儿上消化 道出血的效果,将90名患儿随机分为两组,一组采 用甲药治疗,另一组采用乙药治疗,一个疗程后观 察结果,见下表。问两药治疗小儿上消化道出血的 有效率是否有差别?
Likelihood Ratio
10.338
1
.001
Fisher's Exact Test
.003
.002
Linear-by-Linear Association
9.761
1
.002
N of Valid Cases
90
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 11. 50.
理论频数(theoretical frequency)
理论频数的计算方法: 在H0成立的情况下,即甲药治疗小儿上消化道出
血的有效率与乙药治疗小儿消化道出血的有效 率相同。 则理论上两种人群有相同的有效率74.44%,这时 计算出其相应的各个格子的理论频数。
(a) T11
(b) T12
(c) T21
(d) T22
其基本公式:
∑ χ2 = (A - T)2
T
2
0.5
0.4
0.3
纵高
理 解χ2值
0.2 0.1
自由度=1 自由度=2 自由度=3 自由度=6
0.0
0
3
6
9
12
15
18
卡方值
χ2值反映了实际频数(A)和理论频数(T)的吻合程度
A与T相差越大,则 ∑ (A - T)2 值越大,反之越小。
将四个格子的值相加。
¾(一)多个样本率的比较
例11.3 某研究欲比较A、B、C三种方案治疗轻、中度高
血压的疗效,将年龄在50~70岁的240轻、中度高血压患
者随机等分为3组,分别采用三种治疗。一个疗程后观察
疗效,结果见下表。 问三种方案治疗轻、中度高血压有
无差别?
方案 A B C 合计表 11 Nhomakorabea4 3 种方案治疗轻、中度高血压的效果
Statistics :作卡方检验 4
结果:
组别 1 2
Total
组别 * 效果 Crosstabulation
Count Expected Count % within 组别 Count Expected Count % within 组别 Count Expected Count % within 组别
第十一章
χ2检验
要求掌握:
1. χ2检验的基本思想
2.成组和配对设计的两个样本率比较 熟悉内容: 3.多个样本率或构成比的比较 了解: 四格表的确切概率检验法
适用于
当应变量是分类变量时,即资料为定性 资料
χ2检验的应用
推断两个及多个总体率和构成比是 否有差别
两种或多种属性、变量之间有无关 联等(了解)
经济困难 没有必要 没有时间 其他
合计
293(87.99) 10(5.11) 17(3.00) 13(3.90) 333(100.00) 282(92.16) 9(2.94) 9(2.94) 6(1.96) 306(100.00)
575
19
26
19
639
6
检验步骤
结果:
Chi-Square Tests
卡方值 P值
Pearson Chi-Square Continuity Correctiona
Value 9.870b
8.410
df 1 1
Asymp. Sig. (2-sided) .002
.004
Exact Sig. (2-sided)
Exact Sig. (1-sided)
两组的有效率不同有两种可能:
一是两药的总体有效率无差别,两样本率的差别 由抽样误差引起;
一是可能两种药物的有效率确实不同。
χ2检验基本思想
假设这两种药物治疗小儿上消化道出血的有效率相 同, 即认为两样本率的差别由的抽样误差所致,而非 两种药物疗效本身所致,
那么则以本资料的合计有效率作为两药物共同的有 效率,从而推算出相应的两种药物的相应的频数,这 就是理论频数(T),这样可以推算出每个格子的理论 频数(T) ,比较实际频数(A)与理论频数(T)的吻合和 程度。
若H0成立,则这个和不应该很大 反之,若χ2值较大,则A与T相差较大,若A与T相差
太大,则H0正确的概率就小,因而怀疑并拒绝H0 , 接受H1。
这个界值则需要查去χ2界值表(附表9)
四格表的自由度
四格表自由度:
ν = (R -1)(C -1) ν =1
完全随机设计两样本率的比较
例11.1 1.建立假设,确定检验水准 H0:π1 = π2 , 两种药物治疗小儿上消化道出
Actual frequency
Theoretical frequency
H0:两种人群耐药率相同,即 π1 = π 2 = 74.44%
H1:两种人群耐药率不相同,即 π1 ≠ π 2
假设在H0成立的前提下,推算出每种情况可能 的频数(人数),用 T11 ,T12 ,T13,T14来表示在检 验假设成立下的理论频数
一、 χ2检验的基本思想
表8-1 两种疗法治疗原发性高血压的疗效
组别
有效
无效
合计 有效率%
甲药
27(25.8) 18(18.2) 45
a
b
60.00
乙药 合计
40(1c 5.2) 67
5(d10.8) 23
45
88.89
90(n) 74.44
1
分析
由于此时甲药组有效率(60.00%)和乙药组 的有效率(88.89% )仅是样本观察的结果, 存在抽样误差,不能通过直接比较得到关于 两药治疗小儿上消化道出血的有效率有无差 别的结论。
5
三、 行列表(R × C表)资料的χ2检验
公式
∑ χ 2 =
(A − T )2 T
∑ χ2 = n(
A2 -1)
nRnC
行×列表资料
① 多个样本率比较时, 有 R 行 2 列,称为 R ×2表;
② 两个样本的构成比比较时, 有 2 行 C 列,称 2×C 表;
③ 多个样本的构成比比较, 有 R 行 C 列,称为 R ×C 表。
血的有效率相同 H1:π1 ≠ π2 , 两种药物治疗小儿上消化道出
血的有效率不相同
α = 0.05
2.计算检验统计量
∑ χ 2 = (A - T)2 = 9.870 T 3.确定P值,做出结论: 查χ2界值表,得χ20.05,1界值=3.84, χ2 >χ20.05,1界
值,P<0.05,按 α 水准,拒绝H0,差别有统计学意
χ 2检验要注意应用条件
本资料若不校正时,
χ2 =
(ad − bc)2 n
= 4.477
(a + b)(c + d )(a + c)(b + d )
结论与之相反。
P < 0.05
SPSS结果
Chi-Square Tests
Pearson Chi-Square Continuity Correctiona
T RC
= n Rnc n
R:第R行 C:第C行
T11 = 67 = 74.44 45 90
T12 = 23 = 25.56 45 90
T21 = 67 = 74.44 45 90
T22 = 23 = 25.56 45 90
χ2检验的基本公式
χ2检验(chi-square test)是英国统计学家pearson于 1900年提出。
义,可认为两种药物治疗小儿上消化道出血的总体有 效率不等,乙药的有效率高于甲药。
(二)四格表专用公式
χ2 =
(ad − bc)2 n
(a + b)(c + d )(a + c)(b + d )
(三)四格表 统计量的连续性校正
χ2分布是一连续型分布,而四格表资料属离 散型分布,由此计算得的 χ2统计量的抽样分 布亦呈离散性质。为改善χ2 统计量分布的连 续性,则需行连续性校正(correction for continuity)。
Association
4.408
1
.036
N of Valid Cases
65
a. Computed only for a 2x2 table
b. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4. 92.
¾(二)两个或多个样本构成比的比较
例11.4 为了解新型农村合作医疗对于农村贫困 居民住院服务利用的影响,在经济条件相似的甲 乙两个国家级贫困县分别抽样调查,得到2006年 应者未住院原因。问甲乙两县应住院者未原因构 成比是否不同?
县别 甲 乙
合计
表 11.5 甲乙两县应住院者未住院原因构成比(%)
24
8(4.92) 32
75.00
乙药
31
合计
55
2
33
93.94
相关主题