9卡方检验
第九章 χ2 检 验(chi-square test)
第一节 χ2分布和拟合优度检验
第二节 独立样本2*2列联表资料的χ2检验 第三节 独立样本R*C列联表资料的χ2检验 第四节 资料的卡方检验 例9-6 设有132份食品标本,把每份标本一分为二,分 别用两种方法作沙门菌检验,检验结果见表9-8,试比较两种 检验方法的阳性结果是否有差别?
Tij
ni m j n
自由度为:ν=(行数-1)(列数-1)=(2-1)(2-1)=1
2
A T 2 64 57.842 21 27.162 51 57.162 33 26.842
T 57.84 27.16 57.16 26.84
表9-8 甲法 + 合计 两种检验方法检验结果比较 乙法 + 80(a) 31(c) 111 10(b) 11(d) 21 合计 90 42 132(固定值)
n1 a b 两变量阳性率比较的一般形式和符号 n n n cd 变 量2的 阳 性 率 2 n n 变量2 ab ac bc 变 变量1 性 率 变 量2的 阳 性 率 量1的 阳 阳性 阴性 n n n 变 量1的 阳 性 率
求出每个格子的理论频数后,可用下式进行分析
(A T ) 2 2 T
H0成立时,该统计量服从υ=k-1-s(s为计算Ti时利用样
本资料估计的参数个数)
(二)基本步骤 1.建立检验假设并确定检验水准 H0:π1=π2 ,即两药治疗消化道溃疡的愈合率相同 H1:π1≠π2 α=0.05 2. 计算检验统计量:H0成立时,两组有效概率相同,近似地等 于合并估计的有效概率,由此得到四格表中每一格的理论数,
14(11.2) 14(16.8) 16 24
1.建立检验假设并确定检验水准 H0:π1=π2 ,即两法总体缓解概率相同 H1:π1≠π2, 2. 计算检验统计量
k
α=0.05
2
i 1
2 ( Ai - Ti - 0.5)
3.确定P值,做出推断 P>0.05,按α=0.05水准,接受H0,拒绝H1,两总体频 率的差别无统计学意义。尚不能认为两种治疗方案的总 体缓解率不同。
(一)2*2列联表卡方检验的基本思想 表9-3 组别 Y1 Y2 独立样本资料的四格表 属性 合计
甲
乙 合计
a(T11)
c(T21) m1=a+c
b(T12)
d(T22) m2=b+d
n1=a+b(固定值)
n2=c+d(固定值) n
在H0成立的条件下,两样本分布的总体分布相等。而总体 分布未知,可用两样本联合计算的频率分布作为总体分布的 近似:属性Y1的理论概率近似等于m1/n,属性Y2的理论概率近 似的等于m2/n。因此H0成立时每个格子的理论频数近似等于:
二、拟合优度检验
求出样本均数为139.48,S=7.30
建立假设: H0:总体分布等于均数为139.48,标准差为7.30的正态分布 H1:总体分布不等于均数为139.48,标准差为7.30的正态分布 (一)拟合优度卡方检验的基本思想
1.设该样本是从某总体中抽取的简单随机样本。
2.把Xi的定义区间分成k个组段或类别。 3.记Ai表示n个样本观察值中落在第i组段的个数。 4.记Pi表示在H0成立条件下,样本值落在第i组段的概率。 5.记Ti表示根据H0确定的理论频数,Ti=n*Pi。
2 i 1
k
2 ( Ai - Ti - 0.5)
Ti
第九章 χ2 检 验(chi-square test)
第一节 χ2分布和拟合优度检验
第二节 独立样本2*2列联表资料的χ2检验 第三节 独立样本R*C列联表资料的χ2检验 第四节 配对设计资料的χ2检验 第五节 四格表的确切概率法
例9-2 将病情相似的169名消化道溃疡患者随机分为两组, 分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见表9-2。 问两种药物治疗消化道溃疡的愈合率有无差别? 表9-2 处理 洛赛克 雷尼替丁 合计 两种药物治疗消化道溃疡4周后疗效 疗效 愈合 64(57.84) 51(57.16) 115 未愈合 21(27.16) 33(26.84) 54 合计 85(固定值) 84(固定值) 169
(三)多个独立样本频率分布的比较 例9-5 试分析儿童急性白血病患者与成年人急性白血病 患者的血型分布如表9-7有无差别? 表9-7 分组 儿童与成年人急性白血病患者的血型分布 A型 B型 O型 AB型 合计
儿童 成人
合计
30 19
49
38 30
68
32 19
51
12 9
21
112 77
189
1. 建立检验假设并确定检验水准 H0:儿童与成年人急性白血病患者的血型分布相同 H1:儿童与成年人急性白血病患者的血型分布不相同
3. 确定P值 查附表8
自由度为:ν=(行数-1)(列数-1)=(3-1)(2-1)=2
2 2 0.005, 2 10.60 2 0.005, 2
P 0.005
4. 结论:按α=0.05水准,拒绝H0,接受H1,差别有
统计学意义。可认为三种药物的治疗效果不同或不全
相同。
2.确定检验水准α 3.选择检验方法,并计算检验统计量 4.确定P值,作出推断结论 P≤α,拒绝H0,接受H1 P>α,不拒绝H0
(三)拟合优度卡方检验的注意事项 1. 2值与实际频数和理论频数的差值有关,还和组数有关。 一般要求每格的理论频数不小于5。 2.要有足够的样本含量,如样本含量不足需进行连续性校正。
4.13
3. 确定P值 查附表8
02.05,1 3.84
2 2 0.05,1
P 0.05
4. 结论:按α=0.05水准,拒绝H0,接受H1,两总体频率
的差别有统计学意义。洛赛克的愈合率(75.29%)高于雷尼
替丁(60.71%).
(三)2*2列联表卡方检验专用公式:(T5,且n 40)
比较,共比较6次,于是两两比较的检验水准应取
α’=0.05/3=0.0167
(五)R*C列联表卡方检验注意事项 不能有1/5以上格子的理论频数小于5,或不能有一个理 论频数小于1,如出现理论频数不满足此要求,可用如下方法 处理:
1.增加样本含量,是最好的办法。
2.结合专业知识将该格所在行或列与别的行或列合并,可能 会损失信息。 3.改用R*C表的Fisher确切概率法,用软件完成。 4.资料同质,即具备可比性。
第九章 χ2 检 验(chi-square test)
第一节 χ2分布和拟合优度检验
第二节 独立样本2*2列联表资料的χ2检验 第三节 独立样本R*C列联表资料的χ2检验 第四节 配对设计资料的χ2检验 第五节 四格表的确切概率法
一、χ2分布 χ2 分 布 是 一 种连续型随 机变量的概 率分布。
ad bc 2 n 2 a b c d a c b d
四格表校正公式 :当(1T<5,且n 40)需校正
n ad bc n 2 2 a b c d a c b d
2
例9-3 将病情相似的淋巴系肿瘤患者随机分为两组,分别 做单纯化疗与复合化疗,两组的缓解率见表9-4,问两疗法的 总体缓解率是否不同? 表9-4 组别 单纯化疗 复合化疗 合计 缓解 2(4.8) 两种疗法缓解率的比较 未缓解 10(7.2) 合计 12 28 40 缓解率(%) 16.7 50.0 40.0
2检验的基本公式
2 =∑(A-T)2/T
式中A代表每个格子的实际频数( actual
frequency ),即表中的基本数据;T代表每个格子的理论
频数( theoretical frequency ) υ=k-1-s(s为用样本统计量估计总体参数的个数)
(二)拟合优度2检验的基本步骤 1.建立假设 H0:无效假设 H1:备择假设
α=0.05
2. 计算检验统计量:
2 R C Aij 2 n 1 0.695 i 1 j 1 n m i j
3. 确定P值 查附表8
自由度为:ν=(行数-1)(列数-1)=(2-1)(4-1)=3
2 2 0.75,3 1.21 2 0.75,3
图 9-1 若干χ2分布的概率密度曲 线
对于标准正态分布Z,Z2服从自由度为1的χ2分布。
设有v个相互独立的标准正态分布随机变量Z1,
Z2,…Zv,则Z12+Z22…+Zv2的分布服从自由度为v的χ2分布,
记为χv2。 当自由度大于1时,随着v的增加,曲线逐渐趋于对称; 当自由度趋于∞时,χ2分布逼近正态分布。
m1 n1m1 m2 n 1m 2 T11 n1 ( ) , T12 n1 ( ) n n n n m1 n 2 m1 m2 n 2m2 T21 n( ) , T22 n( ) 2 2 n n n n Tij的计算公式为: Tij ni m j n (i 1,2; j 1,2)
第一节 χ2分布和拟合优度检验
第二节 独立样本2*2列联表资料的χ2检验 第三节 独立样本R*C列联表资料的χ2检验 第四节 配对设计资料的χ2检验 第五节 四格表的确切概率法
(一)R*C列联表卡方检验的基本思想和计算步骤
设有一个定性变量,具有C个可能“取值”;现有R组 独立样本的频数分布,其数据如表9-5,这样的数据称为 R×C列联表。
表9-5
处理 1组 2组 … R 合计
独立样本R×C列联表
属性(水平) 合计 n1(固定值) n2(固定值) … nR(固定值) n
1
A11(T11) A21 (T21) … AR1 (TR1) m1