SPSS卡方检验的操作原理
卡方检验
`
浙江大学医学院流行病与卫生统计学教研室
沈毅
内容提要
卡方检验基础 四格表卡方检验 配对卡方检验与一致性检验 两分类变量间关联程度的度量 分层卡方检验 小结
卡方检验用途:
1、方差同质性测验(又称Bartlett test):用于做正态性检验的条件。 无效假设:方差同质;(P<0.05) 备择假设,方差异质;(P>0.05) 2、适合性检验:Test for goodness-of-fit 无效假设:符合理论分布;(P<0.05) 备择假设,不符合理论分布;(P>0.05) 3、独立性检验:Test for independence,用于检验两个变数是否相关 无效假设:两个变数相互独立;不相关;(P<0.05) 备择假设,两个变数彼此相关;(P>0.05)
浙江大学医学院流行病与卫生统计学教研室
沈毅
两分类变量间关联程度的度量
相对危险度RR:是一个概率的比值,指试验组人群反应阳性概率 与对照组人群反应阳性概率的比值。数值为1,表明试验因素与 反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生 率降低;大于1时,表明试验因素导致反应阳性的发生率增加。 优势比OR:是一个比值的比,是反应阳性人群中试验因素有无的 比例与反应阴性人群中试验因素有无的比例之比。 当关注的事件发生概率比较小时(<0.1),优势比可作为相对危 险度的近似。
两种方法的检测结果
乳胶凝集法 免疫荧光法 + - 合计 + 11 2 13 - 12 33 45 合计 23 35 58
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
首先建立数据文件,如下。
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
同理,由于是频数表数据,应该先用weight cases进行预 处理。
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
在Pearson卡方检验中,对行列变量的相关性作了检 验,其中的行列变量是一个事物的两个不同属性。 实际应用中,还有一种列联表,其中的行列变量反映的 是一个事物的同一属性。例如把每一份标本分为两份,分 别用两种方法进行化验,比较两种化验方法的结果是否有 本质不同;或分别采用甲、乙两种方法对同一批病人进行 检查,比较此两种方法的结果是否有本质不同,此时要用 配对卡方检验。 浙江大学医学院流行病与卫生统计学教研室 沈毅
沈毅
一致性检验
在Pearson 卡方检验中,对行变量和列变量的相关性作检 验,其中行变量和列变量是一个事物的两个不同属性。 在实际中,还有一种列联表,其行变量和列变量反映的是 一个事物的同一属性的相同水平,只是对该属性各水平的 区分方法不同。其特征是:行的数目和列的数目总是相同 的。如果希望检验这两种区分同一属性的方法给出的结果 是否一致,则不应当使用Pearson χ2检验,而应该采用 Kappa一致性检验对两种方法一致程度进行评价。 浙江大学医学院流行病与卫生统计学教研室 沈毅
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
检验两个变量是否存在显著性差异
例1 某种药物加化疗与单用某种药物治疗的两 种处理方法,观察对某种癌症的疗效,结果见下 表。(数据见cancer.sav)
疗效 处理 药物加化疗 单用药物 合计 有效 42 48 90 无效 13 3 16 合计 55 51 106
沈毅
卡方检验基础 χ2检验的基本思想
首先假设H0成立,计算出χ2值,它表示观察值与理论值之间 的偏离程度。根据χ 2 分布,χ 2 统计量以及自由度可以确定 在H0成立的情况下获得当前统计量及更极端情况的概率P。 如果 P 很小,说明观察值和理论值偏离程度太大,应当拒 绝原假设,表示比较资料之间有显著性差异;否则就不能 拒绝原假设,尚不能认为样本所代表的实际情况与理论假 设有差别。
沈毅
四格表卡方检验
几种卡方检验的比较: 连续性校正χ2检验:
仅适用于四格表资料,在n>40,所有期望频数均大于1,只有1/5单元 格的期望频数大于1小于5时;
Fisher精确概率法:
在样本含量<40或有格子的期望频数<1的列联表,应该采用该法;
似然比χ2检验:
当n>40,最小期望频数>5时,结论与Pearson χ2基本一致;
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
其他的检验见下文。
浙江大学医学院流行病与卫生统计学教研室 沈毅
卡方检验基础
χ2检验是以χ2分布为基础的一种假设检验方法,主 要用于分类变量,根据样本数据推断总体的分布与 期望分布是否有显著差异,或推断两个分类变量是 否相关或相互独立。其原假设为: H0:观察频数与期望频数没有差别
浙江大学医学院流行病与卫生统计学教研室
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
Chi-Square Tests
结果分析
Asymp. Sig. Exact Sig. Exact Sig. (2-sided) (2-sided) (1-sided) 1 1 1 .000 .001 .000 .000 13.910 1 .000 .013c 58 .000
结果分析
表示药物加化疗与单用药物治疗某种癌症的疗效比较的行 ×列表,除了观察值以外,还有期望值。 浙江大学医学院流行病与卫生统计学教研室 沈毅
四格表卡方检验
结果分析
此为四格表χ2检验的结果,χ2=6.508,P=0.011,差异有显著性 意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。
浙江大学医学院流行病与卫生统计学教研室
配对卡方检验
配对卡方检验公式:
若b+c>40,则用公式:
χ
2
(b − c ) = b + c
2
若b+c≤40,则用公式:
χ =
2
( b − c − 1) b+c
2
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
例2 某实验室分别用乳胶凝集法和免疫荧光法对58名
可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结 果见下表,问两种方法的检测结果有无差别?(数据见 McNemar.sav)
浙江大学医学院流行病与卫生统计学教研室
沈毅
一致性检验
一般认为, 当Kappa≥0.75时,表明两者一致性较好; 0.75>Kappa ≥0.4时,表明一致性一般; Kappa<0.4时,表明两者一致性较差。
浙江大学医学院流行病与卫生统计学教研室
沈毅
一致性检验
注意:
Kappa检验会利用列联表的全部信息,而McNemar 检验 只会利用非主对角线单元格上的信息。因此,对于一 致性较好,即绝大多数数据都在主对角线的大样本列 联表,McNemar检验可能会失去实用价值。
不能忘记 哦!
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
在此选入频数变量即可进 行下一步的分析。
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
选中进行配对 卡方检验
又如模拟值和实际值之间的检验
两种治疗方法的疗效比较
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
首先建立数据文件,如下。
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
注意:由于上表给出的不是原始数据,而是频数表数据,应 该进行预处理。
浙江大学医学院流行病与卫生统计学教研室
沈毅
一致性检验
结果分析
如果在crosstab过程的 statistics子对话框中勾选上Kappa 复选框,则有以下结果:
Symmetric Measures Asymp. a b Value Std. ErrorApprox. T Approx. Sig. Measure of Agree Kappa N of Valid Cases a.Not assuming the null hypothesis. ing the asymptotic standard error assuming the null hypothesis. .455 58 .115 3.762 .000
浙江大学医学院流行病与卫生统计学教研室
沈毅
卡方检验基础
χ2值的计算:
( A − E) χ =∑ E
2
2
由英国统计学家Karl Pearson首次提出,故被 称为Pearson χ2 。
浙江大学医学院流行病与卫生统计学教研室
沈毅
卡方检验基础-卡方分布
当n比较大时, χ2 统计量近似服从k -1个自由度的χ2分布。 在自由度固定时,每个χ 2 值与一个概率值( P 值)相对 应,此概率值即为在H0 成立的前提下,出现这样一个样本 或偏离假设总体更远的样本的概率。如果 P 值小于或等于 显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不 一致。如果 P 值大于显著性水准,则不拒绝H0 ,认为观察 频数与期望频数无显著性差异。 P 值越小,说明H0 假设正 确的可能性越小; P 值越大,说明H0 假设正确的可能性越 大。 浙江大学医学院流行病与卫生统计学教研室 沈毅