卡方检验的SPSS操作
a Continuity Correction 11.836
df
b. 0 cells (.0%) have expected count less than 5. The minimum expected count 16. c. Binomial distribution used.
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
又如模拟值和实际值之间的检验
两种治疗方法的疗效比较
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
首先建立数据文件,如下。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
注意:由于上表给出的不是原始数据,而是频数表数据,应 该进行预处理。
沈毅 沈毅
卡方检验基础-卡方分布
当n比较大时, χ2 统计量近似服从k -1个自由度的χ2分布。 在自由度固定时,每个χ 2 值与一个概率值( P 值)相对 应,此概率值即为在H0 成立的前提下,出现这样一个样本 或偏离假设总体更远的样本的概率。如果 P 值小于或等于 显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不 一致。如果 P 值大于显著性水准,则不拒绝H0 ,认为观察 频数与期望频数无显著性差异。 P 值越小,说明H0 假设正 确的可能性越小; P 值越大,说明H0 假设正确的可能性越 大。 浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室 沈毅 沈毅
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
一致性检验
一般认为, 当Kappa≥0.75时,表明两者一致性较好; 0.75>Kappa ≥0.4时,表明一致性一般; Kappa<0.4时,表明两者一致性较差。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
首先建立数据文件,如下。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
同理,由于是频数表数据,应该先用weight cases进行预 处理。
不能忘记 哦!
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
选中进行配对 卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
Chi-Square Tests
结果分析
Asymp. Sig. Exact Sig. Exact Sig. (2-sided) (2-sided) (1-sided) 1 1 1 .000 .001 .000 .000 13.910 1 .000 .013c 58 .000
沈毅 沈毅
一致性检验
注意:
Kappa检验会利用列联表的全部信息,而McNemar 检验 只会利用非主对角线单元格上的信息。因此,对于一 致性较好,即绝大多数数据都在主对角线的大样本列 联表,McNemar检验可能会失去实用价值。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结 果见下表,问两种方法的检测结果有无差别?(数据见 McNemar.sav)
两种方法的检测结果
乳胶凝集法 免疫荧光法 + - 合计 + 11 2 13 - 12 33 45 合计 23 35 58
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
似然比χ2检验:
当n>40,最小期望频数>5时,结论与Pearson χ2基本一致;
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
在Pearson卡方检验中,对行列变量的相关性作了检 验,其中的行列变量是一个事物的两个不同属性。 实际应用中,还有一种列联表,其中的行列变量反映的 是一个事物的同一属性。例如把每一份标本分为两份,分 别用两种方法进行化验,比较两种化验方法的结果是否有 本质不同;或分别采用甲、乙两种方法对同一批病人进行 检查,比较此两种方法的结果是否有本质不同,此时要用 配对卡方检验。 浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室 沈毅 沈毅
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
卡方检验基础 χ2检验的基本思想
首先假设H0成立,计算出χ2值,它表示观察值与理论值之间 的偏离程度。根据χ 2 分布,χ 2 统计量以及自由度可以确定 在H0成立的情况下获得当前统计量及更极端情况的概率P。 如果P 很小,说明观察值和理论值偏离程度太大,应当拒 绝原假设,表示比较资料之间有显著性差异;否则就不能 拒绝原假设,尚不能认为样本所代表的实际情况与理论假 设有差别。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
配对卡方检验
配对卡方检验公式:
若b+c>40,则用公式:
χ
2
(b − c ) = b + c
2
若b+c≤40,则用公式:
χ =
2
( b − c − 1) b+c
2
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
例2 某实验室分别用乳胶凝集法和免疫荧光法对58名
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
卡方检验基础
χ2值的计算:
( A − E) χ =∑ E
2
2
由英国统计学家Karl Pearson首次提出,故被 称为Pearson χ2 。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
几种卡方检验的比较: 连续性校正χ2检验:
仅适用于四格表资料,在n>40,所有期望频数均大于1,只有1/5单元 格的期望频数大于1小于5时;
Fisher精确概率法:
在样本含量<40或有格子的期望频数<1的列联表,应该采用该法;
1、方差同质性测验(又称Bartlett test):用于做正态性检验的条件。 无效假设:方差同质;(P<0.05) 备择假设,方差异质;(P>0.05) 2、适合性检验:Test for goodness-of-fit 无效假设:符合理论分布;(P<0.05) 备择假设,不符合理论分布;(P>0.05) 3、独立性检验:Test for independence,用于检验两个变数是否相关 无效假设:两个变数相互独立;不相关;(P<0.05) 备择假设,两个变数彼此相关;(P>0.05)
结果分析
表示药物加化疗与单用药物治疗某种癌症的疗效比较的行 ×列表,除了观察值以外,还有期望值。 浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室 沈毅 沈毅
四格表卡方检验
结果分析
此为四格表χ2检验的结果,χ2=6.508,P=0.011,差异有显著性 意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
检验两个变量是否存在显著性差异
例1 某种药物加化疗与单用某种药物治疗的两 种处理方法,观察对某种癌症的疗效,结果见下 表。(数据见cancer.sav)
疗效 处理 药物加化疗 单用药物 合计 有效 42 48 90 无效 13 3 16 合计 55 51 106
一致性检验
结果分析
如果在crosstab过程的 statistics子对话框中勾选上Kappa 复选框,则有以下结果:
Symmetric Measures Asymp. a b Value Std. ErrorApprox. T Approx. Sig. Measure of Agree Kappa N of Valid Cases a.Not assuming the null hypothesis. ing the asymptotic standard error assuming the null hypothesis. .455 58 .115 3.762 .000
Value Pearson Chi-Square Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association McNemar Test N of Valid Cases a. Computed only for a 2x2 table 14.154b 14.550
沈毅 沈毅
配对卡方检验
在此选入频数变量即可进 行下一步的分析。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验