当前位置:文档之家› 列联表检验

列联表检验


不吸烟者的患癌率 9.7% 吸烟者的患癌率 21.0%
健康
Total
分析:给出了2×2列联表,其中表中给出了实际观测值和理论值。
C h i -S q u a r e Te s t s Value 7.469b 6.674 7.925 df Asymp. Sig. (2-sided) .006 .010 .005 Exact Sig. (2-sided) Exact Sig. (1-sided)
结果输出和讨论:
C a s e P r o c e s s in g S u m m ar y Valid N Percent 339 100.0% Cases Missing N Percent 0 .0% Total N Percent 339 100.0%
结果 * 吸烟情况
分析:处理记录缺失值情况报告,可见所有数据均是有效值。
或删去理论频数太小的行,列。
最小理论频数=最小行合计频数﹒最小列合计频数/总频数 3.多个总体率比较的卡方检验,若结论为拒绝原假设, 只能认为总体率之间不全等,不能说明任意两个总体率 有无差别,需做多重比较。
例:
判断患鼻咽癌与血型有无关系
分类
患癌者 健康人 合计
A型血
64 125 189
B型血
86 138 224
N (| O11O22 O12 O21 | 0.5 N ) 2 O1O2O1O2
df=1
(3) N<40或理论频数小于1,不能使用卡方检验,应使用Fisher精确 检验, 称为四格表确切概率法。
列联表的原假设是两个变量X和Y相互独立,计算卡方统 计量,当此统计量很大时否定原假设。
疗法
(3)列联表分析
菜单 “Analyze”|“Descriptive Statistics”|“Crosstabs ”命令
将“结果[result]” 点入“Row(s)” 框,将“吸烟情 况[smoke]”点 入“Cloumn(s)” 框。
点击“Statistics” 钮。
【Statistics钮】 用于定义所需计 算的统计量。
R ,C
2 Oij
2102 262 2 1 1.921 0.05 (3) 7.815 499 340 499 46
df=(2-1)(4-1)=3,单侧概率P>0.05,
不能以α=0.05水准的单侧检验拒绝H0,
总体率的差异无统计意义,不能认为患鼻咽癌与血型不独立。
Nominal by Nominal Contingency Coefficient N of Valid Cases a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis.
C h i -S q u a r e Te s t s Value 7.469b 6.674 7.925 df Asymp. Sig. (2-sided) .006 .010 .005 Exact Sig. (2-sided) Exact Sig. (1-sided)
Pearson Chi-Square 1 Continuity Correctiona 1 Likelihood Ratio 1 Fisher's Exact Test .007 .004 N of Valid Cases 339 a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 22.14.
2 2 若 (df ) 拒绝 H 0
注意:上述 检验适用于双向无序的 表(df≠1) 分组标志无数量大小和先后顺序之分。 分析的目的是考察两个属性之间是否独立。
疗效 好转 显效
26 388 15 25
疗法 中 医
痊愈
68 737
无效
3 5
合计
112 1155
西 医
注:1.双向无序列联表计算卡方统计量常用单侧检验。 2.若R×C列联表中理论频数出现小于1,或理论频数 出现小于5的格数超过总格数1/5时,必须增大样本例数; 或把理论频数太小的行,列与性质相近的邻行,列合并;
不加牛黄 32 加牛黄 76 合计 108
疗效
治愈 46 50 96 未愈
合计
78 126 204
“疗法”与“疗效”独立(即两组治愈率相同 ) N=204>40
2 2 N ( O O O O ) 204(32 50 46 76) 2 11 22 12 21 7.1969 O1O2O1O2 78 126 108 96
分析:由于最小理论值为22.14,N=339>40,所以选用普通的卡方 检验。
2 7.469, P 0.006 0.05
所以有理由拒绝吸烟与患病是独立的原假设,即认为 吸烟与患支气管炎是有关的。
S y m m et r i c M e as u r e s Value .147 339 Approx. Sig. .006
实际频数Oij与理论频数Eij的差异是随机误差, 用 Pearson卡方统计量反映实际Oij与理论Eij吻合程度
Eij Oi. O. j N
2 R ,C O ij 2 N 1 i , j 1 Oi O j
df ( R 1)(C 1)
保存为:“吸烟与慢性支气管炎的关系.sav”
(2).个案加权
在SPSS系统中,列联表的输入多采用频数表格的方式, 如果要对此类数据进行卡方分析等,必须采用个案加权 (weight by cases)进行数据处理后才能使用相关的统 计方法。
菜单 “Data” | “Weight Cases”命令
点击“Weight Cases by单选框”,选中“Freqency ”: 选入“频数[count]”。单击OK钮
2 . 四格表独立性检验
例1:某医院收得乙型脑炎重症病人204例,随机分成两 组,分别用同样的中草药方剂治疗,但其中一组加一定 量的人工牛黄,每个病人根据治疗方法和治疗效果进 行分类,得出如下表格:
疗效 治愈 32 76 108 未愈 46 50 96
疗法
合计
不加牛黄 加牛黄 合计
78 126 204
2 2 0.01 (1) 6.6349
H0 ()
统计结论:“疗法”与“疗效”不独立(即两组治愈率不 同) 专业结论:加人工牛黄组疗效高于不加人工牛黄组的疗效。
4.2 Crosstabs 过程 例: 调查339名50岁以上的人的吸烟习惯与患慢性气管 炎病的数据而建立如下列联表,试探讨吸烟与患慢性气 管炎之间的关系。 组别 患病组 健康组 不吸烟 13
给出了4种检验方法的结论。其中, 1)Pearson Chi-Square 即常用的卡方检验 (N≥40,理论频数≥5) 2)Continuity Correction 连续性校正的卡方值 (N≥40,理论频数小于5(但≥1)) 3)Likelihood Ratio 似然比卡方检验 4)Fisher's Exact Test : Fisher's确切概率法 (N<40或理论频数小于1)
Pearson Chi-Square 1 Continuity Correctiona 1 Likelihood Ratio 1 Fisher's Exact Test .007 .004 N of Valid Cases 339 a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 22.14.
疗法
合计
不加牛黄 加牛黄 合计
78 126 204
列联表:观测数据按两个或更多属性(定性变量)分类 时所列出的频数表。
R×C列联表:分类频数排成R行C列的列联表。 2×2表:二行二列的列联表,又称四格表 。 列联表分析:使用列联表进行分类资料的检验。
※双向无序
单向有序 列联表
双向有序且属性不同 双向有序且属性相同
双向无序四格表
(1) N≥40,理论频数≥5
2
2,2
(Oij Eij ) 2 Eij


i , j 1
N (O11O22 O12 O21 ) 2 O1O2O1O2
2
(2)N≥40,理论频数小于5(但≥1),用校正卡方统计量
2
i , j 1

2, 2
(| Oij Eij | 0.5) 2 Eij
O型血
130 210 340
AB型血
20 26 46
合计
300 499 799
第一行合计数,第四列合计数最小,最小理论频数
300 46 E14 17.27 5 799 H0:“患癌”与“血型”独立,H1:“患癌”与“血型”
不独立
2
642 862 N( 1) 799 i , j 1 Oi O j 300 189 300 224
点击“Chi-square复 2 值 选框”,计算 选择“Nominal”里 的“Contingency Coefficient”计算 Pearson列联相关 系数。 点击“continue”钮回 到上一对话框
点击”Cells”按钮
【Cells按钮】:用于 定义列联表单元格中 需要计算的指标。
勾选“Counts复选框组 中的输出实际观察数 “Observed”和理论数 “Expected” 选择“Percentages”里 的“column”计算列百分 比。点击“Continue”按 钮返回上一层对话框 。 点击”OK”按钮
相关主题