5第五章交叉表分析
第一节 交叉表格的独立性检验及效应量计算
一般交叉表分析使用的数据形式有两种情况: ① 第一种情况是已整理的汇总表数据; ② 第二种情况是对原始数据进行交叉表分析。
以下分别举例。交叉表分析的类型变量水平无 论是2*2,还是R*C(R>2, C>2),都是使用相 同的SPSS菜单命令。
5.1.1 汇总表数据的交叉表分析及效应量计算
计算效应量和统计检验力。
第一步:“性别”=女、“性别”=男、总计三个栏目的效 应量克莱姆 V系数分别为:0.321,0.481,0.413。
在本例中,需要定义两个变量“焦虑情况”,“ 患胃病情况”;变量“焦虑情况”有两个水平:1 为精神焦虑,2为非精神焦虑;“患胃病情况”有 两个水平:1为患病,2为不患病;变量“人数” 为计数频数。
第2步:进行人数加权。在单击菜单命令【数据 】【个案加权】,打开【个案加权】对话框。
第3步:启动分析过程。点击菜单【分析】【 描述统计】【交叉表】菜单命令
第四个表格:对称测量
计算皮尔逊卡方检验的卡方值的效应量和统计检 验力,其统计原理与计算公式可参见参考胡竹菁《心理
统计学》的第十一章第三节(胡竹菁. 心理统计学. 2010 年,第1版. 北京: 高等教育出版社)。
第三步:根据克莱姆 V系数值的大小和自由度查表确定克莱 姆 V系数的统计检验力。在本例中,由前面计算的效应量, 和第二步查询评定表的结果,可知卡方检验为小效应量,总 自由度为(2-1)*(2-1)=1,总体N为339,查询表5-3 统计检验力表,可知统计检验力为大约0.29,也就是说,本 例中精神焦虑与患慢性胃病这两个变量之间存在着关联,其 可能性为29%左右。 总之,在本例中,统计量检验显著(P小于0.05,拒绝原假 设),并且是小效应量。此时说明统计结论的可靠性较低, 还需进一步的研究资料佐证此结论,研究结果推广时要慎重。
第4步:设置分析变量。选择 “焦虑情况”变量 选入“行:”变量框中。选择“患胃病情况”变 量选入“列:”变量框中。
第5步:输出复式条形图和分布表。选中“ 显 示簇状条形图”复选框。
第6步:统计量选择。点击【统计】按钮,弹出 “交叉表:统计”的对话框
第7步:设置交叉表的显示。
第8步:设置输出格式。
SPSS操作步骤如下:
第1步:打开分析数据。打开“大学生学习与消 费调查问卷.sav”文件。
第2步:启动分析过程。点击【分析】【描述 统计】【交叉表】菜单命令.
第3步:设置分析变量。
第4步:输出复式条形图和分布表。选中“ 显示
簇状条形图”复选框。
第5步:统计量选择。点击【统计】按钮,弹出“ 交叉表:统计”的对话框。本例选中“ 卡方”, 表示将进行卡方检验分析。其他复选框都不选择。
案例:【例5-3】为了解大学生的专业承诺、与
大学生的学习兴趣、学习成绩之间的关系,通过 问卷调查获得了数据文件“专业承诺与学习兴趣 、学习成绩的关系.sav”。考虑的男女性别可能 有差异,性别可能是一个额外变量或控制变量, 因此将性别变量作为分层变量。
第1步:打开分析数据。打开“专业承诺与学习 兴趣、学习成绩的关系.sav”文件。
如果分层卡方分析的分层变量在几个分层之间的 分布不均,既可能削弱了原本存在的行变量与列 变量之间的关系,也可能使得原本不存在关系的 两个变量的关系呈现统计学显著性存在关系。因 此有利有弊。为了避免分层卡方分析带来的误差 ,分层卡方分析往往需要大样本数据。用于分层 的变量往往是性别、年级、职业、地区等人口学 变量。
由以上计算可知,在本例中,统计量检验显著(P小于0.05 ,拒绝原假设),并且是中效应量。此时说明统计结论(拒 绝原假设的结论)的可靠性尚可,基本可以认同此结论(拒 绝原假设)
第四个表格:交叉表(省略)。 第五个表格:性别与考研意向类型的卡方检验表。
[分析]:在性别与考研意向类型的卡方检验表中,皮尔逊 卡方检验的卡方值为2.857,显著值Sig值为0. 240>0.05, 接受原假设,即性别与考研意向类型之间是独立的,两变 量之间不存在着关联。换句话说,男女性别在考研意向上 不存在差异。
计算性别与英语四级的卡方值的效应量和统计检验力。
第一步:效应量克莱姆V系数为0.279。
第二步:根据Cohen(1992) 对克莱姆V系数效应量大小的 评定表(查询表5- 2),效应量0.279,很接近0.30,为中 效应量。
第三步:根据克莱姆V系数值的大小和自由度查表确定统计 检验力。这里卡方检验为中效应量,总自由度为(2-1)* (2-1)=1,总体N为286,查询表5-3统计检验力表,可知 统计检验力为大约0.99,即99%左右。
由【例5-1】的原始资料录入为原始数据文件“精神焦虑 与慢性胃病的调查原始信息数据.sav”,在SPSS中一行代 表一个被试记录,请对原始数据文件分析精神焦虑与慢性 胃病是否存在联系;并与【例5-1】的分析结果对比,比 较两种情况下的统计结果是否有差异。
第
五 章
第一节 交叉表格的独立性检验及效应量计算
第2步:启动分析过程。点击【分析】【描述统 计】【交叉表】菜单命令。
第3步:设置分析变量。选择 “专业承诺”变量选入“行
:”变量框中。选择“学习兴趣”、“学习成绩”变量选 入“列:”变量框中。 此外,在“层1的1”框内,将性别 变量从左边选择到分层变量框内。
第4步:统计量选择。点击【统计】按钮,弹出“交叉表
案例【例5-1】探讨慢性胃病的影响因素,研究
者调查了339人,得到调查数据初步汇总情况如下:
患慢性胃病 未患慢性胃病
精神焦虑患者
43
162
非精神焦虑患者
13
121
SPSS操作步骤如下:
第1步:输入数据。怎样将实际问题中的数据准 确转化、表达为SPSS中的数据,也是SPSS学习过 程中需要注意学习的一个方面,这是由实际问题 到数据处理、研究分析的一个“桥梁”。
第9步:在主对话框中点击【确定】按钮,提交 执行。
第10步:结果分析。
第一个表格:统计摘要表。(略) 第二个表格:精神焦虑与患胃病情况的交叉表。
第三个表格:卡方检验。
从表中可看出,皮尔逊卡方检验的卡方值为7.469,显著值Sig值为 0.006<0.05,应拒绝原假设,即认为精神焦虑与患慢性胃病是不独立的, 两变量之间存在着关联。
:统计”的对话框。本例选中“ 卡方”复选框, , “ 柯 克兰和曼特尔-亨塞尔统计”,其他复选框都不选择。
第5步:设置交叉表的显示。点击【单元格】按钮,弹出
“交叉表:单元显示”的对话框。 在“计算”栏内: 在 本例中,选中“ 实测”。其他复选框在本例中,均不选 择。
第6步:设置输出格式。点击【格式】按钮,弹出对话框
交 第二节 分层交叉表的独立性检验
叉 表
第三节 一致性卡方检验
分 析
第四节 列联表的品质相关分析
第五节 交叉表格分析的报告参考样例
第二节 分层交叉表的独立性检验
分层交叉表分析也可称为分层卡方分析,分层卡 方检验是把对象分解成不同的层次,每层分别研 究检验行变量与列变量的独立性。
第五章 交叉表分析
第一节 交叉表格的独立性检验及效应量计算 第二节 分层交叉表的独立性检验 第三节 一致性卡方检验 第四节 列联表的品质相关分析 第五节 交叉表格分析的报告参考样例
交叉表是指两个或多个分类变量各水平的频数 分布表,又称频数交叉表,列联表。
本章交叉表分析过程,既可以对数据进行汇总 ,也可以包括了独立性卡方检验、品质相关性 检验( Phi相关检验)。卡方检验、Phi相关检 验是分析交叉表资料常用的假设检验方法,这 两类分析处理的数据都是属于类别数据(名义 变量数据)。
计算性别与消费倾向类型的卡方值的效应量和统计检验力。
第一步:效应量克莱姆V系数为0.10。
第二步:根据Cohen(1992)对克莱姆V系数值效应量大小的 评定表(查询表5- 2),本例中更小自由度为1,在该评定 表中的第一行中查找,克莱姆V系数等于0.10,也就是说, 为小效应量。此时统计检验力则不需要查询。
【思考题】
在实际应用中,大部分测量数据都是获得原始数据,即获 得每个作答的具体信息,在SPSS录入的数据集中,一个被 试占一行记录。当然,有时也会获得的是计数数据,例如 统计满意度调查,或者简要汇总某些教育信息时。无论是 原始数据、还是汇总数据,最后所得的卡方检验结果是一 样的。不同的是,汇总数据在SPSS操作时,需要对“人数 ”等变量进行加权。
第6步:设置交叉表的显示。点击【单元格】按钮 ,弹出“交叉表:单元显示”的对话框。 在“计 算”栏内: 在本例中,选中“ 实测” 、“ 期望”。在“百分比”栏内: 选中“ 行”。其 他复选框在本例中,均不选择。
第7步:设置输出格式。 第8步:点击【确定】按钮,提交执行。 第9步:结果分析。
由以上计算可知,本例的统计量检验不显著(P大于0.05, 接受原假设),并且是小效应量。此时可以认同此统计结论 (接受原假设),在此情境下不需要进一步探讨研究。
第六个表格:性别与消费倾向类型的交叉表。(省 略)
第七个表格:性别与消费倾向类型的卡方检验表。 (省略)
具体分析,由同学们思考。
。 在本例中,按系统默认选择“⊙ 升序”。
第7步:在主对话框中点击【确定】按钮。 第8步:结果分析。。
第 二个表格:专业承诺 * 学习兴趣 * 性别的交叉表检验表
第四个表格:对称测量
表中“总计”所对应的卡方检验值,也就是未分层前的卡 方检验值。
一、独立性检验:是指两个或两个以上的分类 变量之间是相互独立的或者是相互联系的假设 检验。独立性检验,在有些研究中也称为同质 性检验。原假设 为:所观测的两个分类变量之 间没有关联。备择假设 为:所观测的两个分类 变量之间有关联,或存在相关。