第七章列联表分析7.1 列联表(Crosstabs)分析的过程7.2 列联表的实例分析7.1 列联表 (Crosstabs) 分析的过程列联表分析的过程是对两个变量之间关系的分析方法。
被分析的变量可以是定类变量也可以是定序变量。
系统是通过生成列联表对两个变量进行列联表分析的。
列联表分析的功能可以通过下述操作来实现。
图7-1 列联表分析对话框1.打开列联表分析对话框执行下述操作:Analyze→Descriptive→Crosstabs 打开Crosstabs 对话框如图7-1 所示。
2.确定列联分析的变量从左侧的源变量窗口中选择两个定类变量或定序变量分别进入Row(s)(行)窗口和Column(s)(列)窗口。
进入Row(s)窗口的变量的取值将作为行的标志输出,而进入Column(s)窗口的变量的取值将作为列的标志输出。
Display clustered bar charts 是在输出结果中显示聚类条图。
Suppress table 是隐藏表格,如果选择此项,将不输出R×C 列联表。
3.选择统计分析内容单击statistics 按钮,打开statistics 对话框,如图7-2 所示。
图7-2statistics 对话框下面介绍该对话框中的选项和选项栏的内容:(1)Chi-square 是卡方(X2)值选项,用以检验行变量和列变量之间是否独立。
适用于定类变量和定序变量。
(2)Correlations 是皮尔逊(Pearson)相关系数r 的选项。
用以测量变量之间的线性相关。
适用于定序或数值变量(定距以上变量)。
(3)Nominal 是定类变量选项栏。
选项栏中的各项是当分析的两个变量都为定类变量时可以选择的参数。
1)Contingency coefficient:列联相关的C 系数,由卡方系数修正而得。
2) Phi and Cramer's V:列联相关的V 系数,由卡方系数修正而得。
3)Lambda:λ系数。
4)Uncertainty Coefficient:不定系数。
(4)Ordinal 是定序变量选项栏。
选项栏中的各项是当分析的两个变量都为定序变量时可以选择的参数。
1)Gramma:Gramma 等级相关系数。
2)Somers’d:Somers 等级相关d 系数。
3)Kendall’s tau-b:肯得尔等级相关tau-b 系数。
4)Kendall’s tau-c:肯得尔等级相关tau-c 系数。
(5)Nominal by Interval 选项栏中的Eta 是当一个变量为定类变量,另一个变量为数值变量时,测量两个变量之间关系的相关比率。
系统默认状态是不输出上述参数。
如需要可自行选择。
上述选择做完以后,单击Continue 返回到Crosstabs 对话框。
4.确定列联表内单元格值的选项单击Cells(单元格)按钮,打开Cell Display 对话框,如图7-3 所示。
图7-3 Cell Display 对话框(1)Counts 是单元格的频次选项栏。
1)Observed:观测值的频次。
2)Expected:期望频次。
系统默认状态是输出观测值的频次。
(2)Percentages 是确定输出百分比的选项栏。
该选项栏中的选项用于确定在输出文件中的列联表单元格中是否要输出百分比。
1)Row:单元格中个案的数目占行总数的百分比。
2)Column:单元格中个案的数目占列总数的百分比。
3)Total:单元格中个案的数目占个案总数的百分比。
(3)Residuals 是确定残差的选项栏。
1)Unstandardized:非标准化残差。
2)Standardized: 标准化残差3) Adj. Standardized:调整的标准化残差上述选择做完以后,单击Continue 按钮,返回到Crosstabs 对话框。
5.确定列联表的行顺序单击Format(格式)按钮,打开Format 对话框,如图7-4 所示。
在该对话框中可以选择在输出的列联表中行的排列是升序还是降序。
系统默认是升序。
选择做完以后,单击Continue 按钮,返回到Crosstabs 对话框。
图7-4Format 对话框6.单击OK 按钮,提交运行。
即可在输出文件的Output 窗口中输出列联表。
7.2 列联表的实例分析实例:对“休闲调查1”中的“性别”和“对闲暇生活的满意度—夫妻共度闲暇时间状况”进行列联表分析,并进行卡方检验。
打开数据文件“休闲调查1”后,执行下述操作:1.Analyze→Descriptive→Crosstabs 打开Crosstabs 对话框。
2.从左侧的源变量窗口中选择“性别”变量进入到Row(s)窗口中,选择“对闲暇生活的满意度—夫妻共度闲暇时间状况”变量进入到Column(s) 窗口中。
3.单击Statistics 按钮,打开statistics 对话框。
选择Chi-square 选项。
单击Continue 返回到Crosstabs 对话框。
4.单击Cell 按钮,打开Cell Display 对话框。
选择Row 选项。
单击Continue 返回到Crosstabs 对话框。
5.单击OK 按钮,提交运行。
系统打开Output 窗口并输出如表7-1、表7-2、和表7-3的统计分析结果。
表7-1 统计概要Case Processing Summary表7-2 列联表性别* 对闲暇生活的满意度—夫妻共度闲暇时间状况 Crosstabulation表7-3 卡方检验表Chi-Square Testsa.2 cells (20.0%) have expected count less than 5. Theminimum expected count is 3.47.在卡方检验表中中各项的内容分别为:◆Pearson Chi-Square:皮尔逊卡方值◆Likelihood Ratio:似然比卡方(初学者可不必了解)。
◆N of Valid Cases:有效Cases 数◆Asymp. Sig. (2-sided):双尾的非对称的显著性检验。
卡方检验表下面的说明是:有2 个格值(占总格值数的20%)的期望频次小于5。
卡方检验要求期望频次小于5 的格值数不应超过25%,本实例的检验满足要求,卡方检验的结果是有效的。
卡方检验的结果表明,皮尔逊卡方值为检验的显著性水平已达到0.014,小于0.05,说明男女两性对夫妻共度闲暇时间状况的满意度有显著差异。
结合表7-2 中的行百分比可以看出女性的满意度低于男性,而不满意度则高于男性。
说明女性更渴望夫妻共同度过闲暇时间。
第八章多选变量分析8.1 用多选变量生成新变量8.1.1 用多选变量生成新变量的过程8.1.2 用多选变量生成新变量的实例8.2 多选变量的频次分析8.2.1 对多选变量进行频数分析的过程8.2.2 对多选变量进行频数分析的实例8.3 多选变量的列联分析8.3.1 对新变量进行列联分析的过程8.3.2 对新变量进行列联分析的实例多选变量是指对于包含了多个答案的一个问题,可以允许被调查者在其中作多项选择。
多项选择题可以在SPSS 中做成多个内容相同的变量。
对于多选变量进行分析时,我们不仅希望知道某些选项在第一选、第二选或第三选中分别被多少人选择过(通过frequency 解决),我们还希望知道某些选项在多次选择中总共被选择了多少次,这个问题要通过多选变量分析来解决。
现以“休闲调查1”中的“娱乐活动目的”一题的回答结果为例,来阐述多选变量的分析过程。
由于娱乐活动目的是多方面的,因此允许被调查者在给出的六个答案中做三项选择。
每一项选择都在SPSS 的数据文件中做成一个变量,即做成了三个相同内容的变量。
对这三个变量的分析就是多选变量的分析。
但要注意,一定要把这些变量设置成为数值型变量,否则无法进行多选变量的分析。
多选变量分析的基本过程分为两步来进行。
第一步是用三个多选变量生成一个新变量。
第二步是对新生成的变量进行分析。
8.1 用多选变量生成新变量8.1.1 用多选变量生成新变量的过程1.选择要分析的多选变量执行下述操作:Analyze→Multiple Response(多选变量)拉出二级菜单,如图8-1 所示。
图8-1 多选变量分析的二级菜单在Multiple Response 的二级菜单中。
下面两项是隐含的,只有Define Sets(定义多选变量)可以选择。
单击Define Sets 打开定义多选变量对话框,如图8-2 所示。
图8-2 多选变量分析对话框在该对话框中Set Definition 窗口左上角列出的是备选变量。
Variables in Set 窗口中的是被选中的变量。
在Set Definition 窗口中选择将要进行分析的多选变量,使之进入Variables in Set 窗口中。
2.确定多选变量的值在多选变量分析对话框中,Variables Are Coded As 是定义多选变量的值的选项栏。
Dichotomies 为二分模式,即所有属于“Counted value”项的值均被计为1,而其它值则被计为0。
Categories 为分类模式,可在指定范围内保持原有数据的值。
范围以外的将被视为缺失值。
可将多选变量的取值范围输入到后面的两个窗口中。
前一个窗口输入范围的低值,后一个窗口输入范围的高值。
3.确定新生成的变量名和变量名的标签在Name 窗口中输入新生成的变量名。
在Label 窗口中输入新生成的变量名的标签。
4.上述选项作完以后,便激活了Add 按钮。
单击Add 按钮,便把定义好的变量添加到Mult response Sets(多选变量集)的窗口中。
5.单击Close 按钮完成多选变量集的定义。
此时,系统已生成了一个新的变量。
8.1.2 用多选变量生成新变量的实例用“休闲调查1”中的“娱乐1”,“娱乐2”,“娱乐3”生成一个新的变量。
打开数据文件“休闲调查1”后,执行下述操作:1.Analyze→Multiple Response→Define Sets 打开如图8-2 所示的对话框。
2.在Set Definition 窗口中选择“娱乐1”,“娱乐2”,“娱乐3”,并将这三个变量进入到Variables in Set 窗口中。
3.由于被分析的多选变量有6 个选项,从1 到6 为合法值。
所以选择Categories 选项,激活后面的Range 和through 窗口。
在Range 窗口中输入1,在through 窗口中输入7。
4.在Name 窗口中输入“娱乐”作为新生成的变量名。
此时激活Add 按钮。
单击Add按钮,将新生成的变量“娱乐”添加到Mult Response Sets 窗口中。