当前位置:文档之家› 上机练习3列联表分析与方差分析

上机练习3列联表分析与方差分析

上机练习 3 列联表分析与方差分析
本上机练习的主要目的:熟悉如何利用SPSS与Excel进行列联表分析及方差分析。

本练习所使用数据文件为
和“Salary.sav”。

“carown.dat”、“fastfood.sav”
1. 列联表分析
Q:如何利用列联表分析考察家庭成员数与家庭所拥有汽车数之间
的关系?(数据文件为“Carown.dat”)
在这之前,我们首先检验各变量是否存在野码(wild code)或异常值
(outlier),这可以通过频数表以及箱形图(boxplot)来判断。

在家庭成员数的频数表中,我们发现,有一个样本的家庭成员数为0,而
,该样本取值在其范围之外,即为野码(wild 该变量的取值范围为[1, +∞]
code)。

对于野码的处理,一般可以采用将该样本的此变量设为缺失值或
直接去掉该样本的做法。

在家庭所拥有汽车数的频数表中,我们发现,有一个样本的家庭所拥有汽
车数为9,显然是一个极端值。

我们利用boxplot也证实了该样本为一个异常值(outlier)。

异常值处于该变量的正常取值范围内,但可能会对该
变量的相关统计结果产生较为严重的影响。

对于异常值的处理,一般可以
采用直接去掉该样本的做法或者根据情况进行调整。

而对于上述我们发现
的异常值来说,我们可以直接去掉该样本。

在上述数据清理的工作完成之后,我们可以开始进行列联表分析。

因为列
联表分析只适用于分类变量,我们需要利用Transform Recode Into
Different Variables…对家庭人数以及家庭所拥有汽车数进行分类,分别
定义新变量member1和cars1与之对应。

具体对应关系如下:
旧变量新变量新变量类别旧变量新变量新变量类别
定义含义
member member1 member1 cars cars1 cars1 1-2 1 1-2位成员 1 1 1辆
3 2 3位成员≥2 2 2辆以上
≥4 3 4位以上成员
下面我们以定义新变量cars1为例来对Recode函数功能进行说明。

打开对话框后,选中变量cars,并点击按钮,将其选入变量框中。

然后在
,接下来点击按钮
的“Name”中填入新变量名“cars1”
“Output Variable”。

,分别填入对应的新旧变量值后点击“Continue”
然后对相应的类别加以定义
定义新变量member1类似处理。

接下来我们进行列联表分析。

我们从主菜单
中选择Analyze Descriptive statistics Crosstabs...。

点击下面的Statistics…
按钮,选。

完成后我们点击“OK”。

择我们所需的统计指标。

选择好以后点击“Continue”
从上面的分析我们可以知道,家庭成员数对家庭所拥有汽车数具有显著的影响(Chi-square所对应的显著性水平<0.05)。

不过,从Phi系数、Cramer’s V和列联系数的大小来看,这两个变量之间的联系并不是很强。

2. 单因子方差分析
Q:如何利用单因子方差分析来判断不同种族类型员工的起薪是否
存在显著差异?(相应的数据文件为“Salary.sav”

数据文件进行下面的方差分析,该数据文件中的各变量我们利用“Salary.sav”。

定义参见数据字典“Salary_dct.doc”
要进行单因子方差分析,需要从主菜单中选择:Analyze Compare means One-Way ANOVA...。

然后,将变量salbegin选入“Dependent List(因变量)”,将变量
,在“Descriptive(描述性统race选入“Factor(因子)”。

点击下面的按钮“Options”
计)”和“Homogeneity of variance test(同方差检验)”前面打上勾。

用于对精细趋势检验和精确两两比较的选项进行定义,一般按钮“Contrast...”
用于选择进行各组(组数必须大于2)我们基本上不用此功能。

按钮“Post Hoc …”
间两两比较的方法,这里我们也不需要用到。

返回,点击“OK”。

我们得到以下结果:
点击“Continue”
上述描述性统计表明,少数族裔员工比白人员工的起薪低。

不过,这两组样本
的同方差假设被拒绝。

上述单因子方差分析的结果表明,白人员工与少数族裔员工的起薪存在显著差
异(显著性水平 = 0.001)。

不过,在没有控制影响起薪的其它因素
的情形下,我们需要小心使用得到的上述结论。

3. 多因子方差分析与协方差分析
Q:如何在控制了员工受教育年限(educ)作用的条件下考察员工
性别(sex)与种族(race)对员工起薪(salbegin)的影响?(相应的数

据文件为“Salary.sav”
数据文件进行多因子方差分析与协方差分析。

下面我们继续利用“Salary.sav”
要进行多因子方差分析与协方差分析,需要从主菜单中选择:Analyze General Linear Model Univariate...。

然后,将变量salbegin选入“Dependent Variable(因变量)”,将变量race和sex选入“Fixed Factor(s(固定因子)”,将变
,在“Descriptive 量educ选入“Covariate(s(协变量)”。

点击右边的按钮“Options”
(描述性统计)”和“Homogeneity of variance test(同方差检验)”前面打上勾。

点返回。

击“Continue”
为了获得变量race和sex的交互作用图,我们还需要点击主界面右边的按钮
中,然后点击
和“Separate lines”。

分别将race和sex选入“Horizontal Axis”
“Plots”
返回。

“Add”,并点击“Continue”
点击“OK”。

我们得到以下结果:
上述协方差分析结果表明,即使在控制了员工受教育年限(educ)作用的条件下,员工性别(sex)与种族(race)的主效应仍然非常显著。

不过,这两者之间的交互作用不显著。

下图说明了种族对员工起薪的影响对于男性和女性来说是类似的,即员工性别(sex)与种族(race)之间的交互作用不显著。

请继续使用Excel的“数据统计”功能完成以上各项任
务,具体操作可参考《Excel在统计中的应用》。

课堂练习。

1. 请试着借助SPSS软件重新完成以前布置过的作业:
《营销研究方法与应用》P240,练习题2;
练习4“方差分析”。

2. 请先将定量变量“最近三个月内去洋快餐店消费次数”转换成定类变量(0-1次为“几乎未去过”,2-5次为“有时会去”,6次以上为“经常去”),然后利用列联表方法分别考察受访者的性别、文化程度、个人月收入等特征与“最近三个月内去洋快餐店消费次数”之间的关系,并检验这些关系是否显著。

如果我们还想了解受访者
的年龄与“最近三个月内去洋快餐店消费次数”之间的关系,是否能利用列联表的方法?如果要利用列联表方法来考察它们之间的关系,应该怎样做呢?
3. 利用协方差分析方法考察受访者的性别、文化程度、个人月收入和年龄对其“最近三个月内去洋快餐店消费次数”(定量变量)的影响。

相关主题