当前位置:文档之家› 用SPSS进行单因素方差分析和多重比较

用SPSS进行单因素方差分析和多重比较

方差分析
方差分析可以用来检验来多个均值之间差异的显著性,可以看成是两样本t检验的扩展。

统计学原理中涉及的方差分析主要包括单因素方差分析、两因素无交互作用的方差分析和两因素有交互作用的方差分析三种情况。

虽然Excel可以进行这三种类型的方差分析,但对数据有一些限制条件,例如不能有缺失值,在两因素方差分析中各个处理要有相等的重复次数等;功能上也有一些不足,例如不能进行多重比较。

而在方差分析方面SPSS的功能特别强大,很多输出结果已经超出了统计学原理的范围。

用SPSS检验数据分布的正态性
方差分析需要以下三个假设条件:(1)、在各个总体中因变量都服从正态分布;(2)、在各个总体中因变量的方差都相等;(3)、各个观测值之间是相互独立的。

在SPSS中我们很方便地对前两个条件进行假设检验。

同方差性检验一般与方差分析一起进行,这一小节我们只讨论正态性的检验问题。

[例7.4] 检验生兴趣对考试成绩的影响的例子中各组数据的正态性。

在SPSS中输入数据(或打开数据文件),选择Analyze→Descriptive Statistics→Explore,在Explore对话框中将统计成绩作为因变量,兴趣作为分类变量(Fator),单击Plots按钮,选中“Histogram”复选框和“Normality plots with Test”,单击“Continue”按钮,在单击主对话框中的“OK”,可以得到分类别的描述统计信息。

从数据的茎叶图、直方图和箱线图都可以对数据分布的正态性做出判断,由于这些内容前面已经做过讲解,这里就不再进一步说明了。

图7-2 用Expore过程进行正态性检验
top↑
输出结果中的Q-Q图是观察数据分布正态性的一种常用图形。

这类图形大致是这样绘制的:计算数据在样本中对应的经验分布函数值(类似于累积分布的函数值,取值在0-1之间);然后计算标准正态分布(或者均值、方差相同的正态分布)对应于经验分布函数值的分
位数。

以实际值为横坐标,正态分布的分位数为纵坐标作散点图,如果图形中的点大致在一条直线上则说明数据服从正态分布。

图7-3是不太喜欢统计学的学生统计成绩的Q-Q图,从图中可以判断数据并没有严重背离正态分布。

图7-3 Q-Q图
表7-8是对数据进行正态性检验的结果。

SPSS中采用的是Kolmogorov-Smirnov检验和Shapiro-Wilk检验。

这两种检验方法都属于非参数统计的内容,统计量的计算方法可以参考有关书籍。

我们可以根据软件给出的p-值对数据是否服从正态分布进行检验:由于表7-8中的p-值都大于0.05,因而我们不能拒绝零假设,也就是说没有证据表明各组的数据不服从正态分布(检验中的零假设是数据服从正态分布)。

表7-8 正态性检验的结果
* This is a lower bound of the true significance.
a Lilliefors Significance Correction
top↑
用SPSS进行单因素方差分析和多重比较
SPSS的One-Way ANOVA过程可以进行单因素方差分析和均值的多重比较。

[例7.5] 对不同兴趣的学生的统计成绩进行多重比较。

单击Analyze→mpare Means →One-Way ANOVA,在对话框中将变量“统计成绩”选入Dependent List框,将变量“兴趣”移入Factor 栏,如图7-4。

单击对话框中的“Options”按钮,在弹出的对话框中选中“Discriptive(描述统计)”、“Homogeneity of variance test(同方差检验”和“Means plot(均值的图形)”复选框(图7-5)。

单击主对话框中的“Post Hoc(事后多重比较)”,选中“LSD(最小显著差异方法)”复选框。

单击主对话框中的“OK”按钮,就可以得到相应的分析结果了。

图7-4 单因素方差分析对话框
图7-5 单因素方差分析的选项设定
在SPSS的输出结果中,表7-9是对同方差性的检验。

SPSS采用的是Levene检验,这是一种非参数检验方法,与F检验类似,但不依赖于正态性假设,比F检验更稳健。

从检验结果看,在5%的显著性水平下不能认为个总体的方差不相等。

表7-9 同方差性检验
top↑表7-10是SPSS生成的方差分析表,与Excel的计算结果完全一致。

表7-11是用LSD法进行多重比较的结果。

在表-11中的均值差(Mean Difference)一栏中加有星号的值是在5%的显著性水平下显著不等于零的值。

例如,很不喜欢统计学的学生的考试成绩与不太喜
欢的学生的平均成绩相差19.083分,这一差异在5%的显著性水平下是显著的。

在加有星号的行中,相应的置信区间没有包含“0”值。

表7-10 SPSS输出的方差分析表
表7-11 LSD法多重比较的结果
(I) 兴趣(J) 兴趣Mean
Difference
(I-J)
Std.
Error Sig.
95%
Confidence
Interval
1 很不喜欢
2 不太喜欢-19.083* 6.720 .008 -32.81 -5.36
3 无所谓-12.46
4 7.009 .086 -26.78 1.85
4 比较喜欢-17.875* 6.848 .014 -31.86 -3.89
5 非常喜欢-23.893* 7.009 .002 -38.21 -9.58
2 不太喜欢 1 很不喜欢19.083* 6.720 .008 5.36 32.81
3 无所谓 6.619 5.636 .249 -4.89 18.13
4 比较喜欢 1.208 5.434 .826 -9.89 12.31
5 非常喜欢-4.810 5.63
6 .400 -16.32 6.70 3 无所谓 1 很不喜欢12.464 7.009 .086 -1.85 26.78
2 不太喜欢-6.619 5.636 .249 -18.1
3 4.89
4 比较喜欢-5.411 5.788 .357 -17.23 6.41
5 非常喜欢-11.429 5.978 .065 -23.64 .78 4 比较喜欢 1 很不喜欢17.875* 6.848 .014 3.89 31.86
2 不太喜欢-1.208 5.434 .826 -12.31 9.89
3 无所谓 5.411 5.788 .357 -6.41 17.23
5 非常喜欢-6.018 5.788 .307 -17.84 5.80 5 非常喜欢 1 很不喜欢23.893* 7.009 .002 9.58 38.21
2 不太喜欢 4.810 5.636 .400 -6.70 16.32
3 无所谓11.429 5.978 .065 -.78 23.64
4 比较喜欢 6.018 5.788 .307 -5.80 17.84
* The mean difference is significant at the .05 level.
图7-6是以因素水平为横轴,以各组平均考试成绩为纵轴绘制的散点图可看出各组均数的分布状况。

从图中可以看出,总体来说学生的学习兴趣越大平均考试成绩越好,但“不太喜欢”统计学的一组是个例外。

图7-6 不同学习兴趣学生的平均考试成绩
、用SPSS进行双因素方差分析
SPSS的General Linear Model中的Univariate过程可以用来进行单因素或多因素方差分析,检验不同因素以及因素之间的交互作用对均值的影响是否显著。

[例7.6] 7.1.3小节的数据为例在SPSS中进行双因素无交互作用的方差分析。

要用SPSS处理表7-6的数据需要先将数据整理成列表的形式(表7-12)。

在SPSS中建立数据表以后,选择Analyze→General Linear Model→Univariate,在主对话框中将“收入”放入Dependent Variable 矩形框,将“地区”和“险种”放入Fixed Factor(s)矩形框中(图7-7)。

表7-12 SPSS需要的数据格式。

相关主题