当前位置:文档之家› SPSS学习系列2方差分析报告

SPSS学习系列2方差分析报告

22. 方差分析一、方差分析原理1. 方差分析概述方差分析可用来研究多个分组的均值有无差异,其中分组是按影响因素的不同水平值组合进行划分的。

方差分析是对总变异进行分析。

看总变异是由哪些部分组成的,这些部分间的关系如何。

方差分析,是用来检验两个或两个以上均值间差别显著性(影响观察结果的因素:原因变量(列变量)的个数大于2,或分组变量(行变量)的个数大于1)。

一元时常用F检验(也称一元方差分析),多元时用多元方差分析(最常用Wilks’∧检验)。

方差分析可用于:(1)完全随机设计(单因素)、随机区组设计(双因素)、析因设计、拉丁方设计和正交设计等资料;(2)可对两因素间交互作用差异进行显著性检验;(3)进行方差齐性检验。

要比较几组均值时,理论上抽得的几个样本,都假定来自正态总体,且有一个相同的方差,仅仅均值可以不相同。

还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。

所谓的方差是离均差平方和除以自由度,在方差分析中常简称为均方(Mean Square)。

2. 基本思想基本思想是,将所有测量值上的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。

根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以各自的自由度得出各部分的均方,然后列出方差分析表算出F检验值,作出统计推断。

方差分析的关键是总离均差平方和的分解,分解越细致,各部分的含义就越明确,对各种效应的作用就越了解,统计推断就越准确。

效应项与试验设计或统计分析的目的有关,一般有:主效应(包括各种因素),交互影响项(因素间的多级交互影响),协变量(来自回归的变异项),等等。

当分析和确定了各个效应项S后,根据原始观察资料可计算出各个离均差平方和SS,再根据相应的自由度df,由公式MS=SS/df,求出均方MS,最后由相应的均方,求出各个变异项的F值,F值实际上是两个均方之比值,通常情况下,分母的均方是误差项的均方。

根据F值的分子、分母均方的自由度f1和f2,在确定显著性水平为α情况下,由F(f1, f2)临界值表查得单侧Fα界限值。

当F<Fα时,则P值>α,不拒绝原假设H0,说明不拒绝这个效应项的效应为0的原假设,也即这个效应项是可能对总变异没有实质影响的;若F>Fα则P值≤α,拒绝原假设H0,也即这个效应项是很可能对总变异有实质影响的。

3.方差分析的实验设计为了确定方差分析表中各个有关效应项,需要在试验设计阶段就作出安排,再根据设计要求进行试验,得出原始观察值,按原来设计方案算出方差分析表中的各项。

在试验设计阶段通常需要考虑如下4个方面:(1)研究的主要变量(因变量)即试验所要观察的主要指标,一次试验时可以有多个观察指标,方差分析时也可以同时对多个因变量进行分析;(2)因素和水平试验的因素(factor)可以是品种、人员、方法、时间、地区等等,因素所处的状态叫水平(level)。

在每一个因素下面可以分成若干水平。

例如,某工厂的原料来自4个不同地区,那么用不同地区的原料生产的产品质量是否一致呢?所要比较的地区就是因素,4个地区便是地区这一因素的4个水平。

当某个主要因素的各个水平间的主要因变量的均值呈现统计显著性时,必要时可作两两水平间的比较,称为均值间的两两比较。

(3)因素间的交互影响多因素的试验设计,有时需要分析因素间的交互影响(interaction),2个因素间的交互影响称为一级交互影响(A×B);3个因素间的交互影响称为二级交互影响(A×B×C)。

当交互影响项呈现统计不显著时,表明各个因素独立,当呈现统计显著时,就需要列出这个交互影响项的效应,以助于作出正确的统计推断。

二、单因素方差分析1个因变量,1个影响因素:总差异Y ij = 平均差异μ + 因素差异αi + 随机差异εij 例1比较4种品牌的胶合板的耐磨性,各抽取5个样品,相同转速磨损相同时间测得磨损深度(mm),如下:比较4个品牌胶合板的耐磨性有无差异?总差异Y ij= 平均磨损μ + 品牌差异αi + 随机差异εij1. 【分析】——【一般线性模型】——【单变量】,打开“单变量”窗口,将变量“wear磨损深度”选入【因变量】框,“brand品牌”选入【固定因子】框;2. 点【两两比较】,打开“观测均值的两两比较”子窗口,勾选【假定方差齐性】下的“LSD”、“S-N-K”,点【继续】;3. 点【选项】,打开“选项”子窗口,勾选“描述统计”、“方差齐性检验”,点【继续】;点【确定】,得到描述性统计量因变量: 磨损深度(mm)地板品牌均值标准偏差NA 2.4100 .11269 5B 2.4040 .11760 5C 2.0460 .11216 5D 2.5720 .03271 5总计 2.3580 .21771 20给出每个品牌的均值、标准差、样本数。

方差齐性检验结果,P值=0.311>0.05, 故接受原假设H0:方差齐。

方差分析结果,“校正模型”是整个方差分析模型的检验,原假设H0:所有系数(μ, αi, εij)都=0;P值<0.001<0.05, 故拒绝原假设。

“截距”检验均值μ, 原假设H0:μ=0(即不考虑品牌时,平均磨损为0);P值<0.001<0.05, 故拒绝原假设。

“brand”对因素品牌的检验,原假设H0:按因素水平值的各分组的因变量无差异,即品牌因素对磨损深度无影响;P值<0.001<0.05, 故拒绝原假设,即不同品牌的耐磨性有差异。

B列为各品牌均值与均值μ(截距)的差。

截距参数对比L1截距 1[brand=A] .250[brand=B] .250[brand=C] .250[brand=D] .250此矩阵的缺省显示是相应的 L矩阵的转置。

基于 III 型平方和。

估计常数项时使用的L矩阵,均为0.25即总样本的均值是按四种品牌等量混合的情况计算的。

此矩阵的缺省显示是相应的 L 矩阵的转置。

基于 III 型平方和。

对比系数矩阵,默认将最后一组“品牌D”作为对照组,故上上表的截距(均值μ)的估计值=品牌D的均值=2.572L2=[0 1 0 0 -1]T, 对于L2列,令[μα1α2α3α4]×L2 = 0,化简得α1=α4即前表对α1作的假设检验。

LSD法给出的两两比较,将各组均和一个参照水平做比较,未指定默认,则每一个水平都作为参照比较一次。

每两个之间的差异有无统计学意义,看对应的P值判断(原假设H0:无差异)。

LSD法给出的两两比较结果,将各组的值从小到大排序,注意4个品牌共被分成了3个亚组(无差异的作为一组),品牌B和A放在一个亚组,二者的P值=0.926(无差异)。

三、两因素方差分析1个因变量,2个影响因素:总差异Y ijk = 平均差异μ + 因素1差异αi + 因素2差异βi+ 因素1,2交互作用差异γij+ 随机差异εijk例2分析超市某商品的销售量在不同的超市规模(小型、中型、大型)、货架位置(A、B、C、D)是否有差异?部分数据文件如下:变量size超市规模:1=小型,2=中型,3=大型。

总差异Y ijk = 平均差异μ + 超市规模差异αi + 货架位置差异βi + 超市规模货架位置交互作用差异γij+ 随机差异εijk1. 【分析】——【一般线性模型】——【单变量】,打开“单变量”窗口,将变量“sale销售量”选入【因变量】框,将变量“size 超市规模”、“position货架位置”选入【固定因子】框;2. 点【选项】,打开“选项”子窗口,勾选【输出】下的“描述统计”、“方差齐性检验”,点【继续】;点【确定】,得到主体间因子值标签N超市规模1 小型82 中型83 大型8摆放位置A 6B 6C 6 D6描述性统计量因变量: 周销售量超市规模摆放位置均值标准偏差N小型A 47.500 3.5355 2B 59.500 4.9497 2C 68.000 4.2426 2D 50.500 3.5355 2总计 56.375 9.1329 8 中型A 61.000 5.6569 2 B73.500 6.3640 2 C 76.500 4.9497 2 D 58.500 2.1213 2 总计 67.375 9.1173 8 大型A 74.0005.6569 2 B78.500 4.9497 2 C 85.500 4.9497 2 D 73.000 2.8284 2 总计 77.750 6.3640 8 总计A 60.833 12.4807 6 B70.500 9.7724 6 C 76.667 8.6410 6 D 60.667 10.4435 6 总计67.16711.937024超市规模3个水平,货架位置4个水平,共将样本分成3×4=12组,由于有单组样本数<3个,故无法做方差齐性检验(值缺失)。

整个方差分析模型的检验结果,交互作用项size*position的P值=0.689>0.05, 故接受原假设H0:该交互作用无差异。

下面去掉交互因子继续做两因素方差分析。

3. 在第1步的窗口点【模型】,打开“模型”子窗口,选择【指定模型】下的“设定”,将【构建项】下的【类型】设为“主效应”,将变量“size”、“position”选入【模型】框,点【继续】;4. 原窗口点【两两比较】,打开“观测均值的两两比较”子窗口,将因子“size”、“position”选入【两两比较检验】框,勾选【假定方差齐性】下的“S-N-K”,点【继续】;注:若已明确对照组,考察其它组与它的比较,宜采用LSD法;若要进行多个均值间的两两比较,且各组人数相等,宜采用Tukey法或S-N-K法(若比较的组数特别多,不宜用S-N-K法,宜用Scheffe法);对于不平衡设计或含有协变量的模型,应采用LSD法、Bonferroni法、Sidak法。

点【确定】得到:方差齐性检验,P值=0.997>0.5, 故接受原假设H0, 即方差齐。

整个方差模型的检验结果(解释参考例1)。

用S-N-K法进行两两比较,可见超市规模越大,销售量越大;货架位置对销售量也有影响,位置AD在同一亚组,销售量最小,位置B 销售量居中,位置C销售量最大,三个亚组之间有统计学差异;另外,由于交互作用被合理地剔除,故上述差异不受另一因素(超市规模)取值的影响。

5. 若要绘制轮廓图。

原窗口点【绘制】,打开“轮廓图”子窗口,将因子“size”、“position”分别选入【水平轴】点【添加】,点【继续】;注:若要得到两变量的联合轮廓图,将另一变量选入【单图】框即可。

相关主题