当前位置:
文档之家› 薛薇,《SPSS统计分析方法及应用》第六章 方差分析
薛薇,《SPSS统计分析方法及应用》第六章 方差分析
S-N-K方法
目的是寻找同质子集,简单地说,各组均值首先按从小 到大的顺序排列,然后根据多重比较结果将所有的组分为若 干个子集,子集之间的各组间有差别(P值小于0.05),子集 之内的各组间无差别。
问题:分析不同地区的销售额总体上是否会随着地区人口密度的减
少(地区编号大人口密度低)而呈现某种变化趋势
Scheffe方法
当各水平下观测值个数不相等,或者想进行复杂的比较时,
或对所有可能的组合进行同步比较时,可选用此方法。这种
检验被用来检验组间均值的所有可能的线性组合,而不只是 成对组合,并控制整体显著性水平为0.05。这种方法相对比
较保守,有时候方差分析F值有显著性,用该方法进行两两比
较却找不出差异。
值存在细微差别也有可能被检验出来,但此方法对
第一类弃真错误不进行控制和调整。
Bonferroni方法
修正最小显著性差异法。用T检验完成组间成对均值的比 较,但通过设置每个检验的误差率来控制整个误差率。因此 采用此方法看到的显著值是多重比较完成后的调整值。
Tukey方法
用q检验完成各水平下观测值个数相等时组间成对均值的 比较。一定程度可以保证犯一类错误的概率总体上不增大。
当
p
p
时,拒绝原假设,即认为控制变量
不同水平下观测变量各总体的均值存在显著差异; 当 时,则不能拒绝原假设,即认为控
制变量不同水平下观测变量各总体的均值没有显 著差异
广告形式对销售额的单因素方差分析 分析
方法 一
比较均值
单因素AVOVA
因为F值对应的概率P值小于0.05,所以拒绝原
设控制变量A有k个水平,B有r个水平,每个交叉水 平下均有l个样本,则在控制变量A的水平Ai和控制 变量B的水平Bj下的第k个样本值 xijk 定义为:
xijk ai bj (ab)ij ijk
(i 1, 2,...k; j 1, 2..., r; k 1, 2..., l )
控制因素的交互作用能否对观测变量的分布产生显
著影响,进而找到有利于观测变量的最优组合。
基本思想
确定观测变量和若干个控制变量
剖析观测变量的方差 比较观测变量总离差平方和和各部分所占的比例
SST SSA SSB SSAB SSE
第一,控制变量独立作用 的影响 第二,控制变量交互作用 的影响 第三,随机因素的影响
数据变异用离均差平方和表示。
衡量同一水平下 样本数据的误差
组内误差(随机误差)
数据误差 随机误差
组间误差
系统误差
衡量控制变量不同造成的 变差
方差分析的核心是方差可分解。这里的方差是指通 过计算各观测值偏离均值的平方和再除以n-1得到。
这样,在给定n的情况下,方差就是离差平方和,
简称SST。
观测因素(观测变量):在进行方差分析时,每个控制因素水平下得到的样本数据。来自方差分析基本原理
方差分析中判断总体均值是否相等一般是通过对数据变异来 源的分析判断得到。
变异来源有两种情况:控制因素和随机因素。 控制因素:控制变量不同而造成的变异。 随机误差:在同一因素下的观察值由于抽样的随机性造成的 误差(抽样误差)。
多因素方差 分析的饱 和模型
提出零假设
H 0 : a1 a2 ak 0 b1 b2 bk 0 (ab)11 (ab)12 (ab) kr 0
H1 : a1 , a2 , ak 不全为0 b1,b2, bk 不全为0 (ab)11, (ab)12, (ab) kr 不全为0
单因素方差分析的基本步骤
单因素方差分析的基本操作
单因素方差分析的应用举例
单因素方差分析的进一步分析及应用
概念
单因素方差分析研究的是一个分类型自变量对一个
数值型因变量的影响。
例如:学历是对工资收入的影响。
基本思想
明确观测变量和控制变量
eg.前面例子中观测变量是收入;控制变量是学历
都可以使用方差分析方法去解决
方差分析概念
方差分析是检验多个总体均值是否相等的一种方法。本质上是研 究分类型自变量对数值型因变量的影响。
几个基本概念
控制因素(控制变量):在方差分析中,所要检验的对象称为因素。
其常为一个或多个离散型的分类变量。
水平:因素的不同类别或不同取值为因素的不同水平。因素的 每一个水平可以看作一个整体。
根据统计学原理,组间均方和组内均方的比值构成 F分布。给定显著性水平,通过和F分布统计量的概 率P的比较,推出总体均值是否存在显著差异。
方差分析一般应满足3个基本假设,即要求:
各个总体应服从正态分布
各个总体的方差相同
观测值是独立的。
单因素方差分析的基本思想 单因素方差分析的数学模型
单变量
因为概率P小于0.05, 所以拒绝原假设,即认 为线性模型对观测变量 有一定的解释作用
后面的几个概率中,除了交互作用中概率 大于0.05外,其余的全小于0.05,说明除了交 互作用差异不显著外,其它的都显著
多因素方差分析的非饱和模型
两因素的非饱和模型:SST=SSA+SSB+SSE 三因素的非饱和模型: SST=SSA+SSB+SSC+SSABC+SSE
SSA nij ( xi x)2
A i 1 j 1
k
r
SSB nij ( xi x)2
B i 1 j 1
r
k
SSE ( xijk xij
i 1 j 1 k 1
r
k
nij
AB 2
)
SST SSA SSB SSC SSAB SSBC SSAC SSABC SSE
的变动主要是由控制变量引起的,否则,则不是。
在水平Ai下的第j次试验的样本值
xij i ij (i 1, 2,..., k; j 1, 2,...r )
1 k i k i 1
xij可以定义为:
ai i (i 1, 2,..., k )
单因素方差分析的数学模型为 xij ai ij (i 1, 2,..., k; j 1, 2,...r)
趋势检验
在多重比较分析后得知宣传品广告效果最差,其余略有差异(先验的 结论)。这里可以对报纸、广播和体验的整体效果进行进一步的对比 分析。
先验对 比检验
所有系数之和 为0
不同广告形式下销售额总体方差齐性检验
因为P值大于0.05,所 以不能拒绝原假设, 即认为方差齐性
多重比较检验(分析哪种广告形式作用明显)
SSAB /(k 1)(r 1) MSAB SSE / kr (l 1) MSE
SSB /(r 1) MSA FB SSAB /(k 1)(r 1) MSAB
计算检验统计量观测值和概率P值
给出显著性水平 ,并作出统计决策
变量A的不同水平对观测变量产生了显著影响。
方差分析概述
单因素方差分析
多因素方差分析
协方差分析
在科学实验中常常要探讨不同实验条件或处理方法对实验结 果的影响。通常是比较不同实验条件下总体均值间的差异
举例
医学界研究几种药物对某种疾病的疗效; 农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响 不同饲料对牲畜体重增长的效果等 不同广告形式、地区规模等因素对广告效果的影响等
配是否会对销售额产生影响呢?而哪种搭配方式又
可以获得最理想的销售业绩呢?
多因素方差分析的基本思想 多因素方差分析的数学模型
多因素方差分析的基本步骤
多因素方差分析的基本操作 多因素方差分析的应用举例 多因素方差分析的进一步分析及应用
概念
多因素方差分析用来研究两个及两个以上控制 变量是否对观测变量产生显著影响。它不仅能分析 多个因素对观测变量的独立影响,更能够分析多个
对四个服务行业的服务质量进行评价,较高得分 表示较高的服务质量。对航空公司、零售业、旅
馆业和汽车制造业进行的评定数据见四种不同行
业评价得分 .sav 。在显著性水平 =0.05 下,检验四 种行业质量等级的总体均值是否差异显著?你的 结论如何?
问题引出
在上一节课,我们已经研究了不同广告形式对 产品销售有显著影响,不同地区的产品销售额也存 在显著差异,然而,不同广告形式和不同地区的搭
(1)若FA的概率p< ,则拒绝原假设,即认为控制 (2)FB的概率p< ,则拒绝原假设,即认为控制变 量B的不同水平对观测变量产生了显著影响。 (3)FAB的概率p< ,则拒绝原假设,即认为控制变 量A、B的交互作用对观测变量产生了显著影响,然
后再依此对A、B的效应进行检验
分析
一般线性模型
假设,即认为不同广告形式对销售额有显著差异。
方法二
分析
比较均值
均值
单因素方
差分析一 定要选上
一、方差齐性检验
对控制变量不同水平下各观测变量总体方差是否相等进行分析 (方差分析前提条件)
二、多重比较检验 如果控制变量确实对观测变量产生了显著影响,进一步应确定
控制变量的不同水平对观测变量的影响程度如何,其中哪个水平
选择检验统计量
随机效应模型
FA SSA /(k 1) MSA SSAB /(k 1)(r 1) MSAB
固定 效 应 模 型
FA FB FAB
SSA /(k 1) MSA SSE / kr (l 1) MSE SSB /(r 1) MSB SSE / kr (l 1) MSE