当前位置:文档之家› 第8章 方差分析

第8章 方差分析

– 在例8-1中,要求每个位置超市的销售额必须服从正态分布; – 检验总体是否服从正态分布的方法有很多,包括对样本数据作
直方图、茎叶图、箱线图、正态概率图等 ;
2. 方差齐性(homogeneity variance)。各个总体的方差必须相 同,对于分类变量的每个水平,有12=22=…=k2;
3. 就例8-1而言,在只考虑超市位置一个因素的情况 下,方差分析也就是要检验下面的假设:
▪ H0 :1 2 3 ▪ H1 :1 , 2 , 3 不全相等
2020-1-14
方差分析的基本原理
(方差比较)
1. 若不同位置对销售额没有影响,则组间方差中只包含随机
误差,没有系统误差。这时,组间方差与组内方差经过平 均后的数值就应该很接近,它们的比值就会接近1;

– 由于不同处理造成的误差,它反映了处理(超市位置)对观测数
据(销售额)的影响,也叫做系统误差;
3. 组内误差(within-group error) —随机误差(random error)

– 由于随机因素造成的误差,也简称为误差(error) ;
2020-1-14
方差分析的基本原理
(误差分解)
2. 若不同位置对销售额有影响,在组间方差中除了包含随机
误差外,还会包含有系统误差,这时组间方差平均后的数 值就会大于组内方差平均后的数值,它们之间的比值就会 大于1;
– 当这个比值大到某种程度时,就可以说不同水平之间
存在着显著差异,也就是自变量对因变量有影响;
方差分析的基本假定
1. 正态性(normality)。每个总体都应服从正态分布,即对于 因素的每一个水平,其观测值是来自正态分布总体的简单 随机样本;
2020-1-14
8.1 方差分析的基本原理
8.1.2 误差分解
方差分析的基本原理
(误差分解)
1. 总误差(total error):
▪ 反映全部观测数据的误差; ▪ 所抽取的全部36家超市的销售额之间差异;
2. 组间误差(between-group error)—处理误差(treatment error)
第 8 章 方差分析
§8.1 方差分析的基本原理 §8.2 单因素方差分析 §8.3 双因素方差分析
8.1 方差分析的基本原理
8.1.1 什么是方差分析? 8.1.2 误差分解 8.1.3 方差分析的基本假定
什么是方差分析(ANOVA)?
(analysis of variance)
1. 检验多个总体均值是否相等;
2020-1-14
方差分析的基本原理
(误差分析)
1. 方差分析的基本原理,就是要分析数据的总误差 中有没有系统误差。
– 如果超市的不同位置对销售额没有显著影响,意味着没 有系统误差。
– 这时,每种处理所对应的总体均值(i)应该相等。
2. 如果存在系统误差,每种处理所对应的总体均值 (i)至少有一对不相等;
1. 数据的误差可以用平方和(sum of squares)来表示,常 简记为SS;
• 总平方和,记为SST;
– 反映全部数据总误差大小的平方和; – 抽取的全部36家超市销售额之间的误差平方和
• 组间平方和,记为SSA;
– 反映系统误差(处理误差) 大小的平方和; – 也称为处理平方和(treatment sum of squares)
yij i ij
设总均值为,第i个处理的效应可以用第i个处 理的均值与总均值的差表示,记为i,即i=i- ;这样,第i个处理均值被分解成i=i+,方差
分析模型可以改写为 :
yij i ij
§8.2 单因素方差分析
8.2.1数据结构 8.2.2分析步骤 8.2.3关系强度的测量 8.2.4方差分析中的多重比较
单因素方差分析的数据结构
(one-way analysis of variance)
观测值 ( j )
水平A1
因素(A) i
水平A2

水平Ak
1
x11
x21

xk1
2
x12
x22

xk2
:
:
:
:
:::来自:::
n
x1n
• 组内平方和,记为SSE; ▪ 反映随机误差大小的平方和; ▪ 也称为误差平方和(sum of squares of error)
2020-1-14
方差分析的基本原理
(误差分解)
• 误差平方和的分解及其关系
总误差 = 系统误差 + 随机误差
总平方和
组间平方和
组内平方和
=
+
(SST)
(SSA)
(SSE)
额的影响,则称为单因素方差分析(one-way analysis of variance); 3. 如果只分析超市位置和竞争者数量两个因素对销售额的单 独影响,但不考虑它们对销售额的交互效应(interaction), 则称为只考虑主效应的双因素方差分析; 4. 如果除了考虑超市位置和竞争者数量两个因素对销售额的 单独影响外,还考虑二者对销售额的交互效应,则称为考 虑交互效应的双因素方差分析。
什么是方差分析?
(例题分析)
【 例 8-1】确定超市的位置和竞争者的数量对销售额是否 有显著影响,获得的年销售额数据(单位:万元)如下表:
因素
2020-1-14
水平或处理
样本数据
什么是方差分析?
(例题分析)
1. 分析“超市位置”和“竞争者数量”对销售额的影响; 2. 如果只分析超市位置或只分析竞争者数量一个因素对销售
– 在例8-1中,要求不同位置超市的销售额的方差都相同;
3. 独立性(independence)。每个样本数据是来自因素各水平 的独立样本(该假定不满足对结果影响较大);
– 在例8-1中,3个样本数据是来自不同位置超市的3个独立样本;
2020-1-14
单因素方差分析的数学模型
设因素A有k种处理(比如超市位置有“居民区 ”、“商业区”、“写字楼”3种),单因素方 差分析可用下面的线性模型来表示 :
▪ 通过分析观测数据的误差来判断各总体均值是否相等; ▪ 用方差来衡量误差的大小。
2. 研究分类型自变量对数值型因变量的影响;
▪ 一个或多个分类自变量
2个或多个 (k 个) 处理水平或分类
▪ 一个数值型因变量
3. 有单因素方差分析和双因素方差分析;
▪ 单因素方差分析:一个分类自变量 ▪ 双因素方差分析:两个分类自变量
相关主题