双因素方差分析的类型
2. 如果四个总体的均值相等,可以期望四个样本 的均值也会很接近
四个样本的均值越接近,推断四个总体均值相等
的证据也就越充分
样本均值越不同,推断总体均值不同的证据就越
充分
方差分析中基本假定
如果原假设成立,即H0: m1 = m2 = m3 = m4
四个行业被投诉次数的均值都相等 意味着每个样本都来自均值为m、差为2的同一正
如果n个总体的均值相等,然希望三个样本的均值 比较接近,事实上,n个样本的均值愈接近,就愈 有证据得出结论:总体均值相等,反之,若n个样 本均值的差异愈大,就得出结论,总体均值不相等。
样本均值变动性小→支持H0,样本均值变动性大→ 支持H1。
三、F分布
水平间方差(组间方差)和水平内方差(组 内方差)之比是一个统计量,数理统计证明, 这个统计量服从F分布。
(二)用方差分析来检验假设有三个假定
1、各个水平的观察数据必须服从正态分布: 在水平Ai下的数据是来自正态总体的一个样 本,i=1,2…,r。
2、方差相同或者叫方差齐性:r个正态总体 的方差相等,即。
3、随机性:所有数据都相互独立。
方差分析中的基本假定
1. 在上述假定条件下,判断行业对投诉次数是否 有显著影响,实际上也就是检验具有同方差的 四个正态总体的均值是否相等
3、单元(Cell)
单元指因素水平之间的组合。如销售方式一 下有五种不同的销售业绩,就是五个单元。 方差分析要求的方差齐就是指的各个单元间 的方差齐性。
4、元素(Element)
元素指用于测量因变量的最小单位。一个单 元里可以只有一个元素,也可以有多个元素。
5、均衡(Balance)
如果一个试验设计中任一因素各水平在所有 单元格中出现的次数相同,且每个单元格内 的元素数相同,则称该试验是为均衡,否则, 就被称为不均衡。不均衡试验中获得的数据 在分析时较为复杂。
k
SSA (xj x)2 nj(xj x)2
(bossom)
j1
构造检验的统计量
(三个平方和的关系)
总离差平方和(SST)、误差项离差平方和
(SSE)、水平项离差平方和 (SSA) 之间的 关系
k
ni
k
k
xij x 2 ni xi x 2
k nj
SST
(xij x)2
j1 i1
2、误差项离差平方和(组内)
SSE(Sum of Squares For Error)
k nj
SSE [ (xij x j )2] j1 i1
3、水平项离差平方和(组间)
SSA或SSb (Sum of Squares for factor A)或
6、交互作用(Interaction)
如果一个因素的效应大小在另一个因素不同 水平下明显不同,则称为两因素间存在交互 作用。当存在交互作用时,单纯研究某个因 素的作用是没有意义的,必须分另一个因素 的不同水平研究该因素的作用大小。如果所 有单元格内都至多只有一个元素,则交互作 用无法测出。
若方差分析只针对一个因素进行,称为单因 素方差分析。如果同时针对多个因素进行, 称为多因素分析。在多因素方差分析中,双 因素方差分析里最常见的。
ni
xij x 2
i1 j1
H0:μ1=μ2=μ3=μ4 颜色对销售量没有影响 H1:μ1,μ2,μ3,μ4 不全相等,颜色对销售量有影
响。 注意:拒绝原假设,只表明至少有两个总体的均值
不相等,并不意味着所有的均值都不相等。
二、计算水平均值
令 xj 表示第j种水平的样本均值,则
nj
x j =
xij / nj
学习目标
1.解释方差分析的概念 2.解释方差分析的基本思想和原理 3.掌握单因素方差分析的方法及应用 4.掌握双因素方差分析的方法及应用
第一节 方差分析的基本问题
一、方差分析的内容 二、方差分析的原理 三、F分布
一、方差分析的内容
(一)方差分析中的常用术语 1、因素(Factor) 2、水平(Level) 3、单元(Cell) 4、元素(Element) 5、均衡(Balance) 6、交互作用(Interaction) (二)用方差分析来检验假设有三个假定
组间方差
F=
组内方差
第二节 单因素方差分析
一、建立假设 二、计算水平均值 三、计算离差平方和 四、计算平均平方 五、方差分析表 六、统计决策 七、应用实例
一、建立假设
方差分析的第一步是建立假设。以饮料颜色对销售 量的影响为例,针对我们关心的问题提出原假设和 备择假设。
1、因素(Factor)
因素是指所要研究的变量,它可能对因变量 产生影响。一个是因素,因素是一个独立的 变量,是方差分析研究的对象。要分析不同 销售方式对销售量是否有影响,所以,销售 量是因变量,而销售方式是可能影响销售量 的因素。
2、水平(Level)
因素中的内容称为水平。水平指因素的具体 表现,如销售的四种方式就是因素的不同取 值等级。有时水平是人为划分的,比如质量 被评定为好、中、差。
i 1
式中:xij为第j种水平下的第I个观察值; nj第j种水平的观察值个数。 计算总均值的一般表达式为:
总均值:是所有观察值的总和除以观察值的总数。
k nj
X j1 i1 xij (注:各个样本容量相等)
n
三、计算离差平方和
1、总离差平方和SST(Sum of Squares for Total)
态总体
f(X)
X
m1 m2 m3 m4
方差分析中基本假定
若备择假设成立,即H1: mi (i=1,2,3,4)不全 相等
至少有一个总体的均值是不同的
四个样本分别来自均值不同的四个正态总体
f(X)
X
m3 m1 m2 m4
二、方差分析的原理
方差分析的目的是要检验各个水平的均值μ1, μ2……μr 是否相等,实现这个目的的手段是通过方 差的比较。