当前位置:文档之家› 第四章 方差分析

第四章 方差分析

方差分析法的内容丰富,本章仅讨论单因素试 验、双因素试验的方差分析.
6
第一节 单因素试验的 方差分析
7
在统计学中我们把要考察的试验结果称为指标, 把影响指标取值的可以控制的试验条件称为因素,
因素常用大写的英文字母 A , B , C 等来表示.
每个因素在试验中所处的不同状态称为水平.如
因素 A 有 r 个水平,则用
考察的指标为 X ,影响指标的因素 A 有 r 个水平: A1, A2, , Ar .
Ai 水 平 所 对 应 的 总 体 X i ~ N i , 2 ,
i 1, 2, , r .其中 i 与 2 都未知,但这 r 个总体
X1, X2, , Xr 的方差相等,这是方差分析的前提假
设.
14
从总体 X i 中抽取容量为 ni 的样本:
SE nr
n r.
34
SA
于是 F
r 1 SE
可作为假设 H0 的检验统计量.对于给定的
nr
显著性水平 ,由
PF F1 r 1, n r ,
得到检验的拒绝域为
W F F1 r 1, n r.
如果 F F1 r 1, n r ,则拒绝原假设 H0 ,即认为
因素 A 的 r 个水平的效应有显著差异;如果
r 1 SE

nr
SA
接近于1.反之,如果假设 H0 不成立,比值
r 1 SE
将有变大
nr
的趋势.这就启发我们,通过比较 S A 与 SE 的大小来比较假
设 H0 .
31
我们记
SA F r 1 SA ,
SE SE
nr
这里 SA
SA r 1

S
E
SE nr
.下面我们将导出当假设
SA
H0 成立时,统计量 F
10
例 1 某商店要进一批一号电池,由甲乙丙三个电池厂提供货
源.为评价其质量,商店进货员从三个电池厂生产的电池中各随机
抽取 4 只,经试验测试寿命(单位: h )数据如下表:
表 1 电池寿命数据
试验序号
厂家 A
A1
A2
A3
1
74
79
82
2
69
81
85
3
73
75
80
4
67
78
79
试问在显著性水平 0.05下,各厂生产的电池的寿命有无显著性
Xi1, Xi2, , Xini , i 1, 2, , r .
并设这 r 个样本相互独立.于是
Xij ~ N i, 2 , j 1, 2, , ni .
15
Xij 与 i 的差值可以看作是一个随机误差: 的一些因素所引起的,这样 X ij 就有如下的数据结构:
和.它反映了全部观测数据之间的差异,即 X ij 之间的波
动程度. 21
若令
ni
Xi Xij j 1
则有
1 ni
Xi ni
X ij
j 1
r
ST
ni
Xij X 2
i1 j 1
r ni
X ij X i Xi X 2
i1 j1
r
ni
Xij Xi 2 2 r
r
ST
ni
r
X ij X i 2
ni
Xi X 2
i1 j1
i1 j1
r
ni
r
X ij X i 2 ni X i X 2
i1 j1
i 1
23
若记
r
SA ni X i X 2 ,
i 1
r
SE
ni
Xij Xi 2 ,
i1 j 1
则有
ST SA SE ,
差异?
11
在这个例子中,厂家是影响寿命指标 X 的因 素,记作 A ,三个不同的工厂就是该因素 A 的
三个不同的水平,分别记作 A1, A2, A3 .可
以认为一个水平的电池水平的电池寿命就是一
总体,记为 X i ,
12
假设
Xi ~ N i, 2 , i 1, 2, 3.
其中 i 与 2 都未知,但方差相等.由题意知,要检验假设
39
例 2 某试验室对钢锭模进行选材试验时, 将 4 种成分的生铁做成试样作热疲劳测定.其 方法是将试样加热到 700℃后投入到 20℃的 水中急冷,这样反复进行直至试样断裂,最后 看试样经手的次数.显然经受的次数越多,质 量就越好.
试验结果列于下表,试检验 4 种生铁的试样 的抗疲劳性能是否有显著差异?
ni
Xij Xi Xi X
r
ni
Xi X 2 ,
i1 j 1
i1 j 1
i1 j 1
22
对于固定的 i ,有
ni
ni
ni
X ij X i X ij X i
j 1
j 1
j 1

ni
X ij ni X i ni X i ni X i 0
j 1
因此上式中的第二项为 0 ,所以有
r
方和 ni X i X 2 正是这种差异大小的度量.而式中
i 1
每一项前面的系数 ni ,则反映了第 i 个总体样本容量的
大小在平方和 S A 中的作用.通常称 S A 为因素 A 的效应
平方和或者组间离差平方和. 26
上述表明,平方和分解公式将总离差平方和
ST 按其来源分解成两部分:一部分是 SE ,即
A1, A2, , Ar
表示.
8
如果在一项试验中只有一个因素在变化,其他 可以控制的试验条件不变,则称这种试验为单因 素试验.
在单因素试验中,如果只有两个水平,就是上 章讲过的两总体均值的比较问题;超过两个水平 时,就是多个总体均值的比较问题,这可用本节 将要讨论的单因素试验的方差分析来解决.
9
1、数学模型
H1 : 1, 2, , r 不全相等
17
为便于讨论,我们记
r
n ni , i 1
1 n
n i 1
ni i

称 n 为样本总容量,称 为总平均.又记
i i , i 1, 2, , r .
称 i 为因素 A 的第 i 个水平 Ai 对指标 X 的效应.易见,这 r 个效应
1, 2, , r 应满足
F F1 r 1, n r ,则接受原假设 H0 ,即认为因素 A
的 r 个水平的效应没有显著差异.
35
上述分析结果场总结成下表的形式,称为方差分析表. 方差分析表
方差来源 平方和
因素 A
SA
误差
SE
总和
ST
自由度
r 1 nr n 1
均方
SA
SA r 1
SE
SE nr
F值 F SA
SE
临界值
H0 : 1 2 3 ,
H1 : 1, 2, 3 不全相等
是否成立,如果否定 H0 ,则认为三家工厂的电池寿命有显著差异;如
果接受 H0 ,则认为三家工厂的电池寿命没有显著性差异,其差异只是
随机因素引起的.以下我们将会看到,方差分析法是处理假设上述检验 问题的有效方法.
13
单因素试验方差问题的一般提法是:设在单因素试验中所
r
r
r
r
nii ni i nii ni n n 0 ,
i 1
i 1
i 1
i 1
18
则(8.1.3)式等价于
H0 : 1 2 r 0 ,
H1 : 1, 2, , r 不全为零
这样模型(8.1.2)式就可表示为
Xijij~N
i ij 0, 2 ,
j 1,
4
方差分析是我们在第六章已提到过的 英国大统计学家 Fisher 在 20 世纪 20 年 代创立的.方差分析法首先被应用于农 业试验,其后被应用于工业,生物学, 医学等许多方面,在这诸多领域的数据 分析工作中,取得了很大的成功.
5
方差分析本质上是关于多个具有方差齐性的 正态总体,对其均值作检验与估计的统计方 法.因其统计分析的依据是通过分析离差平方和 给出的,故习惯上称之为方差分析.
我们称上式为平方和分解式.
24
这里,SE 表示了随机误差(因素)的影响.因为对于
固定的 i ,所有的观测值
Xi1, X i 2, , Xi ni 都是来自同一正态总体 N i , 2 的样本,因此它们之
间的差异完全由随机误差( ij X ij i )所至.而
ni Xij Xi 2 是这 ni 个数据的变动平方和,正是它们
ni
X
2 ij
2

j1
SE ST SA .
37
当 n1 n2 nr s 时,称为等重复试验,并有
ST
r i 1
s j 1
X
2 ij
1 n
i
r 1
s j 1
2 Xij ;
2
2
SA
1 s
r i 1
s j 1
X ij
1 n
r i 1
s j 1
X
2 ij

38
3、应用举例
r 1 SE
SA SE
的分布.
nr
32
定理 在单因素试验的方差分析模型中, SE
2 服从自由度为 n r 的 2 分布,即
SE
2
~
2n r .
33
进一步我们还可以证明,当假设 H0 为真
时,有
SA
2
~
2r
1,
并且 S A 与 SE 相互独立.因此,当假设 H0 成
立时,有
相关主题