单因素方差分析
其中
ij 为试验误差,相互独立且服从正态分布
即 ij ~ N 0, 2
整个试验的均值
1 令 i , i 1, 2, a
, a,称其为因素A的总体平均值。
i i , 称为因素A的第 i 个水平 Ai 的效应。
则线性统计模型变成
X ij i ij , j 1, 2,..., r, i 1, 2,..., a.
例1 为了比较4种单层皱纹海运集装箱的抗压程度,从每种集装 箱中各随机选取6个进行最大抗压试验,得到数据如下表显示, 假设集装箱的抗压程度服从正态分布。问:不同种类的海运集 装箱的抗压强度是否有显著差别?若有差异,哪一种抗压程度 高?
集装箱类 型 最大抗压强度
655.5 788.3 734.3 721.6 679.4 699.4
1
... r
列和Ti X ij
j 1 r
T 1
T2
...
Ta 总和 Ti T
i 1
r
列平均X i Ti r
(水平组内平均值)
X1
X2
...
Xa
X
(总平均值)
T ar
例:五个水稻品种单位产量的观测值
品种
重复 1 2 3
A1
A2
A3
A4
A5
41 39 40
单因素试验的方差分析的数学模型
首先,我们作如下假设:
1. X i ~ N i , 2 , i 1, 2,...a 具有方差齐性。
2. X1 , X 2 ,... X a 相互独立,从而各子样也相互独立。
由于同一水平下重复试验的个体差异是随机误差, 所以设:
X ij i ij , j 1, 2,..., r, i 1, 2,..., a. 线性统计模型
基 本 概 念
试验指标——试验结果。
因素——影响一个试验的指标变化的原因。 可控因素——在影响试验结果的众多因素中,可人为 控制的因素。
水平——可控因素所处的各种不同的状态。每个水 平又称为试验的一个处理。
单因素试验——如果在一项试验中只有一个因素改变, 其它的可控因素不变,则该类试验称为 单因素试验。
2~2来自 ar 1 ,
SS A
2
~
2
a 1 ,
SS E
2
~ 2 a(r 1)
SST SS A SS E 将 2 , 2 , 2 的自由度分别记作 dfT , df A , df E
则 dfT df A df E ,称该关系式为自由度分解公式
SS A df A 则F ~ F a 1, a(r 1) MS A SS E df E MSE
用X1,X2,X3,X4分别表示四种集装箱的最大抗压程度, 即为四个总体。假设X1,X2,X3,X4相互独立,且服从 方差相同的正态分布,即Xi~N(i,2)(i=1,2,3,4)
本例问题归结为检验假设 H0:1= 2= 3= 4 是否成立
单因素等重复试验的方差分析
设 A 表示欲考察的因素,它的 a 个不同水平,对 应的指标视作 a 个总体 X1 , X 2 ,...X a . 每个水平下,我 们作若干次重复试验,同一水平的 个结果,就是这 个总体 X i 的一个样本: X i1 , X i 2 ,... X ir .
(记 SS A df A MS A , SSE df E MSE ,称作均方和) 对给定的检验水平 ,由PF F a 1, a(r 1)
得H0 的拒绝域为: F F a 1, a(r 1)
789.2 772.5 786.9 686.1 732.1 774.8 737.1 639.0 696.3 671.7 712.2 727.1 535.1 628.7 542.4 559.0 586.9 520.0
平均抗压 强度
713.08
756.93 697.23 562.02
1
2 3 4
引
例
集装箱的最大抗压程度——试验指标 集装箱类型——试验因素(唯一的一个) 四种类型集装箱(1,2,3,4)——四个水平 因此,本例是一个四水平的单因素试验。
r
因此, X i1 , X i 2 ,... X ir 相互独立,且与 X i同分布。 我们的目的是通过试验数据来判断因素 A 的不 同水平对试验指标是否有影响。
单因素试验资料表
重复 水平 试验结果
A 1
X11 ... X1r
A2
X 21 ... X 2r
...
... ... ...
Aa
X a1 ... X ar
SSE X ij X i
i 1 j 1
r
ni
2
组内平方和 误差平方和
反映的是重复试验中随机误差的大小。
若假设 H0 : 1 2 ... a 0 成立,则 X ij ~ N , 2 (各子样同分布)
由抽样分布定理5.2及基本假设可推得:
SST
i 1 j 1 r ni
2
总离差平方和 见书P251
经恒等变形,可分解为: SST SS A SSE 其中 SSA X i X
i 1 j 1 r ni
2
如果H0 成立,则SSA 较小。
组间平方和(系 统离差平方和)
反映的是各水平平均值偏离总平均值的偏离程度。
ij
33 37 35
105 35
38 35 35
108 36
37 39 38
114 38
31 34 34
99 33
x
j 1
3
120 40
x
i 1 j 1
3
5
3
ij
546
15 36.4
xi
x
i 1 j 1
5
ij
纵向个体间的差异称为随机误差(组内差异),由试验造 成;横向个体间的差异称为系统误差(组间差异),由因素的 不同水平造成。
于是检验假设: H : ... 0 1 2 r
等价于检验假设: H0 : 1 2 ... a 0
若H0成立,则 X ij i ij , j 1, 2,..., r, i 1, 2,..., a. 考察统计量 SST X ij X