当前位置:
文档之家› 第八章 单因素方差分析(1)
第八章 单因素方差分析(1)
第二节 固定效应模型
一、固定模型的方差分析程序
(一)假设
H 0 : 1 = 2 = L = a H A : 不是所有的 i都相等
即,
H 0 : α1 = α 2 = L = α a = 0 H A : 不是所有的 α i都等于 0
(二)确定显著性水平α
(三)计算统计量
S2 =
∑ (y
i =1
(四)方差分析的原理 (1)将数据的总变异分解为不同处理引起的变异(系统误差 或处理效应)和随机误差(试验误差)引起的变异 (2)通过F检验,比较不同处理引起的变异和随机误差引起 的变异的相对大小: 如果不同处理引起的变异明显比随机误差引起的变异 大,则说明不同处理确实有显著差异 如果不同处理引起的变异明显不比随机误差引起的变异 大,则说明不同处理没有显著差异
yaj
┇
n 组总和 组平均数
y1n y1.
y1
y2n y2.
y2
… … …
yin yi.
yi
… … …
yan ya.
ya
y ij 表示第 i个处理的第 j次观测值
y i =
∑y
j =1
n
ij
表示第 i 个处理所有数据的和
1 y i = y i 表示第i个处理所有数据的平均值 n
y = ∑∑ y ij 表示所有处理中全部数据的总和
2 i =1 i =1 j =1 i =1 j =1
a
a
a
n
j =1
∑ ( y ij y i ) = 0
n
=
n∑ ( y i y ) 2 + ∑∑ ( y ij y i ) 2
i =1 i =1 j =1
a
a
n
平方和的简易求法
SS T = ∑∑ y ij C
2 i =1 j =1 a n
n
i
y)
2
n 1 和处理内变异
,方差分析就是要把一个试验的总变异依据变异来源分解为处理间变异
y ij = α
总变异
i
+ ε
ij
不同处理引 起的变异
误差引起 的变异
方差分析的目的是分析不同处理引起的变异是否显著, 从而得出不同处理是否有显著差异。
1、平方和的计算和分解
y ij = α i + ε ij
(二)两类方差 1、处理内方差:在因素的同一水平(同一个总体)下,样本 数据的方差 2、处理间方差:因素的不同水平(不同总体)下,各样本之 间的方差。 (三)方差的比较 如果不同盐浓度对植株鲜重没有影响,则处理间方差就只包含 随机误差,处理内方差与处理间方差的比值接近1,反之, 则大于1,当大到某个程度时,就可以说不同水平之间存在 着显著差异。
4、显著性检验——F检验(上尾检验)
F( df A , df e ) = MS A MS e
(四)拒绝域的建立 (五)作出结论并给予相关知识领域的解释
例1,有一水稻施肥的盆栽 试验,设置了5个处理:A1和A2 分别施用 两种不同工艺流程的氨 水,A3 施碳酸氢氨, A4 施尿素,A5不施氮肥。 每个处理各 4盆,共有5 × 4=20盆,随机置于同一盆栽 场,其稻谷产量 如下表。试求各平方和 ,自由度和均方。
∑α
i =1
a
i
= 0, 且每个α i是常数。
固定效应模型
i = + α i为第i个处理的平均数。
ε ij 是y ij的试验的随机误差(也称为噪声)。
我们假定ε ij 相互独立且服从正态分布N (0, σ 2 )。
因此,方差分析假定 y ij ~N ( + α i , σ 2 ), 这是方差分析的条件。
5、试验处理(treatment):在试验对象上实施的事先设计好 的具体项目,简称处理。在进行单因素试验时,试验因素的一个
水平就是一个处理;对于双因素试验,处理的个数等于两个因素水平 个数的乘积。每个处理可以看做是一个总体,每个处理得到的一组数 据可以看做是从这个处理总体中抽取的一个样本的数据。
6、试验单位(experiment unit):在试验中能接受不同试验 处理的独立的试验载体,是获得观测数据的单位。 7、重复(repetition):在试验中,将一个处理实施在两个或 两个以上的试验单位上称为处理有重复,处理实施的试验 单位数目称为处理的重复数。观测数≠重复
第八章 单因素方差分析 (One-factor ANOVA)
ANOVA: Analysis of Variance
目的要求
掌握:方差分析的意义、功用与应用范围;多 重比较法及多重比较结果的表示法。 熟悉:不同类型单因素资料的方差分析方法。 了解:方差分析的线性模型和期望均方。统计 软件Excel、SPSS应用。
i =1 j =1 a n
1 y = y 全部数据的总平均值 an
注意:“”表示对一个下标的求和
(二)单因素试验的数据描述
yij 可表示成
yij = + α i + ε ij
其中,为全体试验值的总体平均数,
α i为第i个处理的效应,表示处理i对试验结果产生的影响。
如果我们只研究这a个不同处理,则有
i =1 j =1
a
n
ij
y ) = ∑∑ [( y i y ) + ( y ij y i )] 2
i =1 j =1
2
a
n
= ∑∑ [( y i y ) 2 + 2( y i y )( y ij y i ) + ( y ij y i ) 2 ]
i =1 j =1
a
n
= n∑ ( y i y ) + 2∑ [( y i y )∑ ( y ij y i )] + ∑∑ ( y ij y i )
答:常采用第五章里讲的t检验法。
现在,如何进行 a 个样本的平均数差异的假设检验(a ≥ 3)?
某人答:两两进行 t检验。
评论:这种方法是不行的。
主要原因有三:
原因(1):检验的工作量大
当有a个样本平均数,两两组合,就有 a(a 1) 个平均数的差。 2
10 × 9 例如,a = 10时,就有 =45个平均数的差。 2
总变异
不同处理引 起的变异
随机误差引 起的变异
如何定量地衡 量这些变异? 量这些变异?
2 ij
∑∑ ( y
i =1 j =1
a
n
2 ij
y )
n ∑ ( y i y )
i =1
a
2
∑∑ ( y
i =1 j =1
a
n
y i )
称为误差平方 误差平方 和,记为 SSe
称为总平方和 总平方和, 总平方和 记为 SST
2、随机效应模型 如果处理效应是由随机因素所引起的效应,就称为随机效 应。 固定因素是指因素的水平可以严格地人为控制,水平固定 后它的效应值也是固定的,实验重复时可以得到相同的结 果。 处理固定因素所用的模型称为固定效应模型,简称为固定 模型。 固定模型的方差分析所得到的结论只适合于选定的那几个 水平,并不能将其结论推广到其他未考虑的水平上。
2、混合模型 在多因素试验中,若即包括固定因素,有包括随机因素, 那么该实验应该用混合实验模型进行统计分析。
四、方差分析的原理:
(一)两类误差 1、随机误差:在因素的同一水平(同一个总体)下,各样 本的各观察值之间的差异。如同一盐浓度下的不同碱蓬植 株鲜重的差异 2、系统误差:在因素的不同水平(不同总体)下,各观察 值之间存在的差异。如不同盐浓度处理的碱蓬植株鲜重的 不同。
a = 2时只作一次假设检验, H 0 被接受的概率为 1 α=0.95
I 型错误( H 0为真时,但却被我们否定)=1-0.95 = 0.05
3 a = 3时作3次检验,H 0 被接受的概率为( α) 0.953=0.8574 1 =
I 型错误=1-0.8574 = 0.1426
10 a = 5时作10次检验,H 0 被接受的概率为(1 α) =0.9510=0.5987
换句话说,采用两两t检验法,要进行45次t检验,程序太繁琐。
原因(2):检验的I 型错误增大,从而检验的 可靠性低
a = 2 时, H 0 只有一个,即
1= 2
a = 3 时, H 0 有 3 个,即 1= 2, 2= 3, 1= 3
a = 5时,H 0 有10个,即1= 2, 2=3, , 4=5 L
j =1 n
所以,自由度df e = an a = dfT df A
3、方差(均方)的计算
各平方和除以相应的自由度便得到总均方,处理均方,和误差均方,
分别记为 MST , MS A , MSe , 即
MS T SS T = df T
MS
A
SS A = df A
SS e MS e = df e
* 注意:MST ≠ MS A + MSe
三、方差分析的数学模型
(一)单因素试验的数据描述
重复数(j) 1 1 2 3
┇ j ┇
处理(组别) (i=1,2,...,a) 2 y21 y22 y23
┇
… … … …
┇
i yi1 yi2 yi3
┇
… … … …
┇
a ya1 ya2 ya3
┇
y11 y12 y13
┇
y1j
┇
y2j
┇
…
┇
yij
…
┇
(三)因素处理效应和实验模型的分类
1、固定效应模型 如果处理效应是由固定因素所引起的效应,就称为固定效 应。 随机因素是指因素的水平可以严格地人为控制,水平固定 后它的效应值也是固定的,实验重复时可以得到相同的结 果。 处理固定因素所用的模型称为固定效应模型,简称为固定 模型。随机效应模型的方差分析所得到的结论可以推广到 总体水平上