第8章_单因素方差分析
个处理,各重复n次(的数据χij,表示第i次处理下的第j次观测值
xi . xij , xi .
j 1 a n n
1 xi .(i 1,2,...,a ) n 1 x.. an
x.. xij , x..
i 1 j 1
若接受H0,则不存在处理效应,每个观测 值都是由总平均数加上随机误差所构成的。若拒 绝H0,则存在处理效应,每个观测值是由总平 均数,处理效应及误差3部分构成。
上一张 下一张 主 页
退 出
8.2.2 平方和与自由度的分解
方差分析的基本思想,就是将总的变差分解为 构成总变差的各个分量,然后再用适当的方法对
8.1.2
不同处理效应与不同模型
常用如下的所谓线性统计模型(linear statistical model)描述每一观测值:
i 1 ij i ij j=1 n
(8.1)
其中:χij中是在第i水平(处理)下的第j次观测值。 μ是对所有观测值的一个参数,称为总平均数。 αi是仅限于对第i次处理的一个参数,称为第i次处理 效应(treatment effect)。
机因素所引起的效应。 若因素的a个水平,是从该因素水平总体中随机抽出的样本, 则该因素称为随机因素。 从随机因素a个水平所得到的结论,可以推广到这个因素的 所有水平上。在这里αi是一个随机变量,所检验的是关于αi变异 性的假设. 处理随机因素所用的模型称为随机效应模型或者简
单地称为随机模型。
上一张 下一张 主 页
样本,判断这5个总体是否存在差异。
例8.2 为了探讨不同窝的动物出生重是否存在差异,随
机选取4窝动物,每窝中均有4只幼仔,结果见表8-2:
表8-2 4窝动物的出生重 单位:g 动物号 1 2 3 4 和 Ⅰ 34.7 33.3 26.2 31.6 125.8 Ⅱ 33.2 26.0 28.6 32.3 120.1 窝别 Ⅲ 27.1 23.3 27.8 26.7 104.9 Ⅳ 32.9 31.4 25.7 28.0 118.0
所引起的效应。若因素的a个水平是经过特意选择的,则该 因素称为固定因素。例如,温度、药物、浓度、品种等称为
固定因素。
方差分析所得到的结论只适用于选定的那几个水平,并
不能将其结论扩展到未加考虑的其他水平上。处理固定因素
所用的模型称为固定效应模型或简单地称为固定模型.
上一张 下一张 主 页
退 出
第二类处理效应: 随机效应(random effect),它是由随
MSA ,具dfA,dfe自由度(8.11) F MSe
上一张 下一张 主 页 退 出
当F<Fα时,则可以认为MSA与MSe差异不大,
产生的变差是由随机误差造成的, 近似于0,接受零假设,处理平均数之间差异不显 著。 当F>Fα时,
n a 2 MSA显著高于MSe, a 1 i i 1
MSe SSe an a
(8.7)
MSe称为误差均方(error mean square)。
记MSA为处理均方,
MS A SS A a 1
(8.8)
上一张 下一张 主 页
退 出
8.2.3 均方期望与统计量 可以证明MSe是σ2的无偏估计量。这可 以由MSe得数学期望得出
SSe 1 (MSe ) ( ) (SSe ) na a na a a n 1 2 ( ij i ) na a i 1 j 1
n a 2 i a 1 i 1
不再为0。拒绝零假设,处理平均数间差异显著。
在 MS A
n a 2 i 中,令 a 1 i 1
2
1 a 2 i a 1 i 1
2
(8.12)
(8.13)
2
则
2 MS A 2 n
上一张 下一张 主 页 退 出
方差分析的目的: 检验处理效应的大小或有 无。εij是随机误差成分。要求模型中的误差εij是 服从正态分布N(0,σ2)的独立随机变量,并 要求各水平的方差均为σ2。
上一张 下一张 主 页
退 出
第一类处理效应: 固定效应(fixed effect),它是由固定因素
本章是方差分析中最简单的类型,称为单因素方差分析
(one-factor analysis of variance)或者称为一种方式
分组的方差分析(one-way classification analysis of variance)。
上一张 下一张 主 页
退 出
例8.1 调查了5个不同小麦品系的株高, 结果列于表8-1。
退 出
固定因素与随机因素的区分原则:
固定因素是指因素的水平可以严格地认为控制,在水平固定之 后,它的效应也是固定的。例如温度水平是可以严格控制的,即每 一温度水平,在各个重复之间都可以准确地控制在一个固定值上。 简单地说:在水平(不同温度)固定以后,其效应值(产量)也是
固定的。因此,温度是固定因素。
各分量进行检验。对单因素实验,可以将总平方
和(total sum of squares)作如下分解:
上一张 下一张 主 页
退 出
(8.3)
(8.3)式表示度量全部数据变差的总平方和,可
以分解为处理平均数与总平均数之间离差的平方和及处
理内部观测值与处理平均数之间离差的平方和两部分。
处理平均数与总平均之间的离差,度量了处理之间的差
所造成的方差的大小,它是σ2的无偏估计量。
a n 2 E ( MS e ) 2 , E ( MS A ) 2 i a 1 i 1
对于处理项来说,只有当零假设
H0: α1= α2=‥= αa= 0成立时, MSA才是σ2 的无偏估计量。当αi=0时,(8.10)式中的
上一张 下一张 主 页
退 出
现在用以上各式计算例8.1。在方差分析中, 为了简化计算,同样可以用编码法。方差分析的
随机因素的水平是不能严格地人为控制的,在水平确定之后,
它的效应并不固定。例如,在研究农家肥不同施用量对作物产量
的影响实验中,农家肥是因素,不同施用量是该因素的不同水平,
作物的产量是它的效应值。由于农家肥的有效成分很复杂,不能
像控制温度那样,将农家肥的有效成分严格地控制在某一个固定 值上。在重复试验时即使施以相同数量的肥料,也得不到一个固 定的效应值。即在因素的水平(产量)并不固定,因而农家肥是一 个随机因素。
Ⅳ 71.8 72.1 70.0 69.1 71.0 354.0 70.8
Ⅴ 69.2 68.2 69.8 68.3 67.5 343.0 68.6
在这个例子中,只出现“品系”这样一个因素
(factor),称为单因素。共有5个不同的品系,
我们称品系这一因素共有5个水平(level)。 5个品系可以认为是5个总体,表8-1的数据 是从5个总体中抽出的5个样本,通过比较这5个
i 1 a 2
(8.5)
用SSe表示(8.3)式等号右边第二项,称为误 差平方和或称为处理内平方和 SST=SSA+SSe
自由度分割:总自由度dfT=an-1;A因素共
有α水平,因而dfA=a-1;误差项有an-a自由度,
这是因为每一处理均有n-1自由度 ,共有a个处理,
因而dfe=an-a。
为了估计σ2,用SSe除以相应的自由度
平均数
31.450
30.025
26.225
29.500
判断不同窝别动物出生重是否存在差异?
上一张 下一张 主 页 退 出
以上两个例子的共同点是:每个实验都只有 一个因素,该因素有a个处理(treatment), 这样的实验称为单因素实验。从单因素实验的每 一处理所得到的结果都是一随机变量Xi。对于a
第八章 单因素方差分析
§8.1方差分析的基本原理
8.1.1方差分析的一般概念
方差分析(analysis of variance ANOVA):同时判 断多组数据平均数之间的差异显著性 。在多组数据的平均数之 间做比较时,可以在平均数的所有对之间做t检验。但这样做 会提高犯Ⅰ型错误的概率, 因而是不可取的。
这时的零假设H0:αi=0,也可以写成H0: =0,备 则假设HA:
2 > 0.
上一张 下一张 主 页
退 出
方差分析表
表8-4 单因素固定效应模型方差分析表
变差来源 处理间 误差或处 理内 总和 平方和 SSA SSe SST 自由度 a-1 na-a na-1 均方 MSA MSe
F
n a 2 i 项等于0,这时E(MSA)= a 1 i 1
σ2,因此用
退 出
MSA于MSe比较,就可以反映出αi的大小。
上一张 下一张 主 页
若MSA与MSe相差不大,就可以认为各αi与0 的差异不大,或者说各处理平均数(μi)间差异 不大。若MSA比MSe超出很多,则认为(μi)间 差异显著。为此,用F上尾单侧检验。
上一张 下一张 主 页 退 出
§8.2 固定效应模型
8.2.1 线性统计模型
在固定效应模型中,αi是处理平均数与总平均数的离差,是 个常量,因而
n
i 1
i
0
(8.2)
要检验a个处理效应的相等性,就要判断各αi是否都等于0。若各 αi是都等于0,则各处理效应之间无差异,因而,零假设为: H0: α1= α2=‥= αa= 0 备择假设为: HA: αi≠0(至少有1个i)
(8.14) (8.15)
SS A n xi. x..
i 1
2
x 1 2 xi. n i 1 na
用C表示。
其中的 通常称为校正项(correction), na 2 C= na