当前位置:文档之家› 第六章方差分析的基本原理

第六章方差分析的基本原理


i1 j1
k
k
n
kn
n (xi.x..)2 2 [(xi.x..) (xij xi.)] (xij xi.)2
i1
i1
j1
i1 j1
其中 所以
n
(xij xi. ) 0
j 1
kn
k
kn
(xijx.).2n (xi.x.).2 (xijxi.)2
i 1j 1
i 1
i 1j 1
(7-5)
2个平均数比较: α = 0.05 5个平均数比较: α’ = 1-(1-0.05)10= 0.4013 10个平均数比较:α” = 1-(1-0.05)45= 0.9006
因此,多个平均数的差异显著性检验不宜 用t (或u)检验,须采用方差分析法。
方差分析 (analysis of variance)由英国统计学家 R.A.Fisher于1923年提出的。
总和Ti. 76
92
72
96
T 336
平均 x i . 19
23
18
24
x21
t i 2
2
3
3
ti0 eij0 eij~N(0,2)
可 见 , 直 接 用 效 法应 衡值 量无 处 理 所 引 异起
程 度 , 根 据 前 面 ,的 需知 要识 比 较 其 方 差
2、自由度与平方和的剖分
在方差分析中是用样本方差即均方(MS)来度 量资料的变异程度的。
k
(7-5)式中, n (xi. x..)2 为各处理平均数与总
i1
平均数的离均差平方和与重复数n的乘积 ,反映
了重复 n 次的处理间变异 ,称为处理间平方和,
记为SSt,即: k
SSt n (xi.x..)2
i1
(7-6)
(7-5)式中,k n (xij xi.)2 为各处 理内离均差平方
x1.
2 x21 x22 … x2j … x2n T2.
x2.
┇ ┇ ┇…┇…┇ ┇ ┇
i
xi1 xi2 … xij … xin Ti.
xi.
┇ ┇ ┇…┇…┇ ┇ ┇
k xk1 xk2 … xkj … xkn Tk. xk.
T xij
Tx
注:xij指第i个处理第j个观察值(i =1~k ; j =1~n)
19 21 2 0 21 21 2 2 20 21 3 2 22 21 3 2
观察值
23 21
21 21
2 2
4 2
24 27
21 21
2 2
1 4
18 19
21 21
3 3
0 1
25 27
21 21
3 3
1 3
13 21 2 6 20 21 2 3 15 21 3 3 22 21 3 2
——将多个样本 (处理)的观测值作为一个总 体,用方差来表示变异,把引起事件总的变异 分解为各种因素的变异,并对每个因素引起的 变异作数量估计,从而说明各因素的变异幅度 及其在总变异中的重要程度;并用剩余变异无 偏估计随机误差,进而比较处理均值间的差异。
有关术语:
1、试验指标(experimental index) 为衡量试验结 果的好坏或处理效应的高低,在试验中具体测定的性 状或观测的项目称为试验指标。由于试验目的不同, 选择的试验指标也不相同。在畜禽、水产试验中常用 的试验指标有:日增重、产仔数、产奶量、产蛋率、 瘦肉率、某些生理生化和体型指标(如血糖含量、体高、 体重)等。 2、试验因素(experimental factor) 试验中所研究 的影响试验指标的因素叫试验因素。如研究如何提高 猪的日增重时,饲料的配方、猪的品种、饲养方式、 环境温湿度等都对日增重有影响,均可作为试验因素 来考虑。当试验中考察的因素只有一个时,称为单因 素试验;若同时研究两个或两个以上的因素对试验指 标的影响时,则称为两因素或多因素试验。试验因素
在这个模型中xij表示为总平均数μ、处理效应 i、
试验误差εij之和。
由εij 相 互独立且服从正态分布 N(0,σ2 ), 可知各处理i(i=1,2,…,k)所属总体亦应具 正态性,即服从正态分布N(μi , σ2 )。尽管各总 体的均数 μi 可以不等或相等, σ2则必须是相 等的。所以,单因素试验的数学模型可归纳为:
xij 可以分解为:
xiji ij
(7-1)
其中:μ表示全试验观测值总体的平均数;
i 是 第 i 个 处理的效应 (treatment effects)表示处理i
对试验结果产生的影响。显然有
k
i 0
(7-2)
i 1
εij 是试验误差,相互独立,且服从 正态分布N(0,σ2)。
(7-1)式叫做 单因素试验的线性模型,亦称数学模型。
表7.1中全部观测值的总变异可以用总均方来度 量。
将总变异分解为处理间变异和处理内变异,就 是要将 总 均方 分解为处理间均方和处理内均方。 但这种分解是通过将总均方的分子──称为总离均差 平方和,简称为总平方和,剖分成处理间平方和与 处理内平方和两部分;将总均方的分母──称为总自 由度,剖分成处理间自由度与处理内自由度两部分 来实现的。
二、方差分析的基本原理
1、线性模型与基本假定
假设某单因素试验有k个处理,每个处理有n 次重复,共有nk个观测值。这类试验资料的 数据模式如表7.1所示。
表7.1 k个处理每处理有n个观测值的数据模式
处理 观察值(xij,i =1~k ; j =1~n) 总和 平均
1 x11 x12 … x1j … x1n T1.
常用大写字母A、B、C、…等表示。
3、因素水平(level of factor) 试验因素所处的某种特 定状态或数量等级称为因素水平,简称水平。研究某种 饲料中4种不同能量水平对肥育牛瘦肉率的影响,这4种 特定的能量水平就是饲料能量这一试验因素的4个水平。 因素水平用代表该因素的字母加添足标1,2,…,来表
i 1j 1
i 1
i 1j 1
于是有
SST =SSt+SSe
(7-8)
这个关系式中三种平方和的简便计算公式如下:
kn
S S SS T
x
2 ij
C
i 1 j 1
S SS t
1 n
k
T
2 i.
i 1
C
SSe ST SSS t
(7-9)
其中,C = T2 /(kn) 称为矫正数。
(2)自由度的剖分
在计算总平方和时,资料中的各个观测值要
➢ 效应的可加性(additivity)、分布的正态性 (normality)、方差的同质性(homogeneity)。这 也是进行其它类型方差分析的前提或基本假定。
若将表7.1中的观测值 xij(i=1,2,…,k; j=1,2,…,n) 的数据结构(模型)用样本符号来表示,则
x i jx ( x i. x ) ( x i jx i.) x ti e i j(7-3)
所以
dTf dtfdef
(7-13)
综合以上各式得:
df T kn 1 df t k 1 df e df T df t
(7-14)
(3)均方的计算
各部分平方和除以各自的自由度便得到总均
方、处理间均方和处理内均方, 分别记为 MST
(或
S
2 T
)、MSt(或
S
2 t
)和MSe(或
S
2 e
观察值
23 21
13
总和Ti. 76
平均 x i . 19
xi. x -2
B(x2) 21 24 27 20 92
23
2
C(x3) 20 18 19 15 72
18
-3
D(x4) 22 25 27 22
96 T 336
24 x21
3
4种药品处理水稻苗 得, 的测 苗(高 cm)
药剂 A(x1) B(x2) C(x3) D(x4)

kn
(xij
x..)0这一条件的约束,故总自由度
i1 j1
等于资料中观测值的总个数减1,即kn-1。
总自由度记为dfT,即: dfT = kn – 1
(7-10)
在计算处理间平方和时,各处理均数要受
k
(xi. x..) 0 这一条件的约束,故处理间自由度
i1
为处理数减1,即k-1。 处理间自由度记为dft,
)。
即:
MTSST 2ST S/dTf
MtSSt2StS/dtf (7-15)
MeSSe2SeS/def
总均方一般不等于处理间均方加处理内均方。
计算均方后,通过比较处理间均方相对误差 均方的大小即可判断处理效应所引起的变异 所占比重,从而可以判断试验是否存在明显 处理效应。
1、u或t 检验过程烦琐
例如,一试验包含5个处理,采用t检验法要
进行
C
2 5
=10次两两平均数C
2 k
= k(k-1)/2 次类似的
检验。
2、无统一的试验误差,误差估计的准确 性和检验的灵敏性低
(1)t 检验要进行两两比较,每次仅用2个样本信 息估计总体方差,误差估计的准确性低
xiji ij
(7-1)、(7-3)两式告诉我们:
每 个 观 测 值 都包含处理效应(i 或 xi. x),
与误差( εij 或 xij xi. ),故kn个观测值的总变异
可分解为处理间的变异和处理内的变异两部分。
【例7.1】
4种药品处理水稻苗 得, 的测 苗(高 cm)
药剂 A(x1)
19
5、试验单位(experimental unit) 在试验中 能接受不同试验处理的独立的试验载体叫试验 单位。在畜禽、水产试验中,一只家禽、一头 家畜、一只小白鼠、一尾鱼,即一个动物;或 几只家禽、几头家畜、几只小白鼠、几尾鱼, 即一组动物都可作为试验单位。试验单位往往 也是观测数据的单位。
相关主题