5、方差分析一
Σ(Y-Ӯ )2=Σ(Y - Ӯt) 2 + n ( Ӯt - Ӯ ) 2
A3 22.1 ……… 25.8 123.7 24.74 15.97
A4 27.0 ……… 28.5 139.8 27.96 22.33
再把全部处理观察值的……累加,得:
ΣΣ(Y-Ӯ )2=ΣΣ(Y-Ӯt) 2 + nΣ ( Ӯt-Ӯ ) 2 即: SST = (组内) SSe + (组间) SSt 其中 SSt = nΣ ( Ӯt-Ӯ ) 2 = Σ Tt 2 /n -C
dft = k - 1= 3 dfe= dfT - dft =19-3 = df1 + df2 + df3 +df4= 4 +4 +4+4 = 16
第一节 方差分析原理
三、列ANOVA表,进行F-test
变异来源 DF SS
MS F
F 0.01
处理 3 114.27 38.09 7.13 ** 5.29
Fisher’s protected multipe comparisons. 此前产生的复极差测验 (简称q-test、又 称SNK测验) 却可以不经过F-test, 原因 是q-test算LSRα时要改查q 值表(附表7), 所依据的q分布是按极差抽样分布原理 要保证各比较都是同一显著水平α, 因 而对 t 分布修正幅度随秩次距k的递增 而加大的速度要比SSR分布快, 所以秩 次距k≥3 时q0.05和q0.01 比相应的SSR0.05 和SSR0.01大。
A3 24.74
Ӯt-26.28 Ӯt-27.96
4.9 ** 3.22 * 1.68 ns
SE = 1.033
综合包括多重比较在内的方差分析 全过程,其原理可归纳为:
一个性质(SS、DF的可加性) 两个分布(F分布和SSR分布) 本例根据SSR分布进行的多重比较 叫新复极差测验, 简称SSR-test 。因为 不能缺少 F-test 显著的前提,属于
上升到26.5%( 即 “t0.05 ”= t0.265 )……以
此
类推……5个样本……40%以上。
第一节 方差分析原理
一、数据整理
饲料 鱼 的 增 重 (10g)
根据方差分析的先决条件,在“三个
Tt
Ӯt
SS
假定”成立的前提下,对右表继续整理: A1 31.9 ……… 35.9 155.9 31.18 41.67
S Ӯ1-Ӯ2 =√Se2 ( 1/n1 + 1/n2 ) = 1.70
t0.143)…
t =〔( Ӯ1- Ӯ2 ) -(μ1-μ2)〕÷ SӮ1- Ӯ2
继续以相同的容量每次抽四个样本,
= 6.44 ÷ 1.70 = 3.8 > “t0.05”=2.306
仍以Ӯ最大的和Ӯ最小的求算t 值, 则…… 的把由握于不撇到开8A0%、。B孤立地进行,否定HO
重要程度是否达到显著水平。
第一节 方差分析原理
四、多重比较 R.A.Fisher 创建的方差分析法并没有明确
(极)显著差异究竟存在于哪些 “组平均数” 之间, F值(极)显著所包含的信息只有通过 对C2n= k(k-1)/2个两两差数进行多次连续性
顺序 Ӯt Ӯt-24.74 27.96
A1 31.18 6.44 A4 27.96 3.22 A2 26.28 1.54 A3 24.74
dft = k - 1= 4 dfe= dfT - dft =24-4= 20
3、列ANOVA表,进行F-test
假设是Ho:σt2 ≤σe2 而不是Ho:σt2 =σe2
(和 Ho:μ1= μ2= μ3= μ4= μ5效果一样)
SOV DF SS MS F F 0.01 品种 4 73.2 18.3 5.83** 4.43
试验设计有几个可控因素, 数据就会有几种 可能的分组方式, 也就可以算出几个组间SS, 而 本属于组内SS的误差分量在平方和分解时总是 由SST 减去所有可控因素SS得到, 因此它又被称 为“剩余平方和”。
自由度的剖分与平方和的剖分一一对应。
㈡依据F分布进行整体测验; 只确定可控因素分量和误差分量的相对
第二节 单向分组数据
单向分组数据指观察值仅按一个方 向分组的数据。如例5.1中将全部供试单 品种 产仔数观察值(头) Tt Ӯt
位(试验材料)随机地分成若干组,然后
1 8 13 12 9 9 51 10.2
各组给以不同处理,即同组供试单位受 2 7 8 10 9 7 41 8.2
相同处理,不同组受不同处理,这样所 得的全部观察值在设计上称为完全随机 试验数据,而实际研究中下例5.2那样的 调查结果也属此类。
㈠平方和与自由度的可加性; SST 综合了全部观察值的变异量, 它汇总了
各变异来源 (SOV) 导致原始数据和全试验平均 数 ( Ӯ ) 出现差异的分量, 包括可控因素分量和 误差分量两类; “可加性” 证实前者就是观察 值按可控因素分组后算得的组间平方和 ( 可控 因素可以是试验因素, 也可以是象单位组那样 的其它系统因素 ) 。
测验才能完全揭露出来,这就是多重比较。
ν=16,k =2→
多重比较不论用哪一种方法, 区别于多 次孤立的 t-test 或者说体现其“连续性” 特征
ν=16,k =3→
Ӯt-26.28 Ӯt-
4.9
3.22
1.68
←SSR= t√2
之处有两个, 一是必须使用同一个共用的标 准误, 记为“SE”), 本例SE=√MSe / n = √5.34÷5 =1.033 (10g); 二是所依据的抽样分
A1 31.9 ……… 35.9 A2 24.8 ……… 26.2 A3 22.1 ……… 25.8
155.9 31.18 41.67 131.4 26.28 5.43 123.7 24.74 15.97
A4 27.0 ……… 28.5 139.8 27.96 22.33
比如本例针对药剂A1与药剂A3的两两差 数6.44 (最大Ӯ -最小Ӯ) 进行的t-test:
误差 20 62.8 3.14
总 24 136 4、多重比较
SE=√MSe / n =√3.14÷5 = 0.793
品种 产仔数观察值(头) Tt Ӯt
Y-Ӯ = (Y-Ӯt) + ( Ӯt -Ӯ ) 两边同时平方,得:
(Y-Ӯ )2 = (Y - Ӯt) 2 + ( Ӯt - Ӯ ) 2 +2 (Y - Ӯt) ( Ӯt - Ӯ )
由同一处理重复观察值的……累加:
Σ(Y-Ӯ)2=Σ(Y-Ӯt) 2 + Σ(Ӯt -Ӯ ) 2 +2 ( Ӯt - Ӯ ) Σ (Y - Ӯt) 〔= 0〕
第一节 方差分析原理
附表6 列出了各自由度对应的t 分布曲线 再按9 种秩次距修正出来的SSR分布当两尾 概率取0.05和0.01时临界值,记为SSR0.05和 SSR0.01,其中k =2的那一条因为实际就是 t 分布曲线压缩横坐标刻度所得, 所以表中列
顺序 Ӯt 27.96
A1 31.18 A4 27.96 A2 26.28 A3 24.74
= (155.9 2 +131.4 2 +123.7 2 +139.8 2 )/ 5 - 15169.03 = 114.27
于是SSe = SST- SSt = 199.67 -114.27 = 85.4 = SS1 + SS2 + SS3 +SS4 = 41.67 +5.43 +15.97+22.33
1、数据整理
C = T 2/nk = 265 2/25 = 2809 SST =ΣΣ(Y-Ӯ ) 2 = ΣΣY 2 -C
=82 +132 +……+132 -2809 = 136 dfT = nk - 1= 5 ×5 - 1 = 24
第二节 单向分组数据
2、平方和、自由度的分解
SSt = nΣ ( Ӯt-Ӯ ) 2 = Σ Tt 2 /n -C = 73.2 = (51 2 +41 2 +60 2 +48 2 +65 2 )/ 5 -2809 于是 SSe = SST- SSt = 136-73.2 =62.8
Ӯt-24.74 Ӯt-26.28 Ӯt-
6.44 ** 3.22 ns 1.54 ns
4.9 ** 1.68 ns
3.22 *
出的SSR0.05和SSR0.01就分别等于附表3所列 t0.05 和t0.01的√2 倍; 其它k≥3的SSR分布随 着P的递增, 对 t 分布的修正幅度加大, 因此
ν=16,k =2→ ν=16,k =3→
3 13 14 10 11 12 60 12 4 13 9 8 8 10 48 9.6 5 12 11 15 14 13 65 13
一、各组观察值个数相等
例5.2 抽测 5个不同品种(k = 5)各5 头母猪(n = 5)的窝产仔数,结果如右表 所示,T = 265,试检验不同品种的母猪 平均窝产仔数差异是否显著。
5
2 3.00 4.13 3.099 4.266
3 3.15 4.34 3.254 4.483
4 3.23 4.45
LSR0.05= SE ·SSR0.05
3.337 4.597
LSR0.01= SE ·SSR0.01
顺序 Ӯt Ӯt-24.74
A1 31.18 6.44 ** A4 27.96 3.22 ns A2 26.28 1.54 ns
ν=16,k =4→
3.自由度dfe决定, 并根据 两两差数秩次距“k”的不同而有所修正。如
↓ 3.00
↓
本例k = 2、3、4,测验时依据dfe=16的 t 分