当前位置:
文档之家› Minitab两因素方差分析
Minitab两因素方差分析
T2 S T y vb i 1 j 1
v b 2 ij
f e (v 1)(b 1) MSe S e / f e
f T vb 1
Minitab
例 化学制剂对布料有侵蚀作用,会降低布料的抗拉强 度.某工程师研究出一种能抗化学制剂的新型布料,为考察其 抗侵蚀作用,特选定 4 种化学制剂和 5 匹布.考虑到布匹间的 差异,特在每匹布的中部切取4段布料组成一个区组,用随机 化完全区组设计安排试验.试验数据如下: 表 区组 处理 1 2 3 4 Bj Bj 1 3 3 5 5 16 4 试验数据(原始数据-70) 2 -1 -2 2 2 1 0.25 3 3 4 4 7 18 4.5 4 1 2 3 5 11 2.75 5 -3 -1 -2 2 -4 -1
据仍然可按单因子方差分析处理,所得方差分析表如下: 表 来源 处理 误差 总和 把区组从设计中剔除后的不正确分析 平方和 37.8 102.0 139.8 自由度 3 16 19 均方和 12.6 6.38 F比 1.97
对给定 =0.05,4 种处理间没有显著差异. 这一错误结论是没有重视区组作用而导致的. 所以在试验中,凡是试验单元间有较大差异时,应运用 区组概念去减少数据中的误差.
A2 A4 A1 A3
A4 A1 A2 A3
A2 A3 A4 A1
A3 A2 A1 A4
特点:每个处理(一种杀虫剂)在每个区组内仅出现一次;每 个区组内各种处理也仅出现一次,且其次序是随机的.
Minitab
例:金属的硬度是用硬度计测定的,硬度计上的杆尖是关键 部件. 如今要比较四种不同质料的杆尖的差异, 如何安排试验? •若每种杆尖要取 4 个硬度值, 按随机化设计需要有 16 块同 类金属.这时存在一个潜在问题,金属试件间在硬度上稍有不 同,就会对比较杆尖产生影响.而不同炉钢在硬度上总是有差 异的. •只取 4 块金属试件,在每块试件上每个杆尖各测一次(见 图) ,而测试点可以随机选择.这时一块试件就是一个区组,4 个杆尖就是4个处理.这样就完成一个随机化完全区组设计. 区组 1 ① ④ ② ③ 区组 2 ② ① ③ ④ 区组 3 ③ ② ④ ① 区组 4 ④ ③ ① ②
i 1 j 1 v
i 1 b
j 1 b
各平方和的简化计算公式
Minitab
T2 2 S T y ij , vb i 1 j 1
v b
f T vb-1
T12 T22 Tv2 T 2 SA , f A v-1 b vb 2 B12 B2 Bb2 T 2 SB , f B b-1 v vb
图 金属试件的随机化区组设计 (①②③④表示 4 种不同杆尖)
随机化区组设计的一般定义
设(某因子)有 v 个处理需要比较,有 n 个试验单元用于 试验. 第一步:把 n 个试验单元均分为 k 个组(k=n/v) ,使每 个组内的试验单元尽可能相似,这样的组称为区组. 第二步:在每个区组内对各试验单元以随机方式实施不 同处理.这样的设计称为随机化区组设计. 若区组大小=处理个数 v,这样的设计称为随机化完全 区组设计. 若区组大小<处理个数 v,这样的设计称为随机化不完 全区组设计. 以上各种设计都是平衡的,若各区组大小不尽相同,称 为不平衡区组设计.
v (区组)和 均值
y v1
B1
B1
yv 2
B2
… … …
y vb
Bb
Bb
Tv
v b i 1 j 1
Tv
T y ij
y T / vb
B2
其中: T 为全部 vb 个数据的总和, y 为总均值.
随机化完全区组设计的统计模型
在 v 个处理和 b 个区组场合的统计模型如下:
yij ai b j ij,i 1, ,2, v, j 1,2,, b
Minitab
其中
y ij -第 i 个处理在第 j 个区组内的试验结果.
-总均值,是待估参数.
a i -第 i 个处理的效应, 且满足 a1 a 2 av 0 .
b j -第 j 个区组的效应,且满足 b1 b2 bb 0 .
1 v 2 T2 S A Ti b i 1 vb
1 b 2 T2 SB B j v j 1 vb
自由度
均方和
F比
f A v 1
f B b 1
MS A S A / f A
MS A F MSe
——
MS B S B / f B
S e ST S A S B
这里仅讨论第二种情况,其它情况可作类似讨论.
随机区组效应场合下的统计模型
Minitab
yij ai b j ij,i 1, ,2, v, j 1,2,, b
其中
y ij -第 i 个处理在第 j 个区组内的观察值.
-总均值.
ai - 第 i 个 固 定 处 理 的 效 应 , 且 满 足 a1 a 2 av 0 .
•随机化区组设计:分二步进行. Minitab 第一步, 将 20 块棉田按差异大小排序,将害虫最多的4 块棉田分为第1个区组, 将害虫最少的4块棉田分为第5个区 组,其它按序入组. 第二步,在1个区组内随机的实施一种杀虫剂. 区组 1 区组 2 区组 3 区组 4 区组 5
A1 A3 A4 A2
S e ST S A S B , f e (v-1)(b 1)
平方和的性质
•可以证明:平方和的期望分别为
Minitab
E ( S A ) (v 1) 2 b ai2 , E ( S B ) (b 1) 2 v b 2 , j E ( S e ) (v 1)(b 1) ,
2 y ij ~ N ( a i , b 2 ),i 1,2, , v, j 1,..., b . 其中 和诸 a i 的最小二乘估计是 ˆ ˆ y , ai Ti y,i 1,2,, v 2 方差分量 b 与 2 的无偏估计为 MS B MS e 2 , 2 MSe ˆ ˆ b v 这是因为各平方和的期望值如下: v E ( S A ) (v 1) 2 b ai2
给定显著性水平 =0.05,查其临界值 F0.95 (3,12) 3.49 , 由于 F>3.49, 故拒绝 H 0 , 即四种化学制剂对新型布料的抗拉强 度的影响有显著差异,还需改进布料设计.
ˆ ˆ 试验误差的方差 的估计是 0.89 , 0.94 .
2 2
Minitab 注释一. 假如不设立区组, 则区组平方和并入误差平方和. 数
Minitab
H 1:诸bi中至少有一个不为零 在此假设下,检验统计量为 MS B F MSe •尽管对此检验的合理性存在着争论,但从双因子方差分 析看, 再一次使用 F 检验也未尝不可, 把检验结果作为一种参 考也是有价值的.
Minitab
注释三.随机效应问题,有三种情况 •仅仅处理效应是随机的. •仅仅区组效应是随机的. •处理效应和区组效应都是随机的.
j j
由此可得各拟合值 y ij 与残差 e ij : ˆ
ˆ ˆ ˆ ˆ y ij a i b j Ti B j y ˆ eij y ij y ij y ij Ti B j y
总平方和分解公式
S T ( y ij y ) 2,
i 1 j 1 v i 1 b j 1 v v b
区组设计的例子
例
Minitab 有4种杀虫剂 A1 , A2 , A3 , A4 ,它们被称为4种处理.
为了比较4种杀虫剂对棉田中害虫的杀虫效果高低,特选了 20 块田,每块 1 亩.如何安排试验呢? •随机化设计:将 20 块田随机的均分为4组,分别实施4种 处理.其数据分析用单因子方差分析. 评论:20 块棉田试验单元间总有差异,如害虫多少,植物长 势,土地肥沃程度等.这些差别对杀虫效果会带来影响,从而对 比较产生干扰. 假如此种差异很微小,实施随机化设计是妥当的. 假如此种差异不可忽略,就要采取随机化区组设计.
Ti
Ti
3 0.6 6 1.2 12 2.4 21 4.2 T =42 y =2.1
Minitab
例
在化学制剂对布料抗拉强度的试验中,按表上的数据
可算得各平方和及其自由度: 方差分析表 来源 处理 区组 误差 总和 平方和 37.8 91.3 10.7 139.8 自由度 3 4 12 19 均方和 12.6 22.83 0.89 F比 14.16 ——
Minitab
在模型中,全部 vb 个观察值的总平方和有如下分解式:
f T vb 1
v b
b (Ti y ) 2 v ( B j y ) 2 ( y ij Ti B j y ) 2
i 1 j 1
处理平方和: S A b (Ti y ) 2,f A v 1 区组平方和: S B v ( B j y ) 2,f B b 1 误差平方和: S e ( y ij Ti B j y ) 2 即有 S T S A S B S e , f T f A f B f e . 注意:设立区组的目的,就是把区组平方和从总平方和分解出来, 免其对处理平方和与误差平方和的干扰, 从而加强以后判断 的准确性.
由此可见, 2 MSe S e / f e 是误差方差的无偏估计. ˆ •可以证明:在诸处理效应皆为零时, S A / 2 ~ 2 (v 1) . 在诸区组效应皆为零时, S B / 2 ~ 2 (b 1) . S e / 2 ~ 2 ((v 1)(b 1)) ,且三者相互独立. •检验诸处理效应皆为零时,所用的检验统计量是 MS A S A / f A ~ F( f A , fe ) F MS e Se / fe