当前位置:文档之家› 第六章方差分析

第六章方差分析

比较合理的拒绝域形式为:
(6.1.8)
W {F c}
对给定的显著性水平 ,c 应满足
P(F c)
22
例6.1.1的方差分析表
方 差 平 方 自 由 均方 F 比 P 值
来源 和

A
516
2
258. 9.00 0.003
e
430 15 28.67
T
946
17
P=0.003<0.05,故拒绝 H 0 24
5
在本例中我们要比较三个工厂的考分是否相同, 为此把工厂看成一个因子,记为A,它有三个工
我厂们,将就第看成i 个因工子厂A的的三第个j水个平工,人记的考A分1 、记A为2 、A3。
yij , i 1,2,3; j 1,2,, mi
在本例中 m1 m2 m3 6
由于在每个工厂选的是随机样本,(工人间的差异控
i 1
i 1
r
r
r
mi ai2 2 mi ai ( i ) mi ( i )2
i 1
i 1
i 1
r
r
r
E(S A ) mi ai2 2 mi ai E( i ) mi E( i )2
i 1
i
三、检验统计量与拒绝域
ij ~ N (0,
2 ),i 1,2,, r, j 1,2,, mi
i
~
2 N(0, ),i
mi
1,2,, r,
~
2 N(0, )
n
18
(2) 求 E(S A )
r
r
S A mi ( yi y)2 mi (ai i )2
ˆ 2 Se nr
27
§6.2 双因子方差分析
一、问题
对于双因子试验,试验间差异同样是(1)由于 各因子水平变化所引起;(2)试验误差(包括未 加控制或无法控制的因子的变化)所引起。
和单因子试验的情况一样,在双因子试验中,方 差分析的目的就是将试验误差所引起的结果差异 与试验条件的改变(即各因子不同的水平变化) 所引起的结果差异区分开,以便能抓住问题的实 质;此外,还要将试验结果的主要因子和次要因 子区分开来,以便集中力量研究几个主要因子。
6.1.4 效应与误差方差的估计
一、点估计 yij ~ N ( ai ,
2 ) 用MLE法求各效应与方差
2 的估计。
r mi
L(, a1, a2 ,ar ,
2 )
i1 j1
1 2
2
exp{
( yij
2

2
ai
)
2
}
l
(
,
a1,
a2
,ar
,
2
)


1
2
r i 1
mi
( yij
j 1
ai ) 0
l

ai
1
2
mi
( yij ai ) 0,
j 1
i 1,2,, r


l

2
n 2
2
1 2
4
r i 1
mi
( yij
j 1
ai )2
我们一般用大写字母A、B、C等表示因 子,用大写字母加下标 表示该因子的水 平,如A的水平用 A1, A2 , 等表示。
4
表6.1 员工的考分
观察值
1 2 3 4 5 6
亚特兰大 (工厂1)
A1 85
75
82
76
71
85
达拉斯 (工厂2)
A2 71
75
73
74
69
82
西雅图 (工厂3)
A3 59
64
(1)原假设H 0不真,即各水平下总体均值不同;
(2)差异是由于随机误差引起的。
mi
记 yi yij
表示水平 Ai下的数据和i
表示水平 Ai 下数据的平均值
y
1 n
r i 1
mi
yij
j 1
为所有数据的总平均值。
i

1 mi
mi
ij
简称为 Ai 的效应。
r
显然有
m iai 0
i 1
12
6.1.3 检验方法
一、误差来源




A1
y11
y12
……
y1m1
A2
y21
y22
……
y 2 m2



Ar
yr1
yr2 ……
y rmr
14
每一数据与总平均的偏差可以分解成两部分:
yij y ( yij yi ) ( yi y) (6.1.5)
i 1
r
r

miai2 E(
mi
(
2 i
2i

2 ))
i 1
i 1
r
r

miai2
mi
E
(
2 i
)
nE(
2
)
20
i 1
i 1
当原假设为真时,各 ai 相等且为 0 ,则
E(S A ) (r 1)
2
取检验统计量为:
F S A (r 1) Se (n r)
yij ai ij , i 1,2,, r. j 1,2,, mi
r

mi ai 0
i1
(6。1。4)
各 ij相互独立且服从N (0,
2 )
从而假设(6.1.1)可写成:
H 0 : a1 a2 ar 0
13
造成各 yij 差异的原因可能有两个:
j 1
i 1
则有
E(Se ) (n r)
2
19
r
r

mi ai2 E(
mi
(
2 i

2 i

2 ))
i 1
i 1
r
r

mi ai2
mi
E(
2 i
)
nE(
2
)
i 1
i 1

r i 1
mi ai2

r i 1
mi
2 mi
n
8
要比较各个总体的均值是否一致,就是要检验 各总体的均值是否相同,设第 i 个总体的均值
为 i ,那么要检验的假设为: H 0 : 1 2 r (6.1.1)
其备择假设为: H1 : 1, 2 ,, r 不全相同。 通常 H1 可以省略不写。
9
二、数据结构及统计模型
yij yi 称为组内偏差,仅反映随机误差:
yij yi (i ij ) (i i ) ij i (6.1.6)
yi y 称为组间偏差,除随机误差之外还有 第 i 个水平的效应:
yi y (i i ) ( ) ai i (6.1.7)
第六章 方差分析
§6.1 单因子方差分析
实践例子: 美国的Burke市场调查公司是一家最富经验的市场 调研机构之一。在一次研究中,一家Anon公司要评 价儿童干谷类食品的潜在的新品种。Anon产品开发 者认为可能改善食品味道的四类关键因素为:
1.食品中小麦与玉米的比例。 2.甜味剂的类型:白糖、蜂蜜或人工制剂。 3.果味香料的有无。 4.加工时间的长短。


n 2
ln(2
2
)

1 2
2
r i 1
mi
( yij ai )2
j 1
25
ui ai 的MLE为 ˆ i yi ,可以证明
ˆ , ˆ i , aˆi
均为相应参数的无偏估计。
E
(
ˆ
2 M
)

E(Se ) n

nr
n
2

2
不是
2
的无偏估计
2 的无偏估计为
*食品成分及甜味剂的类型对味道影响很大。 *果味香精事实上破坏了食品的味道。 *加工时间对味道没有影响。
这些信息帮助Anon识别出了可能产生最佳口味食 品的因素。从而在生产方案中起了很大的作用。
2
类似问题有许多,今后我们称所要比较的 地区、联营厂等为因子,因子所处的状态 称为水平,如四个地区是地区这个因子的 四个水平。
0
r
加上约束条件 mi ai 0 ,则 MLE为: i 1 ˆ y
aˆi yi y i 1,2,, r
ˆ
2 M

Se n
26
二、i 的置信水平为 1 的置信区间
我们来利用枢轴量法构造 i 的置信区间。从 i
1
在实际中常会遇到比较多个总体均值是否相 等的问题。 例如某工厂的原料来自四个不同地区, 那么用不同地区的原料生产的产品的质 量是否一致?
再如某工厂有三个联营厂,生产同一产 品,生产工艺也相同,那么这几个联营厂 的产品质量是否一致?
3
下面用一个例子来说明问题的提法。
例6.1.1 国民计算机公司(NCP)在亚 特兰大、达拉斯以及西雅图的工厂生产计 算机与传真机。为确定这些工厂中有多少 员工了解全面质量管理,从每个工厂选取 了一个由6名员工组成的随机样本,并对他 们进行质量意识考试。18名员工的考分列 在下表中。管理者想用这些数据来检验假 设:三个工厂的平均考分相同。
16
二、平方和分解
r mi
ST
相关主题