当前位置:文档之家› 方差分析培训教材

方差分析培训教材


方差来源 平方和 自由度 均方
F比
因素A 0.00105333 2 0.00052661 32.92
误差 0.000192
12 0.000016
总和 0.00124533
14
因 F0.05 (2,12) 3.89 32.92,故在水平0.05下拒绝 H 0 ,认为各台机器生产的薄板厚度有显著差异。
即有
(21)
例4 如上所述,在例1中需检验假设
H0 : 1 2 3 , H1 : 1, 2 , 3 不全相等。 试取 0.05,完成这一假设。
解 现在 s 3, n1 n2 n3 5, n 15,
ST
3 j 1
5 i 1
xi2j
T..2 15
0.963912 (3.8)2 /15 0.00124533
xn1 1
xn2 2

xns s
T. 1
T. 2

T. s
x.1
x.2
...
x.s
1
2
...
s
我们假定:各个水平Aj (j=1,2,…,s)下的样本x1j , A2j , … , Anj j 来自具有相同方差s2,均值分别为j(j=1,2,…,s)的正态 总体N (j,s2) , j与s2未知。且设不同水平Aj 下的样本之间 相互独立。
(11)
i1
i1
nj
注意到 (xij x. j )2是总体N ( j ,s 2 )的样本方差
i 1
nj
的n j 1倍,故有 (xij x. j )2 / s 2 ~ 2 (n j 1).
i 1
因各xij独立,故(11)式中各平方和独立,由 2
分布的可加性知
S E / s 2
~ 2
试验指标:在试验中要考察的指标称为试验指标。 因素:影响试验指标的条件称为因素。
可控因素: 如,反应温度,原料剂量,浓度。 不可控因素:如,测量误差,气象条件等。 水平:因素所处状态称为因素的水平。 单因素试验:试验中只有一项因素在改变称为单因素 试验。否则就称多因素试验。
例1 设有三台机器,用来生产规模相同的铝合金薄板,
j 1
(1) '
ij ~ N (0,s 2 ), 各 ij 独立
而假设(2)等价假设
H0 : 1 = 2 = … = s = 0
(2)’
H1 : 1 , 2 , … , s 不全为零。
这是因为当且仅当1 = 2 = … = s 时, j = ,即 j =0.
三 平方和的分解
引入总平方和
s nj
s2
由此得检验问题(2) 的拒绝域为
F
SA SE
/( s /(n
1) s)
F
(s
1, n
s)
(20)
单因素试验方差分析
总和
ST
自由度 均方 F 比
s-1
SA
SA s 1
F SA SE
n-s
SE
SE ns
n-1
在实际中,可用下面的简便公式计算。
nj
s nj
x
.j
x.k
t / 2 (n
s)
S
E
1 nj
1 nk
.
(22)
例5 求例4中的未知参数s2, j, j(j=1,2,3)的点估计及均值 差的置信度为0.95的置信区间。
sˆ 2 SE /(n s) 0.000016, ˆ1 x1 0.242,
ˆ 2 x2 0.256, ˆ3 x3 0.262, ˆ x 0.253, ˆ1 x1 x 0.011, ˆ2 x2 x 0.003, ˆ3 x3 x 0.009.
(0.242 0.262 0.006) (0.026,0.014),
(0.256 0.262 0.006) (0.012, 0).
例6 设在例2中的四种类型电路的响应时间的总体均 为正态且各总体的方差相同。又设各样本相互独立。试取 水平0.05,检验各个类型电路的响应时间是否有显著差异。
由于 xij ~ N ( j ,s 2), 即有 x ij j ~ N (0,s 2 ), 故xij j可以看成随机误差. 记xij j ij ,则xij可写成
xij j ij , i 1,2, ... , n j ; j 1,2, ... ,s,
ij ~ N (0,s 2 ), 各 ij 独立,
记 T.j xij , j 1,2,..., s,T..
xij
i 1
j1 i1
ST
s nj
xi2j nx 2
j1 i1
s j 1
nj i 1
xi2j
T..2 n
,
S A
s
n j x.2j
j1
nx 2
T s 2 .j
n j1 j
T..2 n
,
SE ST SA.
s
(n j 1) ,
j1

S E / s 2 ~ 2 (n s),
(12)
s
这里 n n j .由(12)式还知,SE的自由度为 j 1
n s,且有
E(SE ) (n s)s 2 .
(13)
我们研究S A的统计特性,因S A是s个变量
n j (x. j x() j 1,2,..., s)的平方和,它们之间仅有
j1 i1
j 1
i 1
s
nj
2 (x. j x)( xij n j x. j ) 0 .
j 1
i 1
于是我们将ST分解成为:
ST SE SA ,
(8)
s nj
其中
SE
( xij x. j ) 2
(9)
j 1 i1
s nj
s
s
SA
(x. j x)2 n j (x. j x)2 n j x.2j nx 2 (10)
取样测量薄板至千分之一厘米,得结果如下表所示;
机器1
机器2
机器3
0.236
0.257
0.258
0.238
0.258
0.264
0.248
0.255
0.259
0.245
0.254
0.267
0.243
0.261
0.262
x = 0.242
x = 0.256
x = 0.262
这里,试验指标是薄板的厚度。机器为因素,不同 的三台机器是这个因素的三个不同的水平。试验的目的是 为了考察各台机器所生产的薄板的厚度有无显著差异。
五、 未知参数的估计
我们已经知道,不管H0是否为真
sˆ 2 S E
ns
是s 2的无偏估计。又由(14), (7)式知
E(x) ,
1 E(x.j ) n
nj
E(xij ) j ,
i 1
j 1,2,...,s.

ˆ x,
ˆ j x. j
分别是,
的无偏估计。
j
又若拒绝H0 ,则效应1, 2 ,..., s不全为零,由于 j j , j 1,2,..., s
(16)
四、假设检验问题的拒绝域
由(15)式知,当H
为真时
0
E( SA ) s 2 ,
s 1
而当H
为真时,
1
n s
2
j1 j j
0,此时
E( SA ) s 1
s2
1 s -1
s j1
n j
2 j
s2
又由(13)式知,
E( SE ) s 2 ,
ns
(17) (18) (19)
即不管H 0是否为真,S E /(n s)都是s 2的偏估计。
二 单因素试验
在例 1 中,我们在因素的每一个水平下进行了独立试
验,其结果是一个随机变量。表中的数据可看成来自三个 不同总体的样本值。将各个总体的均值依次记作1 , 2 , 3,按题意需检验假设
H0 : 1 = 2 = 3 H1 : 1 , 2 , 3 不全相等。 现在若假设各总体均为正态变量,且各总体的方差相等,

1 n
s
nj j
j 1
(3)
s
其中 n n j , 称为总平均。再引入
j 1
j j , j 1,2, ... ,s,
(4)
此时有 n11
n2 2
... ns s
0,
j称水平A
的效应。
j
利用这些记号,模型(1)可改写成
xij j ij , s
n j j 0, i 1,2,..., n j , j 1,2,..., s .
那么这是一个检验同方差的多个正态总体均值是否相等的
问题。
设因素A有s个水平A1 , A2 , … , As, 在水平Aj (j=1,2, …s) 下,进行了nj (nj2) 次独立试验,得到如下表的结果
表9.4
水平
观察值
A1
A2

As
x11
x12

x1s
x21
x22

x2s




样本总和 样本均值 总体均值

ˆ j x. j x

的无偏估计。
j
当拒绝H0时,常需作出两总体N ( j ,s 2 )和
N (k ,s 2 )的均值差 j
k
j
的估计。可证
k
(x.j x.k ) ( j k ) ~ t(n s).
S
E
1 nj
1 nk
据此,可得均值 j k j k的置信度为1
的置信区间为
ST
(xij x)2
相关主题