当前位置：文档之家› 方差分析培训教材

方差分析培训教材

方差来源平方和自由度均方
F比
因素A 0.00105333 2 0.00052661 32.92
误差 0.000192
12 0.000016
总和 0.00124533
14
因 F0.05 (2,12) 3.89 32.92,故在水平0.05下拒绝 H 0 ,认为各台机器生产的薄板厚度有显著差异。
即有
(21)
例4 如上所述，在例1中需检验假设
H0 : 1 2 3 , H1 : 1, 2 , 3 不全相等。试取 0.05，完成这一假设。
解现在 s 3, n1 n2 n3 5, n 15,
ST
3 j 1
5 i 1
xi2j
T..2 15
0.963912 (3.8)2 /15 0.00124533
xn1 1
xn2 2
…
xns s
T. 1
T. 2
…
T. s
x.1
x.2
...
x.s
1
2
...
s
我们假定：各个水平Aj (j=1,2,…,s)下的样本x1j , A2j , … , Anj j 来自具有相同方差s2，均值分别为j(j=1,2,…,s)的正态总体N (j,s2) , j与s2未知。且设不同水平Aj 下的样本之间相互独立。
(11)
i1
i1
nj
注意到 (xij x. j )2是总体N ( j ,s 2 )的样本方差
i 1
nj
的n j 1倍,故有 (xij x. j )2 / s 2 ~ 2 (n j 1).
i 1
因各xij独立，故（11）式中各平方和独立，由 2
分布的可加性知
S E / s 2
~ 2
试验指标：在试验中要考察的指标称为试验指标。因素：影响试验指标的条件称为因素。
可控因素：如，反应温度，原料剂量，浓度。不可控因素：如，测量误差，气象条件等。水平：因素所处状态称为因素的水平。单因素试验：试验中只有一项因素在改变称为单因素试验。否则就称多因素试验。
例1 设有三台机器，用来生产规模相同的铝合金薄板,
j 1
(1) '
ij ~ N (0,s 2 ), 各 ij 独立
而假设（2）等价假设
H0 ： 1 = 2 = … = s = 0
(2)’
H1 ： 1 , 2 , … , s 不全为零。
这是因为当且仅当1 = 2 = … = s 时, j = ,即 j =0.
三平方和的分解
引入总平方和
s nj
s2
由此得检验问题（2）的拒绝域为
F
SA SE
/( s /(n
1) s)
F
(s
1, n
s)
(20)
单因素试验方差分析
总和
ST
自由度均方 F 比
s-1
SA
SA s 1
F SA SE
n-s
SE
SE ns
n-1
在实际中，可用下面的简便公式计算。
nj
s nj
x
.j
x.k
t / 2 (n
s)
S
E
1 nj
1 nk
.
(22)
例5 求例4中的未知参数s2, j, j(j=1,2,3)的点估计及均值差的置信度为0.95的置信区间。
sˆ 2 SE /(n s) 0.000016, ˆ1 x1 0.242,
ˆ 2 x2 0.256, ˆ3 x3 0.262, ˆ x 0.253, ˆ1 x1 x 0.011, ˆ2 x2 x 0.003, ˆ3 x3 x 0.009.
(0.242 0.262 0.006) (0.026,0.014),
(0.256 0.262 0.006) (0.012, 0).
例6 设在例2中的四种类型电路的响应时间的总体均为正态且各总体的方差相同。又设各样本相互独立。试取水平0.05,检验各个类型电路的响应时间是否有显著差异。
由于 xij ~ N ( j ,s 2), 即有 x ij j ~ N (0,s 2 ), 故xij j可以看成随机误差. 记xij j ij ,则xij可写成
xij j ij , i 1,2, ... , n j ; j 1,2, ... ,s,
ij ~ N (0,s 2 ), 各 ij 独立，
记 T.j xij , j 1,2,..., s,T..
xij
i 1
j1 i1
ST
s nj
xi2j nx 2
j1 i1
s j 1
nj i 1
xi2j
T..2 n
,
S A
s
n j x.2j
j1
nx 2
T s 2 .j
n j1 j
T..2 n
,
SE ST SA.
s
(n j 1) ,
j1
即
S E / s 2 ~ 2 (n s),
(12)
s
这里 n n j .由(12)式还知，SE的自由度为 j 1
n s,且有
E(SE ) (n s)s 2 .
(13)
我们研究S A的统计特性，因S A是s个变量
n j (x. j x（) j 1,2,..., s)的平方和，它们之间仅有
j1 i1
j 1
i 1
s
nj
2 (x. j x)( xij n j x. j ) 0 .
j 1
i 1
于是我们将ST分解成为：
ST SE SA ,
(8)
s nj
其中
SE
( xij x. j ) 2
(9)
j 1 i1
s nj
s
s
SA
(x. j x)2 n j (x. j x)2 n j x.2j nx 2 (10)
取样测量薄板至千分之一厘米，得结果如下表所示；
机器1
机器2
机器3
0.236
0.257
0.258
0.238
0.258
0.264
0.248
0.255
0.259
0.245
0.254
0.267
0.243
0.261
0.262
x = 0.242
x = 0.256
x = 0.262
这里，试验指标是薄板的厚度。机器为因素，不同的三台机器是这个因素的三个不同的水平。试验的目的是为了考察各台机器所生产的薄板的厚度有无显著差异。
五、未知参数的估计
我们已经知道，不管H0是否为真
sˆ 2 S E
ns
是s 2的无偏估计。又由(14), (7)式知
E(x) ,
1 E(x.j ) n
nj
E(xij ) j ,
i 1
j 1,2,...,s.
故
ˆ x,
ˆ j x. j
分别是，
的无偏估计。
j
又若拒绝H0 ,则效应1, 2 ,..., s不全为零，由于 j j , j 1,2,..., s
(16)
四、假设检验问题的拒绝域
由（15）式知，当H
为真时
0
E( SA ) s 2 ,
s 1
而当H
为真时，
1
n s
2
j1 j j
0,此时
E( SA ) s 1
s2
1 s -1
s j1
n j
2 j
s2
又由（13）式知，
E( SE ) s 2 ,
ns
(17) (18) (19)
即不管H 0是否为真，S E /(n s)都是s 2的偏估计。
二单因素试验
在例 1 中，我们在因素的每一个水平下进行了独立试
验，其结果是一个随机变量。表中的数据可看成来自三个不同总体的样本值。将各个总体的均值依次记作1 , 2 , 3,按题意需检验假设
H0 ： 1 = 2 = 3 H1 ： 1 , 2 , 3 不全相等。现在若假设各总体均为正态变量，且各总体的方差相等，
记
1 n
s
nj j
j 1
(3)
s
其中 n n j , 称为总平均。再引入
j 1
j j , j 1,2, ... ,s,
(4)
此时有 n11
n2 2
... ns s
0,
j称水平A
的效应。
j
利用这些记号，模型（1）可改写成
xij j ij , s
n j j 0, i 1,2,..., n j , j 1,2,..., s .
那么这是一个检验同方差的多个正态总体均值是否相等的
问题。
设因素A有s个水平A1 , A2 , … , As, 在水平Aj (j=1,2, …s) 下，进行了nj (nj2) 次独立试验，得到如下表的结果
表9.4
水平
观察值
A1
A2
…
As
x11
x12
…
x1s
x21
x22
…
x2s
…
…
…
…
样本总和样本均值总体均值
知
ˆ j x. j x
是
的无偏估计。
j
当拒绝H0时，常需作出两总体N ( j ,s 2 )和
N (k ,s 2 )的均值差 j
k
j
的估计。可证
k
(x.j x.k ) ( j k ) ~ t(n s).
S
E
1 nj
1 nk
据此，可得均值 j k j k的置信度为1
的置信区间为
ST
(xij x)2

e商务文档

方差分析培训教材

相关文档推荐：