单因素方差分析.ppt
SA和 SE 的统计特征
定理: 在单因素方差分析的模型下,
(1) S E ~ χ(2 n s) σ2
(2)SA 和 SE 相互独立。
(3) H 0:μ1 μ2 μs 为真时,
S A ~ χ(2 s 1), σ2
ST σ2
~
χ(2 n 1)
由定理(1),有
E( S E ) n s, σ2
98
样本 和 184 498 267
样本 均值 46 83 89
n1 4,n2 6,n3 3,
n 13
s
T T j 949
j 1
s nj
x
2 ij
75721
j1 i1
ST
s nj
x
2 ij
j1 i1
1 n
T2
6444
S A
误差(组内)平方和:
说明:
s nj
SE
( X ij X j )2
j1 i1
SE 表示在每个水平下的样本值与该水平下的样本 均值的差异,它是由随机误差引起的,所以,称SE是 误差(组内)平方和.
平方和分解公式: ST S A SE
证明:ST
s
nj
( X ij X )2
临界值
因子A
SA
随机误差 SE
总和
ST
s-1 SA/s-1 S A /(s 1) Fα (s 1, n s) n-s SE/ n-s S E /(n s)
n-1
(5)检验,若
S A /(s 1) S E /(n s)
Fα (s 1, n
s),则拒绝H0,
否则接受H0 ,认为因子A对指标没有显著影响.
(X j X ) 2
j1 i1
j1 i1
s nj
2
( X ij X j()X j X )
j1 i1
又
s nj
( X ij X j()X j X )
j1 i1
s
nj
[(X j X ) ( X ij X j )]
问各个工作日对顾客人数有无显著影响?
工作日
顾客人数
周一 86 96 78 66 100
周二 77 102 54 98
周三 69 91 86 74 82 78 84
周四 78 77 90 84 72 74
周五 84 88 94 102 96
在此实例中, 指标: 顾客人数;
因子: 工作日;
水平: 周一、周二、周一、周四、周五
1)每个部分总体都服从正态分布,即:
Aj
~
N
(
μ
j
,
σ
2 j
),
j 1,2,, s
2)部分总体的方差都相等,即:
σ 12
σ
2 2
σ
2 s
σ2
3)不同的部分总体下的样本是相互独立的。
其中 μ1 , μ2 ,, μs 和 σ 2 都是未知参数。
在水平Aj下进行nj次独立试验,得样本 X1 j,X2 j,,Xnj j, 则 Xij ~ N( μ j ,σ 2 ),
单因素方差分析的假设检验:
(1)提出统计假设 H 0:μ1 μ2 μs
H 1:μ1,μ2,,μs 不全相等. (2)取假设统计量 F S A /(s 1)
S E /(n s)
(3)拒绝域: W {F Fα (s 1, n s)}
说明:如果组间差异比组内差异大得多,则说明 各水平间有显著差异,H0不真。
F值
临界值
9.9167 F0.01 (2,10) 7.56
因为 f 9.9167 7.56, 所以拒绝H0,
认为三个工厂所生产的电池的平均寿命有显著差异.
四、部分总体均值μj 和方差σ2的估计
前面已说明:
(1)σˆ 2 SE 是σ 2的无偏估计. n s
又
E(X j)
1 nj
未知.
对每个水平Aj下的样本 X1 j,X2 j,,Xnj j,引进统计量:
样本和:
nj
T j X ij , i 1
样本均值:
1 nj
Xj
nj
X ij
i 1
1 n j T j
样本总均值:
X
1 n
s j 1
nj i 1
X ij
1 n
s
nj Xj
j1
s
T T j 835.4, j 1
s nj
x
2 ij
66308.12
j1 i1
ST
s j 1
nj i 1
x
2 ij
1 n
T2
2863.2873
S A
s1 j1 n j
T2j
1 n
T2
1 252.62 1 3612 1 118.62 1 103.22 1 835.42
将单因素试验的数据列表如下:
单因素试验数据表
部分总体
样 本 值
样本和T.j
样本均值 x j
A1 x11 x21
···
xn11 T.1
x1
A2 … x12 … x22 … ··· … xn22 … T.2 …
x2 …
As x1s x2s
· · ·
xnss T.s
xs
单因素方差分析的任务: 根据样本提供的信息,
nj
E(X ij)
i 1
μj,
所以
(2)X j是μ j的无偏估计,j 1,2,, s
可以证明,对于每个j, X j也是μ j的最小二乘估计.
例2. 试验4种不同的农药,观察它们的杀虫率有无明显
的不同,试验结果如下表所示:
部分总体
A1
A2
样
87.4
90.5
本
85.0
88.5
值
80.2
例1. 在显著性水平α=0.01下,用单因素方差分析法判断
实例1中,三个工厂所生产的电池的平均寿命有无显著 差异?
解:提出统计假设
H 0:μ1 μ2 μ3
H 1:μ1,μ2,μ3 不全相等.
编制单因素试验数据表
部分 总体
A1
A2 A3
37 60 69
样 47 本 40 值 60
86 100 67 98 92 95
在此试验中,除生产电池的工厂这一因子外,其 它因子不变,这是一个单因素试验。
试验的目的是为了考察不同厂家生产的电池平均 寿命是否有显著差异。如果有显著差异,表明生产工 厂这一因子对电池寿命的影响是显著的.
实例2. 为了比较各个工作日进入某一商场的顾客人数,
测得各工作日下午4时~5时进入商场的顾客人数如下表,
s j 1
1 nj
T2j
1 n
T2
1 1842 1 4982 1 2672 1 9492
4
6
3பைடு நூலகம்
13
4284
SE ST S A 6444 4284 2160
单因素方差分析表
方差来源 平方和 自由度 均方
因子A 4284 2 2142
随机误差 2160 10 216 总和 6444 12
记 εij X ij μ j ,称其为随机误差,则 εij ~ N(0,σ 2 )
由此得:
单因素方差分析的数学模型:
xij μ j εij
ε ij
~
N (0, σ 2 )
i 1,2,, n j j 1,2,, s
各个随机误差 ε ij 相互独立,μ1 , μ2 ,, μs 和 σ 2
j 1
i 1
s
nj
1 nj
[(X j
j 1
X)
( X ij
i 1
nj
X ij )]
i 1
s
[( X j
j 1
X
)
nj
X ij
i 1
1 nj nj
nj
X
ij
i 1
0
所以 ST S A SE
即:
总平方和=效应(组间)平方和+误差(组内)平方和
87.3
94.7
A3
A4
56.2
55.0
62.4
48.2
1)在显著性水平α=0.01下,问4种农药的杀虫率的均
值是否有明显不同?2)分别求4种不同农药的杀虫
率的均值和方差的估计值。
解:(1)提出统计假设 H 0:μ1 μ2 μ3 μ4 H 1:μ1,μ2,μ3,μ4 不全相等.
编制单因素试验数据表
单因素方差分析的假设检验的步骤:
(1)提出统计假设 H 0:μ1 μ2 μs
H 1:μ1,μ2,,μs 不全相等.
(2)编制单因素试验数据表
s nj
(3)根据数据表计算 T ,
x
2 ij
,
ST
,
S
A
,
S
E
j1 i1
(4)填制单因素方差分析表
单因素方差分析表
方差来源 平方和 自由度 均方 F值
实例1. 对某种型号的电池进行抽查,随机抽取了来自
A,B,C三个工厂的产品,测得其寿命(h )见下表,设各