方差分析(包括三因素)讲解
2、CLASS 变量表;
CLASS必须的MODEL之前。
3、MODEL 因变量表=效应;
输出因变量均数,对主效应均数间的检
4、MEANS 效应[/选择项];
验。
5、ALPHA=p 显著性水平(缺省值为0.05)
是指因变量与自变量效应,模型如下:
1、主效应模型 MODEL y=a b c; (a b c是主效应,y是因变量)
计判断,得出结论。
5
方差分析的基本思想:把全部数据关于总均值的离差平方和 分解成几部分,每一部分表示某因素诸水平交互作用所产生 的效应,将各部分均方与误差均方相比较,从而确认或否认 某些因素或交互作用的重要性。
用公式概括为:
各因素引起
由个体差异 引起(误差)
总变异=组间变异+组内变异
种类:常用方差分析法有以下4种 1、完全随机设计资料的方差分析(单因素方差分析) 2、随机区组设计资料的方差分析(二因素方差分析) 3、拉丁方设计资料的方差分析(三因素方差分析) 4、R*C析因设计资料的方差分析(有交互因素方差分析)
3
第一节 概述
因素(因子)—— 可以控制的试验条件 因素的水平 —— 因素所处的状态或等级 单(双)因素方差分析——讨论一个(两个) 因素对试验结果有没有显著影响。
4
例如:某厂对某种晴棉漂白工艺中酸液浓度(g/k)进 行试验,以观察酸液浓度对汗布冲击强力有无显著影 响。
冲击强力 序号
1
浓度
2 3 4 56
计算出F值:
QA
4217.3
(3 1) 2 28.38
QE
1114.7
(3(6 1))
5
15
列表:
方差来源 因素A 试验误差 总误差
离差平方和 4217.3 1114.7 5332
自由度 2 15 17
F值 28.38
F0.05 F0.01 显著性 3.68 6.38 **(十分显著)
17-)22
-2 5 1 -11
5 6 Ti
1 -20 -80 14 7 14
6
X
'2 i
j 1
1454 396
A3
20 31 19 12 35 27 144 3820
由表中数据可算出 3 6
X '2 ij
5670
i1 j 1
36
3
T
X
' ij
Ti 78
i1 j 1
(m 1)(l 1)
QB
1 m
l j 1
T.
2 j
T2 ml
3)给定显著水平 ,查表得临界值 F (m 1, (m 1)(l 1)) QE Q QA QB
4)由样本观察值计算FA、FB
5)若 FA F (m 1, (,1)(l 1)) 时,接受H0,因素的影响不显著。 若 FA F (m 1, (,1)(l 1)) 时,拒绝H0。 对因素B同理说明。
离差平方和 QA QE Q
自由度 m-1 m(n-1) mn-1
F值
QA
F
(m 1) QE
[m(n 1) ]
F0.05 F0.01
显著性
13
例:前例题 1、对数据的简化 得下表:
X
' ij
10( X ij
17)
冲击强力 浓度
A1 A2
序号
12 3 4
-8
-19X
' ij
1-01(2X ij
做法:为了检验假设H0,要从总的误差中将系统误差和随机误差分开。
8
二、离差平方和的分解与显著检验
记:
1 n
Xi
n
X ij
j 1
X
1 mn
m i 1
n
X ij
j 1
将Q进行分解:
mn
Q ( Xij X )2 i1 j1
m n
Q
( X ij X i ) ( X i X ) 2
棉布
2.33 2.00 2.93 2.73 2.33
12
同样可推出:
QE
m i 1
n j 1
X
2 ij
1 n
m
Ti 2
i 1
QA
1 n
m
Ti 2
i 1
T2 mn
2、数据的简化: 试验数据经过变换
X
' ij
b( Xij
a)
数据简化后对F值的计算没有影响,不会影响检验的结果 四、方差分析表
方差来源 因素A 试验误差 总误差
说明: F F (2,15) ,说明酸液浓度对汗布冲击强力有十分显著的影响。
16
五、各水平下试验次数不等时的方差分析 设第 i个水平试验次数为ni, 则有
式中:
m
n ni
i 1
Q
m i 1
ni
( X ij X )2
j 1
m i 1
ni j 1
X
2 ij
试验结果 Bj
Ai A1(280’C)
B1(1210‘C)B2(1235’C)B3(1250‘C)
64
66
68
A2(300‘C)
66
68
67
A3(320’C) 65
67
68
假设:美中不足组合水平下服从正态分布、互相独立、方差相等。 所需要解决的问题是:所有Xij的均值是否相等。
18
假设检验:
1)在假设H0成立的条件下。
T2 n
Ti
ni
Xij
j1
QE
m i1
ni
( X ij X i )2
j 1
m i1
ni
T 2 X ij n j 1
m2 i
i1 i
QA
m
ni ( Xi
i1
X )2
m
Ti2
i1 ni
T2 n
T
m
ni
X ij
i1 j1
QA
1 3
3
Ti.2
i 1
T2 33
1.56
QB
1 3
3
T.
2 j
j 1
T2 33
11.56
QE Q QA QB 3.1
FA F0.05 (2,4) A影响不显著。 F0.05 (2,4) FB F0.01(2,4) B影响显著,由于
高速钢洗刀的硬度越大越好,因此因素B可取B3水平,即淬火温度1250‘C为好,因素 A水平的确定,应考虑经济方便,取A1水平为好。
6
第二节 单因素方差分析
一、假设检验 设:A1、A2、A3、为三个总体X1、X2、X3,每个总体有6个样
本Xi1、Xi2、…、Xi6 ( i=1,2,3 )。 注:要判断酸液浓度的3种水平对汗布的冲击强力是否有显著影响,实 质上就是检验3种不同水平所对应的3个总体是否有显著差异的问题。即 检验3个总体数学期望是否相等。 以后就是求解问题,为了说明一般解的公式(方法),如下作一般分析。
i 1
3
Ti2 27332
i 1
14
计算
QE
3 i 1
6 j 1
X '2 ij
1 6
3 i 1
Ti 2
5670
1 6
27332
1114 .7
QA
1 6
3 i 1
Ti 2
T2 36
1 6
27332
6084 18
4217 .3
Q QE QA 1114 .7 4217 .3 5332
(2)统计量: QA
2
F (m 1) F (m 1, m(n 1)) QE
2
m(n 1)
QA
即:
F (m 1) F (m 1, m(n 1)) QE
[m(n 1)]
11
(3)给定显著性水平 ,查表得临界值 F (m 1, m(n 1))
(4)由样本观察值计算出F (5)若F > F (m 1, m(n 1)) ,则拒绝H0。 (说明因素A各水平间有显著性差异)
19
方差分析表:
方差来源 因素A 因素B 试验误差 总误差
离差平方和 自由度
1.56
2
11.56
2
3.1
4
16.22
8
F值 FA=1.01 FB=7.46
F0.05(2,4) F0.01(2,4) 显著性
6.94
18.0
6.94
18.0
*
3
Q
i 1
3 j 1
X
2 ij
T2 33
16.22
20
SAS系统中区分两种情况: 1、每组观测数据相等,可用ANOVA过程处理 以上四种情形的方差分析。 2、若每组观测数据不相等,可用GLM过程处 理以上四种情形的方差分析。
21
均衡数据的方差分析(ANOVA过程)
过程说明:
可以是数值型和字符 型
1、PROC ANOVA;
CLASS和MODEL是必需的,
方差分析
1
日常生活中经常发现,影 响一个事物的因素很多, 希望找到影响最显著的因 素
如某种农作物的收获量受作物品种、 肥料种类及数量等的影响;选择不同 的品种、肥料种类及数量进行试验,