实验优化设计第4章方差分析
(4) 因素的主效应和因素间的交互效应 某因素单独对实验结果所产生的影响或作用,称该因 素的主效应。
因素间的交互作用是指除了因素“孤立地”影响实验 结果之外,还存在因素间不同水平互相搭配,联合在一 起共同对实验结果产生影响。这是在科学实验中常常遇 到的问题。
6
[例4-3] 有A、B两种药物治疗缺铁性贫血,患者12例,分为4组。实验方案是: 第一组用一般疗法;第二组在一般疗法基础上加用A药;第三组在一般疗法基 础上加用B药,第四组在一般疗法基础上A、B两药同时使用。一个月后观察红 细胞增加数。要求分析两种药物的疗效,数据见表4-3。
相 对 偏 差 平 方 和 偏 差 偏 平 差 方 平 和 方 自 和 由 度
12
随机变数的自由度是由数据个数n及数据所受的线性约束方程个数m所决定 的。这n个数据的平方和的自度为n-m。
① 总平方和ST的自由度 vT =N-1 =ar-1
② 因素A偏差平方和SA的自由度 vA=a-1
③ 误差平方和Se的自由度 ve=N-a=ar-a=a(r-1)
分组 第一组 (一般疗法) 第二组 (一般+A药) 第三组 (一般+B药)
1
2
3
平均值
0.8
0.9
0.7
0.8
1.3
1.2
1.1
1.2
0.9
1.1
1.0
1.0
第四组 (一般+A药+B药) 2.1
2.2
2.0
2.1
这种因素之间的相互作用即为交互效应。如果交互效应存在,说明两个因素不 是相互独立的。
把因素A和B的交互作用记为A×B。这里的符号“×”是交互 的记号,不要理解为乘号。两个因素的交互作用好象是在这 两个因素的单独作用之外,另有一个“假想因素”在起作用。
• 影响因素可分为可控因素和不可控因素。 • 实验温度、原料浓度等往往属于可控因素,它是实验研究的主要因素。 而大气温度、压强、湿度、风向等往往是不可控因素。
• 在判别介入的实验因素时,下列三种情况一般可以不作考察: • ①对实验指标的影响规律已经明确,或已知对实验考核指标没有影响 的因素; • ②实验时技术条件不具备,或测试技术不完善,测不出数值的因素; • ③虽能测出因素的值,但不具备控制手段,不能把因素控制在指定水 平上的因素。
9
我们的目标是要去检验各水平对实验有无影响并去估 计它们的影响程度。
检验假设: H0:m1=m2=…=ma H1:mi≠mj 至少有一对(i,j) 如果H0为真,则全体水平有公共均值m。 上述假设的一个等价假设是用水平效应ti表示,即 H0:t1=t2=…=ta=0 H1:ti≠0 至少有一个i
检验水平均值是否相等的恰当方法是方差分析。
4 方差分析
4.1 引言 4.1.1 问题的提出
如何比较不同实验条件下的实验结果?
先看一个简单的例子。 [例4-1] 为了考察三种催化剂对某一化工产品收率的影响,在其它条件不 变的情况下,每种催化剂重复实验4次,所得收率的数据见表4-1所示。
催化剂
1
2
3
4
平均值
甲
35.2
33.1
35.5
36.4 35.05
三个偏差平方和的自由度之间有如下的关系: vT= vA + ve
这也称自由度的可分解性。
13
若记总偏差相对平方和为VT,因素A相对偏差平方和 为VA,误差相对平方和为Ve,则它们分别为:
VT=ST / vT VA=SA / vA Ve=Se / ve VA、Ve可分别认为是因素A与误差e关于实验结果的平 均效应,并分别称它们为因素A均方差和误差均方差。 均方差也简称均方或方差。
4.2 方差分析的基本原理 4.2.1 固定效应模型的分析 (1) 问题的描述 以固定效应模型的单因素等重复实验为例,来说明方差 分析的基本原理。
8
表4-3 单因素等重复实验的典型数据
实验结果用线性统计模型来描述:
yij=m+ti+eij (i=1,2,…,a;j=1,2,…,r)
m是所有水平的共同参数,叫总均值,ti是第i个水平的唯一的一个参数, 叫做第i个水平的水平效应,eij是随机误差。
Ai称为因素A的第i种水平或第i种位级。 因素选定的不同取值的个数,称为该因素的水平数。
(3) 重复或重复数 在相同条件下进行2次及2次以上的实验,称重复实验或有重复实验。 重复是研究实验随机误差的基本手段。应在条件允许的情况下,尽可能
地采取重ห้องสมุดไป่ตู้实验,使样本容量足够地大,以保证实验与分析的可靠性。
5
在实验中影响结果的原因是很多的,一般情况下把直接和必然的原因作为 实验需要考察的因素。至于人们的操作技巧、检测仪表的精度等,并不直接 影响实验结果,而是产生误差的原因,除特殊情况外,一般不把它列为因素。
4
(2) 水平与水平数 因素在实验中所取的具体数值或状态,称为该因素的水平。水平也叫位级。 若某因素记为A,则因素A的a个不同水平可分别记做:A1、A2、…、Aa。
[例4-2] 某反应产物的收率受催化剂品种与反应温度的影响,现选取三种 催化剂(记做A1、A2、A3),四种不同的温度(记做B1、B2、B3、B4), 在催化剂与温度的12种不同的组合条件下,随机地进行实验。若记催化剂 为Ai和温度为Bj时的合成收率为xij,得表4-2所示的数据。
温度
催化剂
B1
B2
乙
31.5
36.6
34.2
34.8 34.30
丙
34.9
36.8
36.3
35.8 35.95
最终实验结果之间的差异可能源于催化剂的改变,也可能源于实验误差。
问题:① 实验结果的差异是催化剂的变化所引起的, 还是实验中的偶然误差引起的?如何鉴别?② 不同催 化剂对产品收率的影响是否显著?如何检验?
2
再看下面的一个例子。
10
(2) 偏差的构造
用偏差平方和来构造各偏差,
11
由各偏差平方和的构造可以看出,利用偏差平方和作 为数据变异性的一个度量,直观看来,这是合理的。但在 同样的波动程度下,测定数据越多,计算出的偏差平方和 就越大。因此,仅用偏差平方和来反映数据的各种变异显 然是不够的,还应当考虑测定值个数对偏差平方和的贡献, 这便是相对偏差平方和。
B3
B4
A1
x11
x12
x13
x14
A2
x21
x22
x23
x24
A3
x31
x32
x33
x34
问题:催化剂、温度以及实验中的各种偶然因 素的综合中,各因素的影响程度相对大小如何? 谁对实验结果产生了显著的影响?
3
4.1.2 几个基本概念
(1) 因素
所谓因素,是指直接影响实验结果而需要进行考察的原因,也即影响 实验结果的实验条件。