常用的实验设计方法(四)多因素多水平的实验设计,当所需的实验次数较多或因实验条件所限,而无法承受,且已知因素之间的复杂交互作用(高阶交互)可忽略不计时,通常可以用正交设计取代析因设计,以达到减少实验次数的目的。
⑴ 正交实验设计:是一种高效的多因素实验的设计,它是利用一系列规格化的正交表将各实验因素、各水平之间的组合均匀搭配,合理安排,大大减少实验次数,并提供较多的信息。
⑵ 正交表(orthogonal layout):经过严格的数学推导编制出来的。
正交表上的每一行代表各实验因素水平的一种组合,称为一个试验点,正交表的每一列代表一种实验效应,它可能代表某实验因素或交互作用或实验误差的效应,试具体安排而定。
正交表中用符号表示设计的类型。
例如:)2(34L ,符号L 表示正交表,L 的下标表示实验次数,括号内的底数是因素的水平数,指数是因素的个数(即列数或最多可以安排的因素的个数)。
)2(34L :最多可安排3个因素,每个因素均为2水平,作4次实验的正交表。
)2(78L :最多可安排7个因素,每个因素均为2水平,作8次实验的正交表。
)3(49L :?例如:)2(34L每行表示一个实验,列表示安排的因素。
表中的1、2表示各因素的水平,每列(因素)的各水平出现的次数相等,任两列的同一横行中出现的有序数对(1,1)(1,2)、(2,1),(2,2)次数相同。
具有均衡性和正交性。
⑶ 交互作用表:每个正交表均有对应的交互作用表。
通过交互作用表可安排因素或交互作用或误差。
)2(34L 交互作用表显示若第一列安排因素,第二列安排因素,则两因素的交互作用安排在第3列上。
再比如:)2(78L 正交表⑷ 正交设计类型:根据正交表可以分为:同水平的正交表和混合水平的正交表。
常用的同水平的正交表:2水平正交表:)2(34L 、)2(78L 、)2(1516L 、)2(3132L 等 3水平正交表:)3(49L 、)3(1327L 、)3(4081L 等4水平正交表:)4(516L 、)4(2164L 等根据各实验方案是否进行重复实验分为无重复的正交设计和有重复的正交设计。
◆ 多因素设计,部分组合试验,减少试验次数 ◆ 均匀性、正交性、整齐可比性由正交表挑出来的试验点在空间具有“均匀分散性”。
所谓均匀分散性,就是试验点在空间分布得很均匀,无论从哪个角度看,都是有代表性的试验点被挑出来了,这个性质,主要是由正交表中水平的排列规律决定的,这种规律叫“正交性”。
◆ 可以分析各因素的主效应和一级交互效应(有限的) ◆ 寻找较佳试验方案某些好的未包括在正交表中的试验点,可以通过统计分析将其发现。
根据实验研究的需要,选用合适的正交表,将各个因素以及需要考察的交互作用项安排在正交表各列的过程。
称为表头设计。
① 根据因素个数、水平数合理安排主效应和因素之间的交互作用② 考虑对正交试验数据作方差分析时误差的计算途径:从空列获得或者由重复实验获得。
表头设计就是选取合适正交表和交互作用表,使每列最好只安排一个因素或一个交互作用,避免效应混杂,并留出空列或者作重复实验以获得对误差的估计,一般只要求一阶交互作用。
① 一般都是先确定试验的因素、水平和交互作用,后选择适用的L 表。
② 确定水平数在确定因素的水平数时,主要因素宜多安排几个水平,次要因素可少安排几个水平。
若各因素全是2水平,就选用L(2*)表;若各因素全是3水平,就选L(3*)表。
若各因素的水平数不相同,就选择适用的混合水平表。
③ 确定交互作用每一个交互作用在正交表中应占一列或二列。
所选的正交表是否足够大,能否容纳得下所考虑的因素和交互作用。
要有空列作为“误差”列或者重复试验④ 试验精度的要求若精度要求高,则宜取实验次数多的L 表。
若试验费用很昂贵,或试验的经费很有限,或人力和时间都比较紧张,则不宜选实验次数太多的L 表。
⑤ 若无正好适用的正交表可选,简便且可行的办法是适当修改原定的水平数。
⑥ 对某因素或某交互作用的影响是否确实存在没有把握的情况若条件许可,应尽量选用大表,让影响存在的可能性较大的因素和交互作用各占适当的列。
某因素或某交互作用的影响是否真的存在,留到方差分析进行统计检验时再做结论。
这样既可以减少试验的工作量,又不致于漏掉重要的信息。
例1 以大白鼠作实验。
观察指标:细胞色素b5(nmol/mg),目的:了解正氟醚的作用;了解生理盐水和戊巴比妥作诱导药物对正氟醚的毒性作用有何影响;不同诱导剂对不同性别大白鼠的作用有何不同。
研究因素有三个,每个均为2水平。
具体为:因素A(诱导剂) a1—生理盐水; a2——戊巴比妥 因素B(正氟醚) b1——不用; b2——用 因素C(大白鼠性别) c1——雄性 ; c2——雌性研究需了解A 、B 、C 的主效应; AB 交互作用;AC 的交互作用。
问题:能否选用)2(34L 正交表?能否选用)2(78L 正交表?据表头设计安排8次实验,8次实验各因素水平分别为:试验号ABC1 1 1 12 1 1 23 1 2 14 1 2 25 2 1 16 2 1 27 2 2 18 2 2 2最好采用随机化的方法确定实验次序,进行试验并记录相关观测效应指标的结果。
第一步需结合专业知识、文献资料和必要的预试验提供的信息,确定需要重点考察的试验因素及交互作用项,确定因素的变化范围以及因素的水平数。
第二步根据问题实际,选择合适的正交表,并进行表头设计,将正交表中的“编码水平”换成实际试验中的“真实水平”,从而编制出正交设计的试验方案。
需要把握以下两条设计原则:①根据因素个数、水平数合理安排主效应和因素之间的交互作用;正交表选定以后,即可进行表头设计,应遵照不混杂的原则,即不同的因素(包括交互作用)不能占用相同的列。
在作表头设计时,为了避免混杂,应先安排有交互作用的因子。
②设计时须考虑对正交试验数据作方差分析时误差的计算途径:从空白列获得或由重复试验提供的数据中获得。
确定表头设计以后,还要决定是否要作重复试验。
如果分析试验结果时要作方差分析并且表头设计中已无空白列,则必须要做重复试验。
第三步随机化保证研究对象的同质性,严格控制每次试验条件一致;因素水平表水平的排列的随机化;随机化的方法确定试验的次序。
第四步对数据进行统计分析定量资料:极差法、正交设计的方差分析,可探求最优试验组合条件。
例2 在乙酰苯胺磺化工艺研究中,有4各因素:反应温度A、反应时间B、硫磺浓度C、操作方法D,各取两个水平,实验结果为产物的“收率%”,目的:需求使收率%最高的实验条件。
已知反应温度和反应时间存在交互作用,各实验条件下不必进行重复实验,希望总试验次数尽可能少,试问:该如何设计?研究条件水平1 水平2反应温度A(℃) 50 70反应时间B(h) 1 2硫磺浓度C(%) 17 27操作方法D 搅拌不搅拌分析:考虑A、B、C、D主效应各因素各占一列(4列),A×B交互效应(1列),至少为5列。
表头设计安排实验及结果实验号反应温度A(℃) 反应时间B(h) 硫磺浓度C(%) 操作方法D 收率%1 50 1 17 搅拌652 50 1 27 不搅拌743 50 2 17 不搅拌714 50 2 27 搅拌735 70 1 17 不搅拌706 70 1 27 搅拌737 70 2 17 搅拌628 70 2 27 不搅拌67例 3 在设计帕珠沙星合成试验研究时,根据试验条件,重点考察反应时间(A)、反应温度(B)、次氯酸钠的浓度(C)、次氯酸钠的用量(D)4个影响收率的重要因素,每个因素3个水平,具体表达如下表:如何进行设计?分析:4因素,每个因素均为3水平,主效应各占一列(4列)①极差法各因素所占列中各水平对应的效应指标平均值的最大值与最小值之差。
极差最大,表示因素的效应越大,为主要影响因素,但为主观法未进行统计推断。
②采用正交设计的方差分析总变异的划分,根据确定的因素主效应和交互效应而划分。
例5:例1中的正氟醚对细胞色素b5的影响(教材51页),结果见下表极差法(直观):A=0.53 B=1.97 C=0.13①数据录入格式:( data3.xls/正交设计5)实验号 A B C 细胞色素b51 1 1 1 0.662 1 1 2 0.233 1 2 1 0.114 1 2 2 0.135 2 1 1 0.646 2 1 2 0.957 2 2 1 0.158 2 2 2 0.12②统计分析方差分析需分析A、B、C主效应,A×B、A×C交互效应可见,极差法显示B 因素的效应最强,正交设计的方差分析结果显示各因素的主效应和交互效应的差异均无统计学意义。
例6:教材54页,研究正氟醚对大白鼠肝重的影响,结果见下表:需分析交互作用AB 、BC 和AC 的交互影响。
① 数据录入格式 ( data3.xls/正交设计6)实验号 A B C 肝体重比 1 1 1 1 5 2 1 1 2 5.26 3 1 2 1 6.3 4 1 2 2 5.42 5 2 1 1 6.13 6 2 1 2 5.87 7 2 2 1 6.02 8 2 2 2 4.64 1 1 1 1 5.52 2 1 1 2 5.68 3 1217.024 1 2 2 5.65 2 1 1 6.466 2 1 2 5.57 2 2 1 5.78 2 2 2 4.61 1 1 1 5.382 1 1 2 5.833 1 2 1 5.94 1 2 2 5.75 2 1 1 5.216 2 1 2 6.27 2 2 1 5.488 2 2 2 5.44②统计分析方差分析需分析A、B、C主效应,A×B、A×C、B×C交互效应结果:主效应C(性别)及交互作用AB 和BC 对鼠肝重影响具有统计学意义,且A1B2C1肝重最大(生理盐水、用正氟醚、雄性大白鼠),A2B2C2(戊己比托、用正氟醚、雌性)最小。
请注意:此例题实际上已经为析因设计了,达不到正交设计的目的。
例7:教材57页,无重复的三水平正交实验:无任何交互作用数据见 data3.xls/正交设计7请说明:正交表的选择、数据的录入及统计学分析并解释结果。
例8:教材58页,有重复的三水平正交实验:各因素间无交互作用数据见data3.xls/正交设计8问题:正交表的选择?为何进行重复?数据的录入?及统计学分析并解释结果。
均匀设计是基于数论方法(或伪蒙特卡罗方法)推导出来的一种试验设计方法。
它是只考虑试验点在试验范围内均匀散布的一种试验方法,它借助于均匀设计表安排试验。
均匀设计(均匀设计表)的特点:◆每列中每个数字只出现一次且任意两列同行数字构成的数对各不相同;◆均匀设计保留并进一步增强了正交设计试验点在空间具有均匀分散性的优点,但这是以牺牲“试验点在数学上的正交性”为代价的;◆均匀设计因丧失了“部分正交性”而不具有试验点在统计分析时的整齐可比性,所以均匀设计定量资料不能像正交设计那样可以采用相应的方差分析处理资料,而需要借助多重回归分析的方法来分析数据。