均匀设计方法简介在工农业生产和科学研究中,常须做试验,以获得予期目的:改进生产工艺,提高产品收率或质量,合成出某化合物等等。
怎样做试验,是大有学问的。
本世纪30年代,费歇(R.A.Fisher)在试验设计和统计分析方面做了一系列先驱工作,使试验设计成为统计科学的一个分支。
今天,试验设计理论更完善,试验设计应用更广泛。
本节着重介绍均匀设计方法。
一、试验设计对于一项试验,例如用微波加热法通过离子交换制备Cu13X分子筛。
我们可以13X分子筛、CuCl2为原料来制备,为寻找最佳条件,应如何设计这个试验呢?若我们已确定了微波加热功率(A)、交换时间(B)、交换液摩尔浓度(C)为三个影响因素,每个因素取五个不同值(即水平:A1,…,A5,B1,…,B5,C1,…,C5)。
有两种方法最易想到:1.全面试验:将每个因素的不同水平组合做同样数目的试验。
对上述示例,不计重复试验,共需做5×5×5=125次试验。
2.多次单因素试验:依次考查各因素(考查某因素时,其它因素固定)取最佳值。
容易知道,对上示例(不计重复试验)共需做3×5=15次试验。
该法在工程和科学试验中常被人们采用,可当考查的因素间有交互作用时,该法所得结论一般不真。
3.正交设计法:利用正交表来安排试验。
本世纪60年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,使正交试验设计得到更广泛的使用。
70年代以来,我国许多统计学家深入工厂、科研单位,与广大工程技术人员、工人一起,广泛开展正交设计的研究、应用,取得了大批成果。
该法是目前最流行,效果相当好的方法。
正交表记为:L n(q m),这里“L”表示正交表,“n”表总共要做的试验次数,“q”表每个因素都有q个水平,“m”表该表有4列,最多可安排m个因素。
常用的二水平正交表为L4(23),L8(27),L16(215),L32(231);三水平正交表有L9(34),L27(313);四水平正交表L16(45)及五水平正交表L25(56)等。
采用拟水平法,人们还得到一系列在实际中很有用的混合水平正交表,例如:L8(4×24),L12(23×31),L16(44×23)等,此处L16(44×23)表示要做16次试验,允许最多安排四个“4”水平因素,三个“2”水平因素。
在我们的示例中,可取L25(56)。
该正交表如下:6表1. L6十分明显,不计重复试验总共需做52=25次试验。
观察此表,可知有如下特点:1)每个因素的水平都重复了五次试验;2)每两个因素的水平组成了一个全面试验方案。
这两个特点反映了试验点在试验范围内排列规则整齐,人们称为“整齐可比”,另一方面,这些试验点在试验范围内散布均匀,人们称此特点为“均匀分散”。
正交设计的优点本质上来自“均匀分散,整齐可比”这两个特点。
4.均匀设计法1978年,我国七机部由于导弹设计的要求,提出了一个五因素的试验,希望每个因素的水平数要多于10,而试验次数又不超过50。
为了解决这一问题,我国数学家方开泰和王元教授经过几个月的共同研究,应用数论方法,舍弃正交设计的“整齐可比”性,创造了只考虑试验点在试验范围内的均匀散布的一种试验设计方法,即所谓“均匀设计”,很好地解决了七机部的导弹设计问题。
均匀设计可按均匀设计表及相应的使用表安排试验。
所谓均匀设计表是根据均匀设计理论得到的,类比正交设计表,记为U n (q m ),n 总试验次数,q 各因素的水平数,m 可能安排的因素数。
例如,我们前面提到的Cu13X 分子筛的制备问题,就可以用如下的U 5(54)表来安排。
4由该表我们可以看到:该法有其独特的布点方式,其特点有: 1) 每个因素的每个水平做一次且仅做一次试验; 2) 任两个因素的试验点点在平面的格子点上,每行每列有且仅有一个试验点; 3) 均匀设计表任两列组成的试验方案一般并不等价。
此点要求每个均匀设计表必须有一个附加的使用表; 4) 当因素的水平数增加时,试验数按水平数的增加量在增加。
二、 均匀设计表的构造均匀设计表是一个方阵。
设方阵有n 行m 列,每一行是{1,2,···,n }的一个置换(即1,2,···,n 的重新排列),表的第一行是{1,2,···,n }的一个子集,但不一定是真子集。
可以用好格子点法来构造符合上述定义的均匀设计表。
方法如下: 1. 给定试验次数n ,寻找比n 小的整数h ,且使n 和h 的最大公约数为1,符合这些条件的正整数组成一个向量h =(h 1,h 2,···,h m ) 例如:n=7,h =(1,2,3,4,5,6);n=9,h =(1,2,4,5,7,8) 2. 均匀设计表的第j 列由下法生成u ij = ih j [mod n ]这里[mod n ]表示同余运算,若ih j 超过n ,则用它减去n 的一个适当倍数,使差落在[1,n ]之中。
ih j 可以递推生成: u ij = h j u i+1,j = u ij +h j 若u ij +h j ≤n u i+1,j = u ij +h j -n 若u ij +h j >n i = 1,2,···,n -1 例如,对于n=7,h=(1,2,3,4,5,6)而言,有: 若h 4=4,则u 14=4,u 24= u 14+ h 4-n=8-7=1,u 34=u 24+h 4=5 [mod n ] u 44=u 34+h 4-n=9-7=2,u 54=u 44+h 4=6,u 64=u 54+h 4-n=10-7=3 [mod n ] u 74=u 64+h 4=7 [mod n ] 依此类推,易得u ij (i=1,···,n ;j=1,2,3,4,5,6) ,於是得U 7(76)如下:6这样生成的均匀设计表特记作U n (n ),向量h 称为该均匀设计表的生成向量,有时为强调h 的作用,将U n (n m )记成U n (h )。
给定n ,相应的h 可如上述方便地求得,从而m 也即确定,故m 是n 的一个函数,其曾由欧拉研究过,称为欧拉函数,记为E(n)。
由数论得出下列结论: 1) 当n 为素数(一个正整数,它与其所有比它小的正整数的最大公约数均为1)时,E (n -1)=n -1。
2) 当n 为素数幂时,即n 可表成n=p L ,p 素数,L 正整数,有 E (n )=n (1-p1)例,n=9,可表为n=32,于是E (9)=9(1-31)=6 3) 若n 不属于上述两种情况,n 一定可表为不同素数的方幂积,即 n=s ls llp p p ⋅⋅⋅2121这里s p p p ⋅⋅⋅,,21为不同素数,s l l l ⋅⋅⋅,,21为正整数。
这时E (n )=n (1-11p )(1-21p ) (1)sp 1)例如,n=12,可表为n=22×3,于是E (12)=12(1-21)(1-31)=4,即U 12最多只可能有4列。
上述三种情形中,以素数情形为最好,最多可能获得n -1列;非素数情形,上述表的结构中永远不可能有n -1列。
王元,方开泰(1981年)建议,对n=偶数情形,均匀设计表由n+1的U 表去掉最后一行来构造。
例如,可将U 7(76)表的最后一行去掉构造U 6表如下:6为和由好格子点法构造的U 6表[即U 6(66)]相区别,上述方法构造的U 6表记为)6(66*U ,两者关系和各自特点如下:1) 所有*n U 表是由U n+1表中划去最后一行而得2) U n 表的最后一行全部由水平n 组成,*n U 表的最后一行则不然 3) 若n 为偶数,*n U 表比U n 表有更多的列 4) 若n 为奇数,则*n U 表的列数通常少于U n 表 5) *n U 表比U n 表有更好的均匀性,应优先采用*n U 表 6) 若将U n 或*n U 的元素组成一个矩阵的秩最多分别为21)(+n E 及21)1(++n E 。
三、 均匀性准则和使用表的产生1、 均匀性准则—偏差(略)2、 均匀设计使用表的产生——整数同余幂法我们已经知道,产生均匀设计使用表,实际上就是从U n (n m )中选出S 列,使其相应的均匀设计有最小的偏差。
当m 和S 较大时,从m 列中取出S 列的数目有)(m s 之多,要比较这么多组点集的均匀性,工作量很大。
故需有简化计算和近似求解的方法,这里介绍整数同余幂法。
令a 为小于n 的整数,且a ,a 2(mod n ),…,a t (mod n )互不相同,a t+1=1(mod n ),则称a 对n 的次数为t 。
例如:21=2,22=4,23=3,24=1 (mod 5) 则2对5的次数为3。
31=3,32=9,33=5,34=4,35=1 (mod 11) 则3对11的次数为4。
一般若a 对n 的次数大于或等于S -1,且(a ,n )=1,则可用 (a 0,a ,a 2,…,a S-1) (mod n)作为生成向量,故a 称为均匀设计的生成元。
在一切可能的a (最多n -1个)中去比较相应实验点的均匀性,工作量则大大减少,理论和实践都证明,这种方法获得的均匀设计使用表仍能保证设计的均匀性。
于是,只要求得最优的a ,给定n 和S ,便可获得生成向量,从而获得相应的均匀设计表及使用表。
附录1给出了奇数n (5≤n ≤31及n=37)的U n 表生成元及其相应均匀设计的偏差。
同时对偶数n(6≤n ≤30)给出了*n U 表的生成元和相应均匀设计的偏差。
附录2给出了奇数n 的*n U 表的生成向量和相应均匀设计表的偏差。
由附录1和附录2,我们即可获得一系列均匀设计表*nU 或U n 及其使用表。
例如由试验需要构造U 9(95)均匀设计表及使用表,则根据附录1示知:n=9,m=4,a=2,故U 9(95)的第一行元素为1,2,4,8,7;按升幂排列成1,2,4,7,8。
利用前已述及的求U ij 的递推公式求算U ij ,即得到如下U 9(95)表:5综合考虑m=2,a=4及m=3,a=4的情况,易得到下列的相应使用表及偏差 5四、在多因素试验中,由于试验精度的限制,很多情况下各因素允许的水平数不同,有的因素水平多,有的少。
例如;微波加热离子交换法制备Cu13X 分子筛,微波加热功率,交换时间可以取8水平,而交换液浓度,在试验范围内,取8水平难于精确控制,所以取4水平,这时如何进行均匀设计呢?我们可以采用拟水平法,即在安排交换液浓度这个因素时,令1,2水平为1水平;3,4为2;5,6为3;7,8为4(也有不少人令1,5为1;2,6为2;3,7为3;4,8为4),这样形成一个混合水平的均匀设计表: 2可见,通过拟水平法,可以由*n U 或U n 表得到相应的混合水平表,只是通常偏差比原*nU 或U n 表的略大。