试验设计与数据处理方法总述及总结王亚丽(数学与信息科学学院 08统计1班 081120132)摘要:实验设计与数据处理是一门非常有用的学科,是研究如何经济合理安排试验可以解决社会中存在的生产问题等,对现实生产有很重要的指导意义。
因此本文根据试验设计与数据处理进行了总述与总结,以期达到学习、理解、掌握的以及灵活运用的目的。
1 试验设计与数据处理基本知识总述1.1试验设计与数据处理的基本思想试验设计与数据处理是数理统计学中的一个重要分支。
它是以概率论、数理统计及线性代数为理论基础,结合一定的专业知识和实践经验,研究如何经济、合理地安排实验方案以及系统、科学地分析处理试验结果的一项科学技术,从而解决了长期以来在试验领域中,传统的试验方法对于多因素试验往往只能被动地处理试验数据,而对试验方案的设计及试验过程的控制显得无能为力这一问题。
1.2试验设计与数据处理的作用(1)有助于研究者掌握试验因素对试验考察指标影响的规律性,即各因素的水平改变时指标的变化情况。
(2)有助于分清试验因素对试验考察指标影响的大小顺序,找出主要因素。
(3)有助于反映试验因素之间的相互影响情况,即因素间是否存在交互作用。
(4)能正确估计和有效控制试验误差,提高试验的精度。
(5)能较为迅速地优选出最佳工艺条件(或称最优方案),并能预估或控制一定条件下的试验指标值及其波动范围。
(6)根据试验因素对试验考察指标影响规律的分析,可以深入揭示事物内在规律,明确进一步试验研究的方向。
1.3试验设计与数据处理应遵循的原则(1)重复原则:重可复试验是减少和估计随机误差的的基本手段。
(2)随机化原则:随机化原则可有效排除非试验因素的干扰,从而可正确、无偏地估计试验误差,并可保证试验数据的独立性和随机性。
(3)局部控制原则:局部控制是指在试验时采取一定的技术措施方法减少非试验因素对试验结果的影响。
用图形表示如下:2试验设计与数据处理方法总述和总结2.1方差分析(1)概念:方差分析是用来检验两个或两个以上样本的平均值差异的显著程度。
并由此判断样本究竟是否抽自具有同一均值的总体。
(2)优点:方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,是非常有用的。
(3)缺点:对所检验的假设会发生错判的情况,比如第一类错误或第二类错误的发生。
(4)基本原理:方差分析的基本思路是一方面确定因素的不同水平下均值之间的方差,把它作为对由所有试验数据所组成的全部总体的方差的第一个估计值;另一方面再考虑在同一水平下不同试验数据对于这一水平的均值的方差,由此计算出对由所有试验数据所组成的全部数据的总体方差的第二个估计值。
比较上述两个估计值,如果这两个方差的估计值比较接近就说明因素的不同水平下的均值间的差异并不大,就接受零假设;否则,说明因素的不同水平下的均值间的差异比较大。
(5)数据处理基本步骤:定义总离差和为各样本观测值与总均值的离差平方和,_211()k n T ij i j SS X X ===-∑∑其中 :_X ——样本均值,即_111k niji j X X N ===∑∑式中:N nk =——样本观测值总数 对离差平方和分解如下:2_11()k n T ij i j SS X X ===-∑∑___11______221111[()()][()()]2()()knij i i i j knk k n ij i i ij i i i j i i j X X X X X X n X X X X X X ========-+-=-+-+--∑∑∑∑∑∑∑式中: _iX —— 第i 个样本的均值即_11ni ijj X X n ==∑交叉项:___12()()knij i i i j X X X X ==--∑∑___11____12[()()]2()()0kni ij i i j ki i i i X X X X X X n X n X ====--=--=∑∑∑令__21()kT i i SS n X X ==-∑_211()k n E ij i i j SS X X ===-∑∑其中,E SS 刻画了全部n 次试验中纯粹由随机因素影响所产生的离差平方和,简称为组内平方和,也称为误差平方和。
R SS 刻画了因素水平A 的差异对数据离散型的作用,称为组间平方和,或因素平方和。
例如 四种不同灯丝配料方案数据如下,问灯丝配料方案对灯泡使用寿命有无显著影响?解:运用方差分析发得总试验次数 123426,4,7,5,8,6N k n n n n ======计算如下:75861234111111760,=8310,13090,9410ij ij ij ij j j j j T X T X T X T X ===========∑∑∑∑758622221234111119785400,=13828100,21503700,14778700ij ij ij ij j j j j Q X Q X Q X Q X ===========∑∑∑∑2111142570,69895900k n k nij ij i j i j T X Q X ========∑∑∑∑2195711.54T T SS Q N =-=241151350.83i E i T SS Q N ==-=∑R T E SS SS SS =-将上述各项计算出结果后,可利用方差分析表进行方差分析灯泡品种 试验结果/h1A1600 1610 1650 1680 1700 1720 18002A 1580 1640 1640 1700 17503A 1460 1550 1600 1620 1640 1660 1740 1820 4A 1510 1520 1530 1570 1600 1680表-1 方差分析表方差来源 离差平方和 自由度 均方差 统计检验量 显著性配料方案 44360.71 3 14786.90 2.15 误差 15135.83 22 6879.58 总方差 195711.54 25(6)结论 : 从F 分布表中差得0.5(3,22) 3.05F =,因为0.5(3,22)F F <故接受0H ,即可认为灯丝不同配料方案对灯泡使用寿命无显著影响,亦可说明各方案都可制作灯泡。
但在实际生产中可选用工艺简单、造价经济的配料方案,进行方差分析的目的也在此。
2.2正交试验设计(1)基本思想:正交试验设计利用正交表即可对试验进行合理安排,挑选少数具有代表性的组合处理试验——以少代多,又可对实施的少数个组合处理结果进行科学的分析,做出正确的结论——以少求全。
(2)优点:正交试验设计从全面试验中挑选部分试验点进行试验,减少试验次数,且试验点均匀分散,整齐可比。
(3)缺点:为了照顾整齐可比,试验点有时不能保证均匀分散,且试验点的数目就会比较多(试验次数随水平数的平方而增加).(4)表示符号:()q n L t ,其中L 是正交表代号n ,是行数(安排试验次数),t 是因素水平数,q 是列数(最多安排因素个数)(5)性质:(1)表中任何一列,各水平都出现,且出现次数相等。
(2)表中任意两列之间,各种不同水平的所有可能组合都出现,且 出现的次数相等。
(6)正交试验设计和数据处理步骤 :(1)明确试验目的,确定试验指标(2)挑选因素与水平,制定因素水平表 (3)选择正交表,并进行表头设计(4)确定试验方案 例题:乙醇溶液提取葛根中有效成分的试验,试验考察指标有3项:提取物得率,提取物中葛根总黄酮含量,总黄酮中葛根素含量,且3个指标越大越好。
选取3个相对重要的因素:乙醇浓度,液固比和提取物回流次数进行正交试验。
解:运用综合平衡法,不考虑交互作用,选用正交表49L (3)安排试验,试验和结果表如表-2表-2 葛根有效成分提取试验方案与结果试验方案试验结果试验号 A乙醇浓度%B液固比C回流次数提取物得率/%葛根总黄酮含量/%葛根素含量/%1 1 1 1 1 6.2 5.1 2.12 1 2 2 2 7.4 6.3 2.53 1 3 3 3 7.8 7.2 2.64 2 1 2 3 8.0 6.9 2.45 2 2 3 1 7.0 6.4 2.56 2 3 1 2 8.2 6.9 2.57 3 1 3 2 7.4 7.3 2.88 3 2 1 3 8.2 8.0 3.19 3 3 2 1 6.6 7.0 2.2先对各指标分别进行直观分析,分别得出因素的主次和最优组合条件,结果如表-3:表-3 葛根有效成分提取试验结果分析试验结果A B空列C提取物得率/%1K21.4 21.6 22.6 19.82K23.2 22.6 22.0 23.03K22.2 22.6 22.2 24.0 1k7.13 7.20 7.53 6.60 2k7.73 7.53 7.33 7.67 3k7.40 7.53 7.40 8.00极差R1.8 1.0 0.6 4.2因素主次CAB最优组合条件322A BC或323A BC1K18.6 19.3 20.0 18.5葛 根 总 黄 酮 含 量/%2K 20.2 20.7 20.2 20.5 3K 22.3 21.1 20.9 22.1 1k 6.20 6.43 6.67 6.17 2k 6.73 6.90 6.73 6.83 3k 7.43 7.03 6.97 7.37 极差R 3.71.80.93.6因素主次 ACB最优组合条件333A C B 葛 根 素 含 量/%1K7..2 7.3 7.7 6.8 2K 7.4 8.1 7.1 7.8 3K 8.1 7.3 7.9 8.1 1k 2.40 2.43 2.57 2.27 2k 2.47 2.70 2.37 2.60 3k 2.70 2.432.63 2.70 极差 0.90.80.81.3因素主次 CAB最优组合条件322A B C再进行综合平衡分析得,最优组合条件323A B C ,即乙醇浓度70%,液固比为6,回流3次。
2.3均匀实验设计(1) 概念:均匀实验设计就是只考虑试验点在试验范围,是部分因子设计的主要方法之一,它适用于多因素多水平的试验设计场合,试验次数等于因素的水平数,是大幅度减少试验次数的一种优良的试验设计方案。
(2)特点:(1)每个因素的每个水平做一次且仅做一次试验。
(2)任两个因素的试验点点在格子上,每行每列有且仅有一个试验点,且这两点反映了试验安排的均衡性。
(3)均匀设计表任两列组成的试验方案一般并不等价。
(4) 当因素的水平数增加时,试验数按水平数的增加在增加。
(3)思想:均匀试验设计沿用近30年来发展起来的“回归设计”方法,运用控 制论中的“黑箱”思想,把整个过程看作一个“黑箱”,把参与试验的因素12,,n x x x ,通过运用均匀设计法安排试验,并作为系统的输入参数而把试验指标(结果)Y ,作为输出参数(如图-1所示)。