当前位置:文档之家› 实验设计与数据分析

实验设计与数据分析

1P1 N1的简单效应:13(34-21-13); N2的简单效应:-9(18-27=-9); P 的主效(平均效应):-5. [6+(-16)]/2=-5. N 的主效:2 [13+(-9)]/2=2 P*N 的交互效应:-11. [(21+18)-(34+27)]/2=-11(对角之和之差的一半)2、数据处理具体包括:参数估计、假设检验、方差分析与回归分析等方法。

3、统计分析的基本特点:通过样本推断总体。

随机样本的容量越大,越能代表总体。

4、Fisher 试验设计三原则:重复(作用:估计实验误差、降低实验误差、扩大试验代表性)、随机排列(作用:正确估计实验误差)、局部控制(区组化)(特征:同一重复内试验的各处理均应在尽量一直的条件下进行试验,使误差控制按“区组内尽可能小,区组间尽可能大”的原则进行设计)5、表征集中性的特征数是平均数,应用最普遍的是算术平均数;表征离散型的特征数是变异数,最常用的是标准差。

算术平均数功用:指示资料内变数的“中心位置”,用以衡量质量的“一般水平”;作为资料的“代表数”与其他资料进行比较。

离均差的两个性质包括:(1)所有离均差的代数和为0,0)y (n 1=-∑=i i y (2)所有离均差的平方和为最小,)()a ()(1221y a y y y ni i n i i ≠-<-∑∑==. 6、 标准差功用:①用以衡量资料的变异性,是变数的平均变异量,可判断均数代表性的强弱;②估计实验误差,为确定均数间差异显著性提供依据Ps:样本标准差s 不适宜不同样本因均数差异悬殊或单位不同的变异程度的比较;样本标准差s 不能直接反应样本均数与总体均数究竟误差多少。

特征:①标准差的大小,受资料中每个观测值得影响②计算标准差时,在各观测值加或减去一个常数,其数值不变③每观测值同乘或除以一个数a ,所的标准差是原标准差的a 或1/a 倍。

总体标准误的大小反应样本均数的抽样误差的大小,即精密性的高低。

样本标准差是反应样本中各观测值变异程度大小的一个指标,其大小说明了样本均数对该样本代表性的强弱;样本标准误是样本均数的标准差,它是样本均数抽样误差的估计值,其大小说明了样本间变异程度的大小及精密性的高低7、正态分布表格查法,示例:同是α取0.05,双侧时,u α/2=1.96(按α=0.05查取);单侧时,u α=1.64(相当于双侧时按α=0.1查取)8、t 分布 特征:与总体标准差没有关联,特别适用于抽样误差较大的小样本。

t 分布的离散性比u 分布的大9、F 分布 两个样本方差的比值 特点:取值区间0到正无穷;F 分布的平均数为1;F 分布曲线的形状仅取决于df 1和df 2,在df 1=1或2时,F 分布曲线呈严重倾斜的反J 型10、假设检验的两类错误:①第一类错误(Ⅰ型错误或α型错误)无效假设H 0应成立,却否定了它,犯了“弃真”错误;②第二类错误(Ⅱ型错误或β型错误)无效假设H 0不成立,却接受了它,犯了“存伪”错误。

第一类错误只有在否定H 0时才会发生,而第二类错误只有在接受H 0时才会发生,两类错误不可能同时发生;样本容量相同条件下,若犯第一类错误的概率减少,则反第二类错误的概率就会增加。

显著性检验:同一资料,双侧检验与单侧检验所得的结论不一定相同,双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著。

11、与成组法相比成对法比较的优点:(1)加强了试验控制(2)不受两样本总体方差是否相等的干扰(3)随机误差减小(4)提高实验的精确度12、完全随机设计 优点:①易设计,对处理和重复数没有严格限制,可充分利用全部材料②有无缺区也可进行分析③统计分析简单 缺点①同处理小区分布比较凌乱,不便于观察②没实行局部控制,试验差异较大时,不能采用13、随机区组化 特点:随机区组设计包括两个因素区组因素、处理因素 原则:重复内具同质性,重复间允许最大异质性。

应用条件:资料满足正态性、方差齐性。

14、简便公式:矫正数CT=y ..2/(n ·k) 总平方和211n k T ij i j SS y CT ===-∑∑ 总自由度df T =nk-1=N-1 ; 处理间平方和2.11n t i i SS y CT k ==-∑ 处理间自由度df t =n-1; 区组间平方和2.11kk j j SS y CT n ==-∑ 单位组自由度df k =k-1均方MS=SS/df方差分析的应用条件①各观察值相互独立,并服从正态分布;②各组总体方差相等,即方差齐性。

15、正交试验设计的结果分析:①确定因子及其交互作用的主次顺序②找出最优水平组合③分析因子与指标的关系④预测最优组合条件下,试验指标估计值16、正交表原则要求①任一列中,不同数字出现的次数相等②任两列中,同一横行所组成的数字对出现的次数相等。

特点:均衡分散;整齐可比17、二水平两因子间的交互作用只占一列;三水平两因子间交互作用占两列;m 水平两因子间的交互作用占m-1列 18、实验估计值3123ˆa y y b c d =++++(假设最优组合为A 3B 1C 2D 3),其中,y 为平均数,abcd 为贡献值,贡献值=该因素该水平下对应的k 值—平均数19、因素水平选择的原则:假如在结果分析中A 1为最优选择,而在交互作用中A 2B 1为最优选择,此时要舍去A 1选择A 2,如果交互作用间因素水平的选择有冲突,则按因素影响的主次顺序来选择。

20、综合评分法 隶属度加权综合评分法:若多个指标彼此都是越高越好,则用计算得到隶属度;若多个指标评价标准不一,可先对指标越低越好的隶属度采用(1-计算得到的隶属度)修订,然后再按照越高越好的原则挑选最优组合。

=指标值—指标最小值指标隶属度指标最大值—指标最小值;1122++ ··=⨯⨯综合评分指标隶属度权重指标隶属度权重 21、极差分析法的优缺点 优:简单直观、计算量少;缺:不能给出误差大小的估计及指出因子及其交互作用的显著性。

22、正交实验方差分析法不同情况下的相关计算(以下都是对水平相等情形而言)空列实验误差为各空列误差之和无交互、无重复:①相关数据计算:计算各水平下k 及k 2值,y..,y ,CT ,211SS mg gp p K CT r ==-∑,r=n/m 其中,p 为水平数,r 为水平重复数②列方差分析表:表头—变异来源、SS 、df 、MS 、F 、查标准值F 0.05(df A ,df e )和F 0.01(df A ,df e )。

结果分析:依据F 值大小,确定因子的主次顺序;因子显著性及其水平选取;最优组合;最优方案③指标估计,计算出估计值,结论:最佳工艺下指标估计值为。

④验证试验 直接分析可知,在实验的?个组合中,实验?号的指标最佳(?),而所选最优组合?并未出现在表?的?个试验中,为此还需要验证试验(?代表数字或组合)无交互、有重复:Ⅰ重复试验 (情形1) 完全随机化重复试验 ①相关数据计算:计算各水平下y i 。

、.k 及k 2值,y..,y ,CT ,211SS ·k m g gp p K CT r ==-∑②由重复试验产生的误差222.1111n k ne ij i i j i SS y y k ====-∑∑∑,df e2=n (k-1),总误差平方和SS e ﹡=SS e1+SS e2,总误差自由度df e ﹡=df e2+df e1;③列方差分析表(将两类误差及自由度合并后再算其自由度)用SS e ﹡、df e ﹡算均方差,接下来的步骤与无交互、无重复情形一样(情形2)随机区组化重复试验 相关数据计算在区组观察值下方加一行y.j 关于误差合并问题:应检验空列误差均方MS e1与重复误差均方MS e2差异的显著性F 0.05(df e1,df e2)①若经F 检验不显著,则将两者的平方和与自由度分别合并;②若F 检验显著,二者不可合并,此时只能以MS e2进行F 检验与多重比较。

单位组平方和2./k j SS y n CT =-∑;处理平方和2./t i SS y k CT =-∑;重复误差平方和SS e2=SS T -SS k -SS t ;处理间自由度df t =n-1;,单位组自由度df k =k-1,空列误差自由度df e1=df t -df A -df B -···,重复试验误差df e2=df T -df k -df t = df k ·df t 。

其他步骤与算法与情形1一样。

Ⅱ重复取样 计算整体误差(空列及均方低于空列的均方之和),其他计算和步骤(包括整体误差与重复误差的合并)与上述情形2一样。

有交互、无重复:①表头设计②设计实验方案③正交试验结果及其数据处理(交互作用的表格设计可以不进行空列的计算),误差平方和B C A e B B A C SS SS SS SS SS SS ⨯⨯--=--,交互作用自由度df df df A B A B ⨯=⨯。

将交互作用均方小于误差均方的进行合并,形成合并误差。

再进行完因子显著性和主次顺序分析后,要进行交互作用的配方优化(只对有显著影响的交互作用进行搭配效应计算)。

其余的步骤和计算方法与无交互、无重复的情形一样。

有交互、有重复:利用以上的方法,将其综合起来即可。

23、回归分析:揭示出呈因果关系的相关变量间的联系形式,建立他们之间的回归方程,利用方程由自变量来预测、控制依变量; 相关分析:只能研究呈平行关系的两变量间的相关程度或一个变量与多个变量之间的相关程度,不能用一个或多个变量去预测、控制另一个变量的变化,这是回归分析与相关分析区别的关键所在,但是,二者不能截然分开。

回归方程ˆy =a+bx 的基本性质:①2ˆ(y y)-=∑最小值②ˆ(y y)-=∑0③回归直线必须通过中心点x y (,)24、有回归,必有相关;有相关,不一定有回归;回归显著,相关必显著;相关显著必然关系密切;x 与y 相关不显著,不一定x 与y 无关。

相关主题