比如,我在实验中目前遇到的几个问题:1、我做完单因素,就在想是做PB?还是最陡爬坡?还是两个都要做呢??毕竟我快毕业了,时间紧张阿2、我现在准备做PB,突然发现很多文献上都出现了在实验中还要加几个空白项,知道主要是用于误差分析的,但我就想问下,是不是必须设置空白项呢?如果必须设,那么要设几个呢?我看大部分是设了4个的;还有就是,空白项是没有设定+1、-1的水平值,那么在实验中该如何具体操作呢,我采用的是SARS软件进行设计,那么实验设计好后遇到空白项的+1、-1该怎么弄呢?什么都不加么??还有空白项安排的位置有影响么?3、我做的是培养基优化,目前共有8种因素准备做PB,那么做完了PB,确定了显著因素,该如何设计最陡爬坡呢?是不是也需要相关软件来进行试验设计的呢?第一,你的是8个因素,直接做RSM,不可取,建议先用PB筛选主效应因素。
至于SA,并不是每个PB后都必须的,要看你的实验结果,也就是预测和实验区域的吻合情况了。
第二,8个因素,做12runs的PB,刚好有四个空列。
空列,也就是虚拟的,可以权当不存在,它只是在分析中用来估算误差的。
第三,先做好PB。
至于SA,用手算就可以了。
呵呵,很简单的。
看样子你看了很多文献,里面都应该有计算公式的。
哈哈,我这里到时有一些试验数据。
PB设计如果用SAS(应该这样写是对的哦)就会出现上面说的空白项现象。
建议使用minitab、JMP等,这些都不会出现空白项的。
PB设计是筛选重要影响因子的,从众多因子挑出重要的,舍弃不重要的(统计学上说,就是有显著影响的因素)。
因此,在逻辑上是有必要进行的。
如果还有什么问题继续提问。
高低水平的设置没有定式,无需过分遵从1.25倍这个定式。
总体上说,如果一个水平范围内,因素较为显著,可适当缩小范围(具体范围应该合理,举例说,但不一定合理:如果以菌体量最大为望目值时,温度是一个显著性影响因素(p<0.05),现研究范围为37-38℃;那你在缩小范围为37.5-37.9℃,这个就没有必要了。
但是温度范围在35-39℃下显著的话,那可以在缩小至35-37℃,毕竟很多反应器,其温度的控制±0.5。
)。
放开来说,及时都显著,那总有一个先后顺序吧。
首先,整体上你可以按照p值的小大排除影响效果大小序列:A>B>C>D>E>F>……的顺序排列,将影响非常(或及其)显著的因子(p<0.01)的因子作为重点考察对象,如果它们还不够,就依照序列挑选;仅此而已。
所以说,你的试验没有白做。
至少知道了这些因子在这个研究范围内的影响排列顺序。
记住,实验设计是为试验目的服务的,它们只是一种手段,不要陷入到方法论中去。
你的目的是揭示未知世界。
“问题只有一个,解决方法确有很多。
”不要为了实验设计而设计,切记!!!!!这个不是发酵人追求的目的。
我的实验RSM中心符合设计回归的二次模型中失拟项显著是怎么回事呢?模型的P值小于0.0001而失拟项P值0.0053,哪位知道可以帮我分析下么?1. 首先,能告诉二次模型的决定系数(R-sq)足够大吗,>90%如果足够大,那么LOF显著还是可以接受的。
2. 模型p值和LOF的p值是不同意义的。
3. 当因子X(或多元Xi的组合)存在重复(在minitab中叫做仿行)时,选择失拟检验则会将残差误差项分解为失拟(Lack of fit)和纯差(Pure error)两部分,并使用F检验判断是否存在显著的失拟。
若p值小于0.05,则说明存在显著的失拟,回归模型不适合。
此时可考虑引入高次项或对X或Y做变换。
若不存在显著失拟,则说明回归模型适合,不需对回归议程调整,但同时需结合R-sq和R-sq(adj)综合判断。
若这两个值高且接近,则回归模型能充分,不高则说明解释不充分,需考虑是否存在其它显著的影响因子。
我自己是怎么想的:单因子实验只是为了保险使PB实验的结果更加明显而进行的预实验,PB 实验本身就是有筛选单因子的功能,如果有把握是可以直接做PB的.而我的实验是先进行单因子,然后是PB,根据PB的实验分析数据做最陡爬坡实验,否则不能很好的确定爬坡的方向以及步长.最陡爬坡实验的步长的选择:根据前面PB实验的结果,做一阶方程的法线,法线方向就是爬坡方向,步长就根据回归系数和规范变量的比值在通过自然变量来换算,算到的结果在综合实际的情况就可以基本确定步长了这个是最近看文献理解到的一些,希望哪位高手指点一下1 在PB设计中出现的dummy variable的具体含义到底是什么?是对照组吗?如果不是应该遵循什么样的原则去设计呢?2 在PB中实验组数应该是变量数加1,那么在相关的文献中看到15个变量设计为:15+1+4,其中4是dummy variable,但是表格中这4个变量也是有高低水平的变化的,那么设计时是作为15个变量来考虑还是19个呢?3 想问问在最陡爬坡实验中,步长的选择有什么要求吗?纯经验还是有公式的?1. dummy variable 不是对照组。
如果你的实验次数为4的整数倍。
那么看你考察的因素是多少个。
比如你有9个,那么至少要使用runs=12次的PB设计。
此时,有3个空列。
一般的处理方法是,等间距空列。
实在不行,你就随机选吧。
这并不妨碍你的实验结果。
空列只是为了估算误差。
2. 这样吧,如果我这样表述,看你是否能够理解。
我刚好有15个因素,想做PB,正好runs=16 符合我的要求。
可是,这样一来,估算误差呢?因为没有多余空列了。
那么,再往上加列,只有再加4列。
刚好19因素,20次实验,其中有4个空列。
你认为这多出来的一列(16-15=1),我想你是这样算的吧。
那你运行一下软件,看看15因素的PB,runs=16,到底是15列,还是16列?列是因素,行是实验次数。
并不是列数=行数。
想问问在最陡爬坡实验中,步长的选择有什么要求吗?纯经验还是有公式的?描述:如何确定步长:图片:1.BMP描述:如何steepest ascent 实验,红色字体为最佳条件图片:2.BMP看了这张图,我想答案应该是不言而喻了!描述:4 在设计CCD试验那的时候是否要包括全因子实验设计?图片:3.BMP请问在最陡爬坡实验中,我看到文献中说:最陡爬坡的步长公式=e×△j ×bj, 其中bj为一次回归的回归系数,△j为变化半径.那么e值怎么确定的呢?有的文献按经验值算,但有没有一个算法可以确定e值呢?我使用SAS进行试验设计的,11个因素+4个dummy variables,做16次实验。
PB实验设计的数据已经出来了,但是怎么分析不了。
用Analysist→Statistics→Regression→Linear分析出来的结果像图里面这样,怎么回事呢?后面几列的Standard Error, t value 以及p值都没有。
各位好,我用Designexpert做PB设计,但是因素是(11,。
)等等,最低十一个因素,请问倘若我做七个因素咱班这也没有关系,请将其中4个做为虚拟项,虚拟项不要集中在一起,最后间隔设计。
虚拟项不用管它,不能将它看作因素,因为它的各个水平是一样的。
比如温度在本次试验过程没有考虑,但是它是实际存在的,而虚拟因素,只是假想出来的。
只是用来对试验结果误差进行检验的,如果虚拟项对试验的影响超过了考虑的因素,那么这个因素实际也是没有影响的,或者说试验过程误差太多,需要重新进行试验。
您好!我是中国**科学院的一位研究生,看到您在****学报*卷第*期****年*月出版的,题目“*******************发酵条件优化”,请教一些问题:1.您的文章中的Plackett-Burman设计中设计了空列用来进行误差的估计,那在进行软件分析的时候,怎么操作?要把空列也当做模型的一部分选入,进行相应的可信度,贡献率等的分析吗?2.看到有些文章中做Plackett-Burman试验时没有设计空列,比如要考察11个因素,那么就采用12次试验点的PB设计,这样可以吗?是否必须加空列?3. 看到有一篇文章中也做了11个因素的,采用的是以下设计:12次试验加中心点试验1次,共13次试验,每次试验还进行了重复,这种设计中用到的中心点试验的目的是什么?做重复有必要吗?4.PB设计中的中心点和空列如果是用来估计误差的,那么它们分别是估计哪部分的误差,它们是什么关系?5.PB设计中的每个试验点都必须做重复吗?6.您的CCD设计中选择的星号点的a=1.682,这样的话是保证了设计的旋转性还是正交性,或是二者兼顾了?7.在MINITAB软件的PB设计中,如果选择11因素的PB设计时,只有20次试验的选择,没有16次这一选项,不知是什么原因?8.Two-level factorial designs和PB试验的关系是什么样的?------------------------------解答;同学,您好:不好意思,耽搁了好几天才回复。
这部分工作是差不多六、七年前做的了,其后就没有再继续直接进行类似的应用,所以有些地方自己也拿不准了。
虽然自己亲自做的东西印象比较深刻,但一则自己当时也是自学的,对相关概念和原理的理解和应用就有可能不准确,二则长时间不涉及相关工作,的确有些生疏了。
故我的意见仅供你参考,希望能对您有所帮助。
以下就逐条就您的问题作一回答:1、2: 关于空项"N次实验Plackett-Burman设计至多可研究N-1个因素,其中至少应设置3个空项以估计实验误差,每个因素均取高、低两个水平。
该方法数据处理简单,在N次实验中,每个因素高、低水平分别出现N/2;而且,当某个因素处于高(低)水平时,其余因素均各出现高、低水平N/4次。
因此,分别计算这个因素在高、低水平时实验响应的均值并求两均值之差就可得到此因素的效应,其中空项效应的均方和为标准差估计值。
各因素效应进行t检验,可信度高的因素作为重要因素作进一步考察"。
以我的数据为例:计算每个因素的效应时,首先分别求取该因素为+时N/ 2次实验的响应值的和(∑+),再求取该因素为—时N/2次实验的响应值的和(∑-),然后计算(∑+)-(∑-),就得到该因素的效应。
空项的效应得到后,求取均方和,就得到标准差估计值。
因为在理论上空项不应该产生效应,那么得到的效应就应该是误差导致的,所以求取误差效应的均方和就可以作为整个实验的标准差估计值。
其他效应是否显著(即是真的存在还是因为误差产生的?),就根据它们与误差效应的比值来判断。
这样得到各个因素效应的可信度(通过t检验,看显著与否)。
可见,空项是必要的,否则无法说明和判断实验中误差的大小,也不能判断各个因素的效应是否可信,是否显著。
一般说来,为了保证误差估计的可信度,至少应设计三个空项。