单因素实验设计单因素实验设计是指在实验中只有一个研究因素,即研究者只分析一个因素对效应指标的作用,但单因素实验设计并不是意味着该实验中只有一个因素与效应指标有关联。
单因素实验设计的主要目标之一就是如何控制混杂因素对研究结果的影响。
常用的控制混杂因素的方法有完全随机设计、随机区组设计和拉丁方设计等。
一、完全随机设计1.概念与特点又称单因素设计或成组设计,是医学科研中最常用的一种研究设计方法,它是将同质的受试对象随机地分配到各处理组进行实验观察,或从不同总体中随机抽样进行对比研究。
该设计适用面广,不受组数的限制,且各组的样本含量可以相等,也可以不相等,但在总体样本量不变的情况下,各组样本量相同时的设计效率最高。
例如:为了研究煤矿粉尘作业环境对尘肺的影响,将18只大鼠随机分到甲、乙、丙3组,每组6只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重(g),通过评价不同环境下大鼠全肺平均湿重推断煤矿粉尘对作用尘肺的影响,具体的随机分组可以如下实施:第一步:将18只大鼠编号:1,2,3, (18)第二步:可任意设置种子数,但应作为实验档案记录保存(本例设置spss11.0软件的种子数为200);第三步:用计算机软件一次产生18个随机数,每个随意数对应一只老鼠(本例用spss11.0软件采用均匀分布最大值为18时产成的18个随机数);第四步:最小的6个随机数对应编号的大鼠为甲组,排序后的第7个至第12个随机数随因编号为乙组,最大的6个随机数对应编号的大鼠为丙组(结果见表1)。
表1 分配结果编号 1 2 3 4 5 6 7 8 93.75 8.75 16.29 11.12 5.49 3.98 13.64 16.71 1.69随机数组别甲乙丙乙乙甲丙丙甲编号10 11 12 13 14 15 16 17 1813.62 16.36 2.12 4.74 11.54 3.98 0.13 17.35 16.38 随机数组别丙丙甲乙乙甲甲丙丙2.随机数的产生方法(1)随机数字表:如附表13(马斌荣,医学统计学,第4版),这是一个由0~9十个数字组成60行25列的数字表。
说这些数字是随机的,是因为十个数字出现的频率近似相同,且出现的次序也没有规律。
欲获得随机数,则事先根据研究性质确定随机数的位数,然后任意指定行和列,按事先确定的方向和方法读取随机数。
如:将符合实验要求的20只动物随机分配到A、B两组。
第一步:将所有动物从1~20号编号。
第二步:按随机数字表第10行15列,从左到右依次读取20位两位数的随机数字,按随机数的大小顺序,如果随机数相同,按先后顺序,先出现为小,序号为1~10号对应的实验动物分到A组,11~20号动物相应分到B组,即得分配方案。
具体分配结果见表2:表2 随机数字表分配结果示例机随机数发生器产生的随机数。
计算机产生的随机数是取值在0~1上均匀分布的随机变量(不包括0和1本身),在一次抽样中每个0~1之间的实数都有相同的机会被抽到,产生一个随机数即是在0~1之间无数个实数中随机抽取的一个。
欲获得随机数,一般需事先指定一个随机种子数(seed),相当于在随机数字表上指定行和列,如在SPSS11.0中指定种子数为200608009,均匀分布的最大值指定为10,产生10个随机数:3.43,0.67,9.82,0.84,3.71,1.16,3.73,3.53,1.46,8.70。
不同软件所得的结果可能不同。
这种随机数是用数学方法计算出来的,因此,严格的讲,它们不是真正意义上的随机数,因而称为伪随机数。
3.适用范围和注意事项完全随机设计方法简单、灵活易用,处理组数和各组样本量都不受限制,统计分析方法也相对简单。
如果在实验过程中,某实验对象发生意外,信息损失将少于其他设计。
各处理组应同期平行进行。
由于本设计单纯依靠随机分组的方法对非处理因素进行平衡,缺乏有效的控制,因而实验误差往往偏大。
所以采用该设计时,对个体间同质性要求较高,在个体同质性较差或达不到设计要求时,完全随机设计并不是最佳设计。
此时应该采用区组设计或拉丁方设计。
二、随机区组设计1.概念与特点又称配伍设计,是配对设计的扩展。
本设计首先在农业试验中应用的,认为小麦的产量不仅受其品种(处理因素)的影响,还受田块(区组因素)的影响,因此,将每个田块分成若干单元,每个单元所受的处理是随机的,这样的设计即可分析处理因素的作用,也可分析区组因素的影响,提高了试验效率。
区组化的目的是对一些已知的非处理因素进行控制,以提高组间的可比性和均衡性,减少实验误差。
采用随机区组设计,需要控制区组的条件:同一区组内研究对象必须同质。
例:为了研究甲乙丙3种营养素的效果,以体重增加量为效应指标,以喂养3种不同营养素为研究因素,以雌性小白鼠为研究对象,评价3种营养素的效果。
用随机区组设计的方法控制窝别的混杂作用,具体操作步骤如下:第一步:用6窝小白鼠,每窝3只,对6个窝别编号为block1,block2,block3,block4,block5和block6,对每同窝的小白鼠分别编号为1,2,3;第二步:可任意指定的随机数,但应作为实验档案记录保存(本例SPSS11.0中指定种子数为100,均匀分布的最大值指定为10);第三步:用依次给出的18个随机数,每个block对应3个随机数,每个随机数对应1只小白鼠;第四步:对随机数每个block进行从小到大的顺序排列;第五步:在每个block中,最小的随机数所对应编号的小白鼠为甲组,中间的随机数对应编号的小白鼠为乙组,最大随机数所对应编号的小白鼠为丙组(结果如表3所示)。
表3 随机区组的分配结果Block号 1 1 1 2 2 2 3 3 3编号 1 2 3 1 2 3 1 2 3随机数 4.96 0.09 9.82 9.40 1.60 9.28 2.98 1.69 9.79组别乙甲丙丙甲乙乙甲丙Block号 4 4 4 5 5 5 6 6 6编号 1 2 3 1 2 3 1 2 3随机数 6.57 9.32 3.87 3.39 7.18 7.02 7.19 2.61 9.93组别乙丙甲甲丙乙乙甲丙本例中,若采用完全随机分组,尽管试验前3组的平均体重做到基本均衡,但来自同一窝别的小鼠具有相同的遗传因素背景,其体重的增加可能有一定的相关性。
不能保证每组6只小白鼠来自不同窝别。
只有采用随机区组设计,这样可以保证同一区组的小白鼠来自同一窝,用各个区组内的处理间的差异就排除了遗传因素的作用,由各个区组内的随机分组可以平衡其他非处理因素的作用,能较好地控制和平衡混杂因素。
2.适用范围和注意事项随机区组设计是单向区组化计数,由于同一区组内受试对象条件基本相同,使得各处理组所有受试对象不仅数量相同,且保证了组间的均衡性,控制了一个已知来源的变异,降低了抽样误差,因而实验效率较高。
在实验室研究中较为常见。
采用该设计时,要尽可能的使观察值不缺失,因为一个数据缺失,该区组的其他数据也就无法利用了。
虽然,统计学上有估计缺失值的方法。
但缺失时信息的损失是较大的,缺失后的信息是无法弥补的。
三、拉丁方设计1.概念与特点拉丁方设计是由g个拉丁字母排成的g×g方阵,每行或每列每个字母都只出现1次,这样的方阵称为g阶拉丁方。
拉丁方设计是按拉丁方的行、列、拉丁字母分别安排3个因素,每个因素有g个水平。
一般将g个不同字母分别表示处理的g个不同水平,g行表示g个不同区组(行区组),g列表示另一个区组因素的g个水平(列区组)。
因此拉丁方是双向的区组化计数。
控制了两个非处理因素的变异。
拉丁方设计的特点:在因素安排时每种处理在行和列间均衡分布,因此,无论在行或列间出现差异时,都不影响处理因素所产生的效应。
拉丁方的方差分析将总变异分解为4部分,即处理因素的变异,行区组变异,列区组变异和误差。
这样方差分析的误差项较小,因此,该方法是节约样本量的高效率实验设计方法之一。
表4 常用的几个拉丁方设计3×3 4×4 5×5 6×6A B C A B C D A B C D E A B C D E FB C A B C A D B C D E A B C D E F AC A B CD A B C DE A B C D EF A BD A B C DE A B C D EF A B CE A B C D EF A B C DF A B C D E例:为观察电针不同穴位对人体免疫功能的影响,分别对6个不同穴位:A-井穴,B-荥穴,C-输穴,D-经穴,E-合穴和F-内关进行实验。
选6名正常男性青年,考虑到昼夜节律对结果的影响,分别于6个不同的时辰(戌时,子时,寅时,辰时,午时,申时)进行实验。
分析:本例的研究因素是不同穴位,要控制的两个因素是不同的人和不同的时辰。
共有3个因素,即穴位,个体和时辰,每个因素均为6个水平。
采用6×6拉丁方设计。
具体步骤如下:第一步:基本拉丁方如下:用6个时辰对应第1~6行,6个对象对应第1~6列。
表5 本例的基本拉丁方设计1 2 3 4 5 6戌时 A B C D E F子时 B C D E F A寅时 C D E F A B辰时 D E F A B C午时 E F A B C D申时 F A B C D E 第二步:进行随机化。
设SPSS11.0中指定种子数为500,均匀分布的最大值指定为10,依次产生的随机数,依次对应6行,用最小的随机数对应的行放第一行,用第二小随机数对应的行放第二行,依次类推,用最大的随机数对应的行放第六行。
见表6:表6行随机化前后的行对应变化行随机化前的时辰戌时子时寅时辰时午时申时随机数 4.81 0.44 9.12 6.99 8.01 6.39行随机化后的时辰子时戌时申时辰时午时寅时行随机化后拉丁方表格为表7:表7 6名正常男性青年编号1 2 3 4 5 6子时 B C D E F A戌时 A B C D E F申时 F A B C D E辰时 D E F A B C午时 E F A B C D寅时 C D E F A B第三步:对列进行随机化设SPSS11.0软件的种子数为501,均匀分布的最大值指定为10,依次产生6个随机数,依次对应6列,对随机数排序,同样用每列的随机数排序号对应相应的列的位置,见表8:表8 列随机化前后的列对应变化列随机化前的时辰 1 2 3 4 5 6随机数 6.66 0.14 3.12 9.59 7.23 6.08列随机化后的时辰 4 1 2 6 5 3列随机化后拉丁方表格为表9:表9 6名正常青年编号4 1 2 65 3子时 E B C A F D戌时 D A B F E C申时 C F A E D B辰时 A D E C B F午时 B E F D C A寅时 C D E F A B 第四步:对拉丁字母与处理组对应的关系进行随机化,设SPSS11.0软件的种子数为502,均匀分布的最大值指定为10,依次产生6个随机数,依次对应A~F,对随机数排序,同样按随机数的排序号从小到大依次对应各个字母表示的穴位:A-井穴,B-荥穴,C-输穴,D-经穴,E-合穴,F-内关。