第三章医学科研设计的基本原则医学科研设计是指对某一项医学研究的具体内容和方法的安排。
作为科学研究,生物医学研究探索生物医学领域内未知事物和未知规律的科学活动,必须有科学的研究方法和合理的设计才能获得真实、可靠的研究结果。
以人为主要研究对象的生物医学研究,由于研究对象的复杂性和特殊性,影响研究效应的因素很多、许多因素无法完全消除,因此对研究设计的要求就更高。
如果研究设计存在缺陷(如样本代表性、可比性、混杂等),就可能影响研究结果的可靠性和研究价值。
另一方面,还要考虑研究对象(样本)的数量,样本量过少或过多都会对研究结果造成影响。
一个缜密而完善的研究设计,能合理地安排各种研究因素,严格控制各种误差,用较少的人力、物力和时间,最大限度地获得足够而可靠的资料。
合理的研究设计是顺利开展各种医学研究的前提条件,也是得到预期结果、达到事半功倍的保证。
为了达到上述目的,在医学研究设计中必须遵循四项基本原则:随机化原则、对照原则、盲法原则和重复原则。
第一节随机化原则随机化的核心是机会均等。
随机化是医学研究中一项非常重要的原则。
在医学研究中,随机化包括两方面的内容:随机化抽样和随机化分组。
通过随机化选择研究对象,可以得到一个有代表性的样本。
当存在未知或不可控制的非处理因素时,随机化分组将研究对象随机分配到实验组和对照组之中,使这些非处理因素在实验组和对照组的分布一致。
因此,随机化是实验性研究中保证组间均衡、可比的重要手段。
一、随机化抽样随机化抽样是指总体或目标人群中的每一个个体都有相同机会被抽中作为研究对象(样本)。
在医学研究中,由于时间、人力、物力限制,通常不能把所有目标人群都作为研究对象,而只能选取其中一部分作为研究对象(样本)。
对一组(或几组)研究对象(样本)进行调查或实验,获得原始数据,经过数据整理和统计分析得到样本信息(如均数、率等指标),并以样本的信息来推断总体人群的特征。
要实现这一推断的前提条件是所采用的研究对象(样本)要有代表性,即能代表目标人群。
否则,就不能实现这一推断。
获得一个有代表性样本的常用方法是采用随机化抽样来选择研究对象,即目标人群中每一个个体被选中的概率相等。
这样获得的样本称为随机样本。
“随机”不等于“随意”或“随便”。
医学研究一般都需要推论,因此都需要采用随机化抽样的方法选择一组有代表性的研究对象。
随机化抽样也是数据能统计分析和推断的前提。
社会学、新闻传播学常用典型调查,其调查结果反映一部分(特殊人群)的特征,不能推论到普通人群。
二、随机化抽样的常用方法在医学研究中常见的随机化抽样方法有单纯随机化抽样、系统随机化抽样、分层随机化抽样、整群随机化抽样以及多阶段抽样随机化方法。
(一)单纯随机化抽样也称为简单随机化抽样,一种最简单、最基本的抽样方法。
其基本原理是从总体N个对象中,采用随机方法(如随机数字)抽取n个,构成一个样本。
它的重要原则是总体中每个对象被抽到的概率相等(均为n/N)。
常见的随机方法有抽签或抓阄、掷骰子、掷硬币(50%的概率)等;比较科学又方便的方法是用随机数字。
随机数字表是根据概率论的原理编制的一种统计表,是获得随机数字的常用工具,见表3-1。
使用时是首先随机地确定所用表的起始行数、列数,然后逐行、逐列按次序连续选取若干随机数,其结果比抽签方法更理想。
(INT(X))可以产生任意+1可以产生1-100之间的随机数字。
利用随机数字进行单纯随机抽样的基本步骤如下:1.确定目标人群的特征;2. 将目标人群中的每个个体编号、排序;3.给每个个体分配一个随机数字;4. 预先确定选择研究对象的方法。
如欲抽取50%的人群作为样本,则可以按照随机数字是偶数或奇数还确定;如欲选择1/3的人群,则可以把随机数字除以3后根据余数的情况选择;也可以根据随机数字的大小;5. 根据随机数字选择研究对象。
单纯抽样方法适合在总体单位数不大,各个单位之间变异较小的情况下经常采用的抽样方法。
如总体数量大时,必须有所有单位的名单、编号,抽样过程比较麻烦。
被抽到的个体比较分散,资料收集困难,可行性不大。
如总体变异大,即使采用单纯随机抽样,获得样本的代表性也不一定好。
单纯随机抽样的标准误按资料性质可用公式3-1和3-2计算。
均数的标准误:n s N n S X2)1(-= (3-1) 率的标准误:1)1()1(---=n p p N n S p (3-2)上式中s 为样本标准差,p 为样本率,N 为总体含量,n 为样本含量,其中n/N 为抽样比,若小于5%可以忽略不计。
(二) 系统随机化抽样也称为机械抽样或等距抽样。
它是指按照总体一定顺序,机械地每隔若干单位抽取一个研究对象组成样本的方法(图3-1)。
采用系统抽样的基本步骤如下:1. 确定目标人群的特征。
2. 将目标人群中的每个个体排序、编号,如从1~N 相继编号。
3. 确定抽样间隔:K =N /n 。
式中N为总体单位总数,n 为样本含量;根据抽样间隔,把总体依次分成k组。
4. 在第一组人群中,用随机抽样方法抽取个体i作为研究对象。
然后依次加上K 作为下一组的样本号,即第j 组内的被抽中的样本号为:i +(j -1)×K 。
以此来确定所有的样本。
系统抽样优点:(1)事先不需知道总体内的单位数;(2)容易在人群现场进行抽样,特别是总体人数比较多时,也容易进行;(3)所得到的样本是从均匀分布在总体各个部分,一般代表性较好。
系统抽样的缺点:假如总体各单位的分布呈周期性趋势,而抽样间隔刚好是其周期的倍数,则可能使样本产生很大的偏性。
系统抽样标准误的计算可用单纯随机抽样公式代替。
(三) 分层抽样如果一个总体中各个单位间的变异比较大,那么采用单纯随机抽样的方法获得样本的代表性并不很好。
对这样的总体进行抽样,可以采用分层抽样的方法。
先把总体按某种特征(影响变异最大的因素,如年龄、性别、文化水平、疾病程度等)分为若干层,然后分别从每一层内进行单纯随机抽样,组成一个样本,见图3-2。
通过分层,把内部变异很大的总体分成一些内部变异较小的层。
每一层内个体变异越小越好,而层间变异则越大越好。
分层可以提高总体指标估计值的精确度,比单纯随机抽样所得到的结果准确性更高,能保证总体中每一个层都有个体被抽到。
分层调查除了能估计总体的参数值,还可以分别估计各个层内的情况。
如果各层内的样本数n i 按各层单位数(N i )的比例分配,即:N N n in i ⨯= (3-3)式3-3中n为总样本数,N 为总体单位数,N i 为各层内单位数,这种设计称为按比例分配的分层抽样。
其标准误的计算公式如下:均数的标准误:∑-=i i n S N n n 22x )1)(1(S (3-4)率的标准误:)1(1)1(1S 22p p p n n n i i i i N n -⋅-⋅-⋅=∑(3-5)若各层内样本数n i 按下列公式计算:率的抽样:i i i i p N N n n i q q p i i ∑⋅=(3-6)均数抽样:i i i i i N N n n σσ∑⋅= (3-7)上两式中σi 为总体第i 层的标准差;p i 为总体第i 层的率,q i=1-p i。
在这种情况下所获得的样本均数或样本率的方差最小,称为最优分配的分层抽样,其抽样误的计算公式如下:均数的标准误:∑-=))(1(1S 22x n s N n N i i i i i N (3-8) 率的标准误: ()∑⎥⎦⎤⎢⎣⎡---=11)1(1S 2p i i i i i i n p p N N n N (3-9)(四) 整群抽样采用单纯随机抽样等方法获得的研究对象可能包含在总体中的每一个部分。
虽然这种调查覆盖面较大,但是,调查所花的人力、物力将很大,在现场也不容易组织实施。
如先将总体分成若干群组(如居民区、班级等),以这些群组为基本单位,随机抽取部分群组作为观察单位组成样本,这种抽样方法称为整群抽样。
如被抽到群组中每一个个体都作为研究对象,称为单纯整群抽样。
若对被抽到群组再采用随机的方法选择部分个体组成研究对象,称为二阶段抽样。
整群抽样的特点:(1)容易组织与实施,节省人力、物力;(2)群间差异越小,抽取群数越多,代表性越好;(3)与单纯随机抽样相比,抽样误差较大。
因此,整群抽样调查的样本量比其他方法要增加1/2左右。
整群抽样设计要求各群组之间的变异不能太大,否则抽样误差比较大。
(五) 多级抽样在大型流行病学调查中,常常将上面几种抽样方法综合使用。
如先从总体中抽取范围较大的单元,称为一级抽样单位(如省、自治区、直辖市),再从每个抽中的一级单元中抽取范围较小的二级单元(县、乡、镇、街道),最后抽取其中部分范围更小的单元(如村,居委会)作为调查单位,见图3-3。
每个阶段的抽样可以采用单纯随机抽样、系统抽样或其他抽样方法。
多级抽样可以充分利用各种抽样方法的优势,克服各自的不足,并能节省人力、物力。
三、随机化分组的常用方法在实验性研究中,除了干预因素外,实验组和对照组在非研究因素的分布上一致,这样才能消除这些因素对实验结果的影响。
通过随机化分组,可以获得有均衡性的实验组和对照组。
常用的随机分组方法有完全随机化分组、区组随机化分组、分层随机化分组和整群随机化分组等。
(一) 完全随机化分组完全随机化就是用抽签或随机化数字表等方法直接对实验单位进行随机化分组,分组后各组实验单位的个数可以相同也可以不同。
若为小样本资料,当组间个体数目差异较大时,需重新随机分组,直至两组样本含量相近为止。
完全随机化简单易行,是实施其他随机分组方法的基础,但样本含量较大时,工作量较大,不易实施。
完全随机化的基本步骤如下:1. 将每个研究对象排序;2.给每个对象分配一个随机数字,随机数可从随机数字表或随机函数获得(见本节第二部分);3. 事先确定分组的方法。
如根据随机数字的单、双数分成二组;把随机数字除以3后的余数分成三组。
4. 根据随机数字进行分组。
例3-1:将12只小白鼠用完全随机化的方法分成3组。
1. 将12只小鼠依次编号1~12;2.从随机数字表(表3-1)中的任一行任一列开始,如第四行第一列开始,依次读取两位随机数分配给每只小鼠;3. 将随机数字除以3后记录余数。
并规定余数为0为B组,1为C组,2为A组;4. 根据余数和选择方法,确定各小鼠的分组。
分组结果见表3-2。
(二)配对设计配对设计是将受试对象按某些特征或条件配成对子,然后分别把每对中的两个受试对象随机分配到实验组与对照组(或不同处理组)。
这种设计的优点是能缩小受试对象间的个体差异,从而减少实验误差,提高实验效率。
受试对象配对的特征或条件,主要是指年龄、性别、体重、环境条件等非实验因素。
在医学研究中,用同一受试对象作比较,称为同体比较或自身对照。