当前位置:文档之家› 随机分组原理与方法案例word

随机分组原理与方法案例word

简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

适用于总体量大、差异程度较大的情况。

先将总体单位按其差异程度或某一特征分类、分层,然后在各类或每层中再随机抽取样本单位。

分层抽样实际上是科学分组、或分类与随机原则的结合。

分层抽样有等比抽样和不等比抽样之分,当总数各类差别过大时,可采用不等比抽样。

除了分层或分类外,其组织方式与简单随机抽样和等距抽样相同。

随机抽样设计一、纯随机抽样:对总体的所有容量不做任何的分类和排队,完全按随机原则逐个抽取样本容量。

纯随机抽样的常用抽样方法1)抽签法:将总体容量全部加以编号,并编成相应的号签,然后将号签充分混合后逐个抽取,直到抽到预定需要的样本容量为止。

缺点:总体容量很多时,编制号签的工作量很大,且很难掺和均匀。

2)随机数字法:用字母顺序或身份证号等任何方便的方法对总体容量编者按号,利用随机数表从1到总体容量N中随机抽取n(样本容量数)个数,遇到那些不在编号里的数字需跳过。

二、等距抽样:先将总体各单位按某一有关标志(或无关标志)排队,然后相等距离或相等间隔抽取样本单位。

根据需要抽取的样本单位数(n)和全及总体单位数(N),可以计算出抽取各个样本单位之间的距离和间隔,即:K=N/n,然后按此间隔依次抽取必要的样本单位。

等距抽样的一个例子某企业有职工5000名,现要随机抽取100人进行家庭收入水平调查。

抽取方法:按与研究目的无直接关系的姓名笔划对总体进行排列,把总体划分为K=5000/100=50个相等的间隔,在第1至第50人中随机抽取一名,如抽到第10名,后面间隔依次抽取第60,110,160,210,…直到4960为止,总共抽取50同名职工组成一个抽样总体。

等距抽样的优点:(1)能保证被抽取到的样本单位在全及总体中均匀分布;(2)简化抽样过程。

等距抽样应注意:要避免抽样间隔或样本距离和现象本身的节奏性或循环周期相重合。

三、类型抽样类型抽样:将全及总体中的所有单位按某一主要标志分组,然后在各组中采用纯随机抽样或等距抽样方式,抽取一定数目的调查单位构成所需的样本。

适用范围:主要适用于总体情况比较复杂,各类型或层次之间的差异较大,而总体单位又较多的情形,分层使层内各单位之间的差异减小,层间差异扩大。

(一)类型比例抽样按照总体单位数在各组之间的比例,分配各组的抽样单位数。

即:各类型中抽取的样本单位数ni占该类型所有单位数Ni的比例是相等的,等同于样本单位总数n占总体单位数N的比例,即:各类型组应抽取的样本单位数为:样本比率抽样样本容量:按前面指定的比例(n/N)从每组的Ni单位中抽取ni个单位即构成一个抽样总体,其样本容量为:n= n1+ n2+ n3+…+ nk=(二)类型适宜抽样在抽取样本单位数时,要考虑各类型组包含的单位数不同和标志变动度()的不同,变动程度()大的类型组要多抽样本单位数,变动程度()小的组要少多抽样本数,使得各类型组的变动程度()在所有类型组变动程度之和中的比例相等,等同于是或。

此外,还可将各类型组单位数和变动程度结合考虑,使得在所有类型组之和中所占比例等于或,即:四、整群抽样在全及总体中以群(或组)为单位,按纯随机方式或等距抽样方式,抽取若干群(或组),然后对所有抽中的各群(或各组)中的全部单位一一进行调查。

五、多阶段抽样将多个抽样程序分成若干阶段,然后逐阶段进行抽样,以完成整个抽样过程。

适用范围:总体包括的单位很多,而且分布很广,通过一次抽样抽选出样本是很困难的,这时使用多阶段抽样。

多阶段抽样的一个例子例:对我国的农产量进行抽样调查。

抽样方法是:先由省抽县,由抽中的县内再抽乡、村,由抽中的乡、村抽地块,最后才由抽中的地块再抽样本单位。

怎么样随机分组一.拟将12只大鼠随机分入甲、乙两组,每组6名。

1.应先把受试者按体重由小到大编号,2.然后从随机数字表任意一处查出12个随机数,遇到相同的随机数则去掉(如从“随机数字表“第35行第1列向右查)。

分配给每只大鼠3.并将随机数由小到大编秩(秩次R),4.令R为1~6者分入甲组,R为7~12者分入乙组。

动物编号 1 2 3 4 5 6 7 8 9 10 11 12随机数字 69 92 06 34 13 59 71 74 17 32 27 55秩次R 9 12 1 6 2 8 10 11 3 5 4 7 此为随机数字分组结果乙乙甲甲甲乙乙乙甲甲甲乙二.试验动物随机分6组,每组10只。

完全随机化分组:1,编号,将60个动物编号,可按体重大小编号2,取随机数字:从随机数字表中任一行任一列开始,抄取60个随机数字,如遇相同数字,抄取下一个随机数.可以不按章法,横着抄,竖着抄,斜着抄数字都可以. 3,对随机数字按从小到大排序.4,分组:从排序后的数字中规定前10个为第一组.依次类推.区组随机化分组:1,将动物的体重从轻到重编号,体重相近的6只配成一个区组2,从随机数字表中任一行任一列开始,抄取60个随机数字3,在每个区组内将随机数字按大小排序4,将各组内序号为1的分为一组,序号为2的分为一组.依次类推.怎么样随机抽样1、随机的原则1)随机的意义所谓随机,就是每一个受试对象都有同等的机会被分配到任何一个组中去,分组的结果不受人为因素的干扰和影响。

实验设计中必须贯彻随机化原则,因为在实验过程中许多非处理因素在设计时研究者并不完全知道,必须采用随机化的办法抵消这些干扰因素的影响。

2)随机化的实施实验设计中所指的总体不是泛指的无限总体,而是根据研究假设的要求规定的纳入标准,如动物的体重、年龄、病人的病情、经济条件、父母的文化程度等所选择的受试对象(即本次实验的有限总体),再把这些受试对象随机分入实验组和对照组中,以增强可比性,称为随机分配(randomized allocation)。

随机化的实施就是如何进行随机分配。

随机化的方法有多种,最简单的如抽签。

但在实验设计中广泛应用随机数字表和随机排列表。

(1)随机数字表和随机排列表随机数字表表内数字相互独立,全部数字无论从横行、纵行或斜向等各种顺序均呈随机状态。

因此,使用时可从任何一个数字开始,按任意一个顺序录用。

例如拟将12只大鼠随机分入甲、乙两组,每组6名。

1.应先把受试者按体重由小到大编号,2.然后从随机数字表任意一处查出12个随机数,遇到相同的随机数则去掉(如从“随机数字表“第35行第1列向右查)。

分配给每只大鼠3.并将随机数由小到大编秩(秩次R),4.令R为1~6者分入甲组,R为7~12者分入乙组。

动物编号 1 2 3 4 5 6 7 8 9 10 11 12随机数字 69 92 06 34 13 59 71 74 17 32 27 55秩次R 9 12 1 6 2 8 10 11 3 5 4 7 此为随机数字分组结果乙乙甲甲甲乙乙乙甲甲甲乙随机排列表随机排列表比随机数字表更有实用性。

它可以简便地将受试对象随机分配到实验所要求的各组中去,也可以对处理因素进行随机排列,但不适用于随机抽样研究。

本表共有n分别为10、20、30、40、50、100等不同自然数排列而成的六种随机排列表,本教材引用n为20的随机排列表。

是每行或每列数字与顺序的等级相关系数,越小表示数字排列随机化程度越好。

例如,将10只小鼠随机分入甲、乙两组。

先将小鼠按体重由小到大编号,然后任意取n为20随机排列表中的任意一行或一列随机数,遇到大于或等于10的随机数则舍去。

本例取随机排列表中第6行,令单号分入甲组,双号分入乙组。

动物编号:12345678910随机数字:2814309675分组结果:乙乙甲乙甲乙甲乙甲甲所以,第3、5、7、9、10只小鼠被分入甲组,第1、2、4、6、8只小鼠被分入乙组。

(2)几种常用随机分组方法大样本完全随机分组适用于每组例数大于100时的情况。

方法是每个受试者给一个3位数的随机数,规定随机数区间:分两组(等概率)000~499 500~999分三组(等概率)000~332 333~665 666~998分四组(等概率)000~249 250~499 500~749 750~999分五组(等概率)000~199 200~399 400~599 600~799 800~999余类推,多余的随机数可忽略,如分三组时取000~998,分六组时取000~995之间的随机数。

在有些特殊情况下需进行不等概率分组时,可按比例调整随机区间。

如按1:2分组,A组的随机数区间为000~333,B组为334~999;按1:3分组,A组为000~249,B 组为250~999。

在临床试验中,不等概率分组的比例不能超过1:3。

表13.1是1:2完全随机分组举例。

表13.1 300例受试者1:2完全随机分组举例受试者编号 1 2 3 4 5 6 7 8 9 10 11 (300)随机数849 140 539 006 860 347 323 387 563 678 253 (961)处理 B A B A B B A B B B A … B表13.2 等概率随机分组例数分布的抽样试验备注:括号内为每组理想例数。

对于完全随机分组,各组例数没有必要调整到理想情况(如等概率分组两组例数相等)。

表13.2的抽样试验结果还说明,当每组例数达到100例时,各组例数应该是大体相当的。

万一出现比例严重失衡的情况,如200例等概率分组时,出现85:115或更不平衡的情况(出现概率小于0.05),需重新分组。

表13.3 n个区组随机排列结果方法2当处理数k较小时(如k<5),由方法1得到的区组内处理的排序顺序可能出现重复,如表13.3中的区组3和4。

此时,可用表13.4中全排列顺序确定各区组的排列方式。

表13.4 k=3,4时区组内处理的全排列例如,当k=3时,对5个区组内A,B,C三种处理进行随机排列。

取6个随机数:498,739,853,994,563,479,排序结果位2,4,5,6,3,1,查表13.4对应的序号,第一个区组的对应的序号是2,排列方式为ACB,第二个区组的对应的序号是4,排列方式为BCA,第三个区组的对应的序号是5,排列方式为CAB,第四个区组的对应的序号是6,排列方式为CBA,第五个区组的对应的序号是3,排列方式为BAC。

当k=2时(配对设计),因排列方法只有2种,即AB和BA,可用每个对子随机数的奇偶决定,但为了保证所有对子中这两种顺序出现机会均等,还可采用分段随机数分组的方法。

分段随机分组分段随机分组的基本思想是利用随机数生成若干数目相同的随机排列序列,再根据序列号进行分组,其目的是使分组结果达到预想的例数分配,既适用于小样本又适用于大样本。

相关主题