抽样方法介绍朱一军福建省产品质量检验研究院、随机方法选择及随机数产生按照GB/T 10111-2008《随机数的产生及其在产品质量抽样检验中的应用程序》的要求,并根据受检单位的产品堆放形式、基数(批量)大小,确定抽样方法(通常包括简单随机抽样、分层随机抽样、系统抽样、整群抽样、全数抽样五种方法)。
随机数一般可使用随机数表、骰子或扑克牌中任选一种方式产生。
(一)简单随机抽样(抽签法、随机样数表法)常常用于总体个数较少时,它的主要特征是从总体中逐个抽取;优点:操作简便易行缺点:总体过大不易实行1.定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nW N ,如果每次抽取式总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
2.简单随机抽样方法(1)抽签法一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
抽签法简单易行,适用于总体中的个数不多时。
当总体中的个体数较多时,将总体“搅拌均匀”就比较困难,用抽签法产生的样本代表性差的可能性很大)2)随机数法随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。
二)分层抽样Stratified Random Sampling)主要特征分层按比例抽样,主要使用于总体中的个体有明显差异。
共同点:每个个体被抽到的概率都相等N/M。
定义般地,在抽样时,将总体分成互不交叉的层,然后按照定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样stratified sampling )。
三)系统抽样当总体中的个体数较多时,采用简单随机抽样显得较为费事。
这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。
步骤:般地,假设要从容量为N 的总体中抽取容量为n 的样本,我们可以按下列步骤进行系统抽样:(1)先将总体的N个个体编号。
(2)确定分段间隔k,对编号进行分段。
当N/n (n是样本容量)是整数时,取k=N/n;(3)在第一段用简单随机抽样确定第一个个体编号l (l wk);4)按照一定的规则抽取样本。
通常是将l 加上间隔k 得到第2个个体编号(l+k ),再加k得到第3个个体编号(l+2k ), 依次进行下去,直到获取整个样本。
小结:三种抽样方法的比较1、类别:①简单随机抽样②系统抽样③分层抽样2、共同点:(1) 抽样过程中每个个体被抽到的可能性相等(2) 每次抽出个体后不再将它放回,即不放回抽样3、各自特点:①从总体中逐个抽取②将总体均分成几部分按事先确定的规则在各部分抽取③将总体分成层,分层进行抽取4、相互联系:①无②在起始部分抽样时采用简单随机抽样③ 各层抽样采用简单随机抽样或系统抽样5、适用范围①总体中个体数较少②总体中个体数较多③总体由差异明显的几部分组成四)整群抽样什么是整群抽样(Cluster sampling)整群抽样又称聚类抽样。
是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
整群抽样的优缺点:整群抽样的优点是实施方便、节省经费;整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。
整群抽样的实施步骤:先将总体分为i 个群,然后从i 个群钟随即抽取若干个群,对这些群内所有个体或单元均进行调查。
抽样过程可分为以下几个步骤:、确定分群的标注二、总体(N)分成若干个互不重叠的部分,每个部分为一群。
三、据各样本量,确定应该抽取的群数。
四、采用简单随机抽样或系统抽样方法,从i 群中抽取确定的群数。
例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h 抽1h 生产的全部产品进行检验等。
整群抽样与分层抽样的区别整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。
分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。
二、常见的简单随机抽样方法介绍1、随机数表法1.1 随机数表简介随机数表是一组由0 到9 数字组成的表,每个数字都有相同的概率出现在每个位置上。
附录A提供了五张50 X 50的随机数表(见表A. 1〜表A. 5)。
如表A.1 不敷使用也可选择其他合适的随机数表。
1. 2获得随机数R的方法a)确定随机数表号与初始点:首先在第一张表上随机指定一点,以它为起点依次向右读取5 个数字,第一个数字若小于5,则取该数加1 作为选定的随机数表号,若第一个数字大于或等于5,则取该数减4 之差作为选定的随机数表号。
第2〜3 位和4〜5 位组成两个两位数,若两位数小于50,则加上1 ,若两位数大于或等于50,则减去49,最后所得的数表示初始点所在的行数和列数。
b) 获得R0的方法:从初始点依次向下读取所需m位数得到所需的随机数R0。
在读取过程中,若读到该页的最后一行则转到第一行依次读取后m列,若最后剩下的几列不足m列则从下一号表的第一列开始依次补上。
1.3 读取样本单元编号Ra)如获得的随机数RW N贝y随机数R就取R);若9N, 则设R=K i N+R,其中K i=[N/R],当(K i+1)N>10m时,舍弃并重新生成随机数R D;当(K i+1)N< 10m时,则取R=R(若0vRvN)或取R=N(若R=0)。
重复上述过程,直到获得n个不同的随机数为止。
b)为了提高效率,可以采用下述方法:如获得的随机数R)< N则随机数R就取R;若R>N,则取一个大于N的适当整数M 一般取M=2X 10m-1, 2.5 X 10m-1, 3X 10m-1或5X 10m-1。
设R=KM+艮其中K2=[ R)/M],则当(K2+1)M>10m时,舍弃并重新生成随机数R0;当(K2+1)M< 10"时,贝y R=R(若OvRvN)或R=N(若R=0)或舍弃重新生成(若艮〉N)。
重复上述过程,直到获得n个不同的随机数为止。
注1:当N 小于200,而所得读数大于200,取读数减去200的倍数,若其差数小于或等于N则作为所要的随机数,若差数大于N则舍弃;当200vN< 500,而所得读数大于500,则取读数减去500,其差数作为所要的随机数。
注2:若采用注1 的方法.读取所需随机数的效率会更高。
2、随机抽样骰子法1随机数骰子构成及其使用方法1.1随机数骰子的构成随机数骰子是均匀材料制成的正二十面体,各面上刻有0〜9 的数字各2个。
图1为其底视图与俯视图。
每套骰子由盒体、盒盖及数种不同颜色的骰子组成,如图1. 2随机数骰子的使用方法根据需要选取m个骰子并规定每种颜色所代表的数位。
例如,选用红、黄、蓝3种颜色的骰子,并规定红色骰子出现的数字表示百数位,黄色骰子出现的数字表示十数位,蓝色骰子出现的数字表现个数位。
特别规定当m个骰子的数字均为零时,表示10%将m个骰子放入盒中盖好,盒盖向下,水平地摇动盒子,使骰子充分旋转,然后打开盒子,读出骰子表示的随机数R o。
2 产生随机数R D的方法2.1确定骰子个数根据总体大小或批量N选定m个彀子,如表1所示。
表1总体大小或批量N与骰子个数m的对应关系N的范围1 < NW 1011 W NW 100101W NW 10001001W NW 1000010001W NW 100000100001W N<当m>6或个别骰子丢失、损坏时,可通过重复摇骰子的方法获得随机数R DO例如,可用一个骰子摇m次来代替m个骰子摇一次。
规定第一次摇骰子所得数字为随机数的最高数位,摇第二次骰子所得数字为随机数的第二高数位,依此类推。
2. 3读取随机样本单元号R的方法2.3.1 方法如获得的随机数RW N则随机数R就取F0;若R)>N,则舍弃不用,另行重新生成随机数R。
重复上述过程,直到取得n个不同的随机数为止。
2.3.2 方法二如获得的随机数F0< N,贝y随机数R就取R);若9N,则设R0= K1 N + R1 ,K i=[N /Ro],当(K i+1)N>10m时,舍弃并重新生成其中随机数F0;当(K i+1)NW 10m时,则取R=R(若OvRvN)或取R=N若F1=0) 。
重复上述过程,直到获得n 个不同的随机数为止。
2. 3. 3 方法三如获得的随机数RW N,则随机数R就取R O;若R>N,则取一个大于N的适当整数M 一般取M=2X 10m-1, 2.5 X 10m-1, 3 X 10m-1 或5X 10m-1。
设RKM+R,其中K2=[R0/M],则当(K2+1)M>10“时,舍弃并重新生成随机数R);当(K2+1)M< 10m时,则R=R(若0<亦2 或R=N(若R=o)或舍弃重新生成(若R2>N)。
重复上述过程,直到获得n 个不同的随机数为止。
注:若遇到与已获得随机数重复情形,则舍弃重摇。
2. 4 随机数骰子法示例3、随机抽样扑克牌法1 扑克牌式样把一副扑克牌的四种花色的A,2,3,4,5,6,7,8,9,10共40张,把A作为1, 10作为0(见表1.1)。
表1.1 扑克牌编码表2产生随机数R0的方法用扑克牌产生随机数R0的步骤如下:a)在开始使用时,应彻底地洗牌、切牌4次以上。
b)经彻底洗牌、切牌以后,翻开最上面的一张,并记下一个数码,这相当于得到一个随机数字。
C)按照所需随机数的位数重复以上过程,即可获得所需的随机数。
如果需要两位数的随机数,就把两次切洗后得到的数码组成一组;如果需要三位数的随机数,就把三次切洗后得到的数码组成一组。
依此类推,就可以得到我们所需要的任意位长的随机数。
注:在生成随机数的过程中,每次必须把抽出的牌放回去,并经过彻底切洗以后才能抽取下一张牌。
3扑克牌法示例设批量N=90,样本量n=5,试对其进行随机抽样。
将批中的单位产品按自然数从“ 1”开始顺序编号到90。
用扑克牌获得随机数 R 0 并读取样本单元编号 R 。
a) 若抽出的第一个随机数 R 0=23, 则取 R=R 0=23; b) 若抽出的第二个随机数R 0=08, 则取 R=Ro=8; c) 若抽出的第三个随机数 R 0=23, 则应舍弃重抽; d) 若抽出的第三个随机数R 0=40, 则取 R=R 0=40; e) 若抽出的第四个随机数 R 0=12, 则取 R=Ro=12; f) 从批中取出编号为 8、 12、23、 若抽出的第五个随机数则取 R= R 0=85。