随机抽样
知识讲解
一、统计中的相关概念
总体:所考察对象的某一数值指标的全体构成的集合看作总体.
个体:构成总体的每一个元素作为个体.
样本:从总体中抽出若干个体所组成的集合叫做样本.
样本容量:样本中个体的数目叫样本容量.
统计的基本思想方法:用样本估计总体,即通常不去直接去研究总体,而是通过从总体中随机抽取一个样本,根据样本的情况去估计总体的相应情况.
二、简单随机抽样
1.简单随机抽样的概念
概念:一般地,从元素个数为N的总体中不放回地抽取容量为n样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.
2.简单随机抽样的特点
1)被抽取样本的总体的个数有限;
2)从总体中逐个地进行抽取,使抽样便于在实践中操作;
3)它是不放回抽样,使其具有广泛的应用性;
4)它是等可能抽样,每个个体被抽到的可能性都是n
N
,保证了抽样方法的公平性.
3.常用的简单随机抽样方法
1)抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一张号签,连续抽取n次,就得到一个容量为n的样本.
抽签法的步骤:
a.编号,即给总体中的所有个体编号,号码可以从1到N.
b.制签,即将1~N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作)
.c搅拌均匀,即将号签放在一个不透明的容器中,搅拌均匀.
.d逐个不放回抽取,即从容器中每次抽取一个号签,并记录其编号,连续抽取n次.
抽签法的优缺点:
.a优点:简单易行.
.b缺点:当总体的容量非常大时,费时、费力又不方便.况且,如果号签搅拌的不均匀,可能导致抽样的不公平.
2)随机数表法:随机数表是由0,1,2,,9这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同.通过,随机数表,根据实际需要和方便使用的原则,将几个数组合成一组,然后通过随机数表抽取样本.
随机数表法的步骤:
.a编号,即将总体中的所有个体进行编号(每个号码位数一致);
.b在随机数表中任选一个数作为起始号码;
.c从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过,若再编号中,则取出,如果得到的号码前面已经取出,也跳过,如此继续下去,直到取满为止;
随机数表法的优缺点:
.a优点:简单易行,它很好的解决了用抽签法当总体中的个体数较多时制签难的问题.
.b缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数表法抽取仍不方便.
4.简单随机抽样的应用
应用:常用的简单随机抽样方法有抽签法和随机数表法.抽签法一般适用于容量较小的总体,易于操作;随机数表法解决了制签比较麻烦的问题,但在利用“随机数表法”进行简单随机抽样时,要严格按照课本中介绍的步骤,否则易出错误.结合具体的问题,我们应灵活使用这两种方法.
三、系统抽样
1.系统抽样的概念
概念:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样.(由于抽样样的间隔相等,因此系统抽样也被称作等距抽样)
2.系统抽样的步骤:
1)编号,即将总体中的个体编号.为方便起见,也可直接利用个体所带有的号码,如准考证号、门牌号等;
2)分段,即为将整个的编号进行分段,要确定分段的间隔k.当N
n
是整数时,N
k
n
=;当
N
n
不是整数时,
则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数'N能被n整除,这时'N
k
n
=.3)确定起始个体编号,即由数字1~k中随机抽取一个数S.
4)按照预先确定的规则抽取样本,即通常是将S依次加上间隔k的倍数,这样样本的编号依次是:,,2,,(1).
S S k S k S n k
+++-
3.系统抽样的公平性
当N
n 是整数时,N
k
n
=;当
N
n
不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使
剩下的总体中个体个数'N能被n整除,这时'N
k
n
=,上述过程中,总体的每个个体被剔除的可能性相同,也就是说每个个体不被剔除的可能性相同,所以在整个抽样过程中每个个体抽取的可能性仍然相同.
4.系统抽样的特点
1)适用于总体容量较大的情况;
2)剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;
3)它是等可能抽抽样,每个个体被抽到的可能性都是n
N .
四、分层抽样
1.分层抽样的概念
概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,我们经常将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这样的抽样方法叫做分层抽样.
2.分层抽样的步骤
1)分层,即将总体中各个个体按某种特征分成若干个互不重叠的几部分;
2)按比例确定每层抽取个体的个数;
3)各层抽样,即各层中采用简单随机抽样或系统抽样抽取相应的个数;
4)汇合成样本.
3.分层抽样的特点
1)适用于总体由差异明显的几部分组成的情况;2)更充分的反映了总体的情况;
3)它是等可能抽样,每个个体被抽到的可能性都是n
N .
五、三种抽样方式的区别与联系
典型例题
一.选择题(共5小题)
1.(2015•湖北)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()
A.134石B.169石C.338石D.1365石
2.(2014•重庆)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100 B.150 C.200 D.250
3.(2014•广东)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()
A.50 B.40 C.25 D.20
4.(2014•湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为P1,P2,P3,则()
A.P1=P2<P3B.P2=P3<P1C.P1=P3<P2D.P1=P2=P3
5.(2013•湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()
A.9 B.10 C.12 D.13
二.填空题(共2小题)
6.(2017•江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.
7.(2012•江苏)某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取名学生.三.解答题(共3小题)
8.从2开始的200个偶数,即2、4、6、8…400中,用系统抽样的办法抽取20个偶数作样本.
9.某校组织高一学生对所在市的居民中拥有电视机、电冰箱、组合音响的情况进行一次抽样调查,调查结果:3户特困户三种全无;有一种的:电视机1090户,电冰箱747户,组合音响850户;有两种的:电视机、组合音响570户,组合音响、电冰箱420户,电视机、电冰箱520户;“三大件”都有的265户.调查组的同学在统计上述数字时,发现没有记下被调查的居民总户数,你能避免重新调查而解决这个问题吗?
10.某地区工人的平均工资是15元/小时,标准差为4元/小时.若从该地区抽取n=50个工厂,问所取得样本的平均工资的期望和方差各是多少?平均工资的抽样分布是什么?。