抽样方法-课文知识点解析1.常用抽样方法:简单随机抽样、分层抽样和系统抽样.2.简单随机抽样一般地,从总体中抽取一定量的样本,在抽取过程中要保证每个个体被抽到的概率相同,这样的抽样方法叫简单随机抽样.通常采用抽签法和产生随机数字的方法(利用工具产生随机数). (1)抽签法抽签法的实施步骤:a.给调查对象群体(共有N个)中的每个对象编号(号码可以从1到N).b.准备“抽签”工具(签可以是纸条、卡片或小球),实施“抽签”.先把号码写在形状、大小相同的签上,然后把签放在同一个箱子里,进行均匀搅拌,每次从中抽出一个签,连续抽n次,就得到一个容量为n的样本.c.对样本中的每一个体进行测量或调查,得到数据,通过分析数据得出结论.例如:请用抽签法设计一个调查方案,调查你所在学校学生喜欢体育活动的情况.(以总体数量为N)抽取n个样本为例.第一步,给全体同学编号,号码从1到N;第二步,准备N个大小、形状相同的签,把号码(1~N)写在签上,每次抽取一个签,连续抽n次,就得到一个容量为n的样本;第三步,对样本中的每一个体进行调查.可设计一个问卷,如下. 你对体育活动的喜欢程度A.喜欢B.一般C.不喜欢说明:只准选择一个答案.然后请抽取的几个同学如实填写问卷,统计出数据,填入下表.由样本情况估计全校所有同学喜欢体育活动的情况,从而得出调查结论,写出调查报告.(2)产生随机数把总体中的N个个体依次编上0,1,2,…,N-1的号码,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,…,N-1中的随机数,产生的随机数是几,就选几号个体,直到抽到预先规定的样本数.利用转盘或摸球产生随机数,这种方法大家都比较熟悉,并且简便易行,尤其当总体容量不大时.这种方法的缺点是当总体容量很大时,制作转盘和进行摸球就比较困难了.利用随机数表产生随机数,是其中最重要、最常用的一种方法.下面举例说明如何利用随机数表来抽取样本.为了检验某种产品的质量,决定从40件产品中抽取10件进行检查.在利用随机数表抽取这个样本时,可按下面步骤进行. 全析提示我们知道要做到绝对地随机抽取样本非常困难,因此在抽样过程中尽可能避免人为因素的影响,而抽签法和产生随机数字法恰好具备此特点.抽签法最大的优点是简便易行,但此种方法不宜适用于总体数量较大的对象,一般适用于个体数量较少的对象.要点提炼一个调查方案的设计一定要科学、合理,要易于操作,易得出数据便于统计;问卷的设计更要具有科学性,选项要全面、合理.通过调查方案的设计和实施,有利于提高同学们的思维、逻辑、组织和实践能力,这也符合素质教育的要求.全析提示利用抽签法抽取样本时,编号应从1开始;而利用随机数抽取样本时,编号应从0开始.利用随机数表产生随机数是最常用的产生随机数的方法,要掌握此种方法的步骤.表3-17816 6572 0802 6314 0702 4369 9728 0198 3204 9243 4935 8200 3623 4869 6938 7481 2976 3413 2841 4241 2424 1985 9313 2322 8303 9822 5888 2410 1158 2729 6443 2943 5556 8526 6166 8231 2438 8455 4618 44452635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 5379 7076 2694 2927 4399 5519 8106 85019264 4607 2021 3920 7766 3817 3256 1640 5858 7766 3170 0500 2593 0545 5370 7814 2889 6628 6757 8231 1589 0062 0047 3815 5131 8186 3709 4521 6665 5325 5383 2702 9055 7196 2172 3207 1114 1384 4359 44887900 5870 2602 8813 5509 4324 0030 4750 3693 9212 0557 7369 7162 9568 1312 9438 0380 3338 0138 4560 4230 6496 3806 0347 0246 4469 9719 8316 1285 0357 2389 2390 7266 0081 6897 2851 4666 0620 4596 34009312 4779 5737 8918 4550 3994 5573 9229 6111 6098 0965 7352 6847 3034 9977 3770 2310 4476 9148 0679 2662 2062 0522 9234 9826 8857 8675 6642 5471 8820 4308 2105 6703 8248 6064 6962 0053 8188 6494 45091110 9486 6533 3954 1944 1516 1682 3404 9651 1456 5613 0357 4244 3341 9605 3567 8350 5728 4338 0824 7899 1307 5814 8688 6982 5126 7736 3383 6215 3441 8578 2277 6490 7644 7085 8361 5662 4141 9877 37478570 2150 8140 4355 5321 2548 0208 7543 9169 0408 4353 6122 8913 9930 4169 6032 2127 0162 6176 4969 8185 9312 8748 8575 8090 9872 1968 0263 0081 2662 6831 3106 2959 9011 1448 4346 7019 8148 1557 8400第一步,先将40件产品编号,可以编为00,01,02, (38)39;全析提示用随机数表产生随机数分三步,一第二步,在随机数表中任选一个数开始,由于总体的编号是两位数,我们可以一次选取其中的两列,组成一个两位数.我们从附表的第17列和第18列的第2行开始选数;第三步,从选定的数36开始,得到第一个两位数,将它取出;继续向下读,由上至下分别是24,11,24,16,76,70,29,43,77,25,15,66,11,55,71,42,12,46,45,68,26,54,00,…其中24,11重复出现,76,70,43,77,66,55,71,42,46,45,68,54超过39,不能选取,这样选取的10个样本的编号分别为36,24,11,16,29,25,15,12,26,00.课本例1,严格地按照用随机数表产生随机数的步骤进行的.在选数的过程中,是从表3-1中第6列和第7列这两列的第4行开始,由上至下的顺序进行选数的.事实上,定位置和选数的顺序是任意的.下面我们用另外一种顺序选取10个样本.第一步,将总体中的每个个体进行编号:00,01,02,…,79; 第二步,由于总体是一个两位数的编号,每次要从随机数表中选取两列组成两位数.从随机数表中任意一个位置,比如从表3-1中第1列和第2列这两列的第三行开始选数,由左至右分别是29,76,34,13,28,41,42,41,24,24,19,85,93,13,23,…其中13,41,24重复出现,83,93超过79,不能选取,这样选取的10个样本的编号分别为29,76,34,13,28,41,42,24,19,23. 3.分层抽样将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中随机抽取一定的样本,这种抽样方法通常叫做分层抽样,有时也称为类型抽样.例如教材中的问题2,如若用简单随机抽样,则抽到的15个样本很可能不能按照它们的家数之比抽取,这样得到的数据就不能真实地反映情况,误差很大;为了避免这种情况,我们按照大型、中型、小型的比例,从100家大型商店中抽出1个代表,从500家中型商店中抽出5个代表,从900家小型商店中抽出9个代表. 再例如,一个单位有职工500人,其中不到35岁的有125人,35岁~49岁的有280人,50岁以上的有95人.为了了解这个单位职工身体状况有关的某项指标,要从中抽取一个容量为100的样本.由于职工年龄与这项指标有关,决定采用分层抽样的方法进行抽取.因为样本容量与总体个数的比为 100∶500=1∶5,所以在各年龄段抽取的个体数依次是 5125,5280,595,即25,56,19.在各年龄段分别抽取时,可采用简单随机抽样,将各年龄段抽取的个体合在一起,就是所要抽取的样本.是编号;二是定位置;三选数.定住位置后,读数的方向可以向右,也可以向左、向上、向下等.取数过程中,要把不符合要求的数(超过最大编码)和与前面重复的数去掉.利用随机数表选取样本的一般步骤:①编号;②定位;③选数.选数过程中,重复的数字只取一个,超过最大编号的数不能取.思维拓展定位置是任意的,选数的顺序是任意的,没有任何约束,所以选取的样本的编号可以是多种多样的,并不唯一.全析提示当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占比例进行抽样.由于分层抽样充分地利用了我们所掌握的信息,使样本具有较好地代表性,而在各层中进行抽样时,大多数情况下采用简单随机抽样,有时也会用到其他方法,这样需根据问题的需要来决定.本例符合分层抽样的特点和适用范围.课本例2,显然不同类型的农田之间的产量有较大差异,也就是说,总体由差异明显的几部分组成,故采用分层抽样的方法,对不同类型的农田按其总数的比例来抽取.假设本例中共有农田500亩,山地、丘陵、平原和洼地各占农田总数的10%、20%、40%和30%,欲抽取50亩进行产量调查,则应抽取5亩山地、10亩丘陵、20亩平原和15亩洼地.课本例3,由于不同层次管理人员的收入差异很大,故采取分层抽样的方法.不同层抽取样本的数目等于抽取样本总数与不同层次管理人员所占总体比例的积,所以应抽取:高层管理人员:100×5%=5(人),中层管理人员:100×15%=15(人),一般员工:100×80%=80(人).4.系统抽样系统抽样是将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按照相同的间隔(称为抽抽样距)抽取其他样本,这种抽样方法有时也叫等距抽样或机械抽样.例如,为了了解参加某种知识竞赛的1000名学生的成绩,打算从中抽一个容量为50的样本.假定这1000名学生的编号是1,2,…,1000,由于50∶1000=1∶20,我们将总体分成50个部分,其中每一部分包括20个个体,例如第一部分的编号是1,2,3,…,20,然后在第一部分随机抽取一个号码,比如它是18号,那么可以从第18号起,每隔20个抽取一个号码,这样得到了一个容量为50的样本,它们的号码分别是:18,38,58,…,978,998.由于总体中的个体数1000正好能被样本容量整除,可以用它们的比值作为抽样距.如果不能整除,比如总体中的个数为1003,样本容量仍为50,这时可先用简单随机抽样先从总体中剔除3个个体,使剩下的个体数1000能被50整除,然后再按系统抽样法往下进行.在抽样时,如果总体的排列存在明显的周期性或者事先是排好序的,那么利用系统抽样进行抽样时将会产生明显的偏差,因为这样抽取的样本不具有代表性.如课本P20思考交流中的两个问题,第一个问题中,抽取的样本不具备代表性,身体偏高;第二个问题中,采取这样的抽样方法,只对周一的交通流量进行了统计,无法代表一个月的状况,只要改变抽样距,如抽样距改为6,就可以了.课本例4,由于总体个体数太大,又无明显的层次差异,所以不能采用简单随机抽样和分层抽样,采用系统抽样是比较合适的.课本给出了系统抽样的一般步骤,要严格地按步骤进行抽样.第一步,确定分段情况,所抽取样本数就是需要分的段数,应为50;确定抽样距,抽样距=总体个体数/抽取样本数=10000/50=200;第二步,按顺序进行编号;要点提炼采用分层抽样时,不同层次所选取的样本数=抽取样本总数×该层所占总体的比例.全析提示当总体容量和样本容量都很大时,采用简单随机抽样或分层抽样,都是非常麻烦的,系统抽样正好能解决这个问题.要点提炼用系统抽样抽取一定容量的样本时,首先要分清总体中的个数是否能被样本容量整除,否则就会出现抽样距不等的情况,就不合乎系统抽样的原则.全析提示在利用系统抽样进行抽样时,要注意总体的排列有没有明显的周期性,这时抽样距的选取要恰当,要打乱周期性;如果总体事先排好序,要先打乱顺序,再抽样,以达到抽取的样本具有广泛的代表性.系统抽样的步骤:①确定分段情况和抽样距;②编号;③确定第一个样本编号;④等距抽样.在确定第一个样本编号时,一定要采用简单随机抽样,并且一定要在第一段内抽取,否则无法保证等距抽样.对于系统抽样,经常遇见的两种情况要加以区分,以避免不必要的麻烦.第三步,采用简单随机抽样从第一个时间段抽取第一个样本;第四步,等距抽样,顺序抽取相应编号的样本.课本例5,本例与例4的不同之处在于,总体个体数不能被样本总数整除,这时可把商作为抽样距,余数得通过简单随机抽样从总体中剔除,对剩余进行编号,其余完全同例4.5.三种抽样方法的比较上面介绍了简单随机抽样、分层抽样和系统抽样.下面通过列表将它们作一个简单的比较.三种抽样方法的比较熟悉三种抽样方法各自的特点和适用范围,以便针对不同的实际问题,采取不同的抽样方法.。