第十章 统计、统计案例 第一讲 随机抽样知识梳理·双基自测知识梳理知识点一 总体、个体、样本、样本容量的概念统计中所考察对象的全体构成的集合看做总体,构成总体的每个元素作为个体,从总体中抽取的__一部分个体__所组成的集合叫做样本,样本中个体的__数目__叫做样本容量.知识点二 简单随机抽样一般地,设一个总体含有N 个个体,从中逐个__不放回__地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的__机会都相等__,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法有两种:__抽签法__和__随机数表法__. 知识点三 系统抽样当总体中的个体比较多且均衡时,首先把总体分成均衡的若干部分,然后__按照预先定出的规则__,从每一部分中抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样.系统抽样的步骤一般地,假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体__编号__;(2)确定__分段间隔k __,对编号进行__分段__.当N n (n 是样本容量)是整数时,取k =Nn ;(3)在第1段用__简单随机抽样__确定第一个个体编号l (k ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号__(l +k )__,再加k 得到第3个个体编号__(l +2k )__,依次进行下去,直到获取整个样本.知识点四 分层抽样一般地,在抽样时将总体分成互不交叉的层,然后按照__一定的比例__,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.分层抽样的应用范围:当总体是由__差异明显的几个部分__组成时,往往选用分层抽样的方法.重要结论1.不论哪种抽样方法, 总体中的每一个个体入样的概率都是相同的.2.系统抽样一般也称为等距抽样,入样个体的编号相差分段时间隔k的整数倍.3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.双基自测题组一走出误区1.(多选题)下列结论中正确的是(AB)A.简单随机抽样是从总体中逐个不放回的抽取样本B.系统抽样在起始部分抽样时采用简单随机抽样C.要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平D.抽签法中,先抽的人抽中的可能性大题组二走进教材2.(P100A组T2)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为(B)A.33,34,33 B.25,56,19C.30,40,30 D.30,50,20[解析]因为12528095=255619,所以抽取人数分别为25,56,19.3.(P59T2)某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号,29号,42号学生在样本中,那么样本中还有一个学生的学号是(D) A.10 B.11C.12 D.16[解析]从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.题组三考题再现4.(2018·课标全国Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是__分层抽样__.[解析]因为不同年龄段客户对其服务的评价有较大差异,所以根据三种抽样方法的特点可知最合适的抽样方法是分层抽样.5.(2019·课标全国Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是(C)A.8号学生B.200号学生C.616号学生D.815号学生[解析] 将1 000名学生分成100组,每组10人,则每组抽取的号码构成公差为10的等差数列{a n },由题意知a 5=46,则a n =a 5+(n -5)×10=10n -4,n ∈N *,易知只有C 选项满足题意.故选C .KAO DIAN TU PO HU DONG TAN JIU考点突破·互动探究考点一 简单随机抽样——自主练透例1 (1)(2019·陕西模拟)某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生、6名女生,则下列命题正确的是( A )A .这次抽样可能采用的是简单随机抽样B .这次抽样一定没有采用系统抽样C .这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D .这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率(2)(2019·山西大同)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( A )A .110,110B .310,15C .15,310D .310,310(3)(2020·山西大学附中诊断)某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,…,599,600从中抽取60个样本,如下提供随机数表的第4行到第6行:32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42;84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04;32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号( D ) A .522 B .324 C .535D .578[解析] (1)利用排除法求解.这次抽样可能采用的是简单随机抽样,A 正确;这次抽样可能采用系统抽样,男生编号为1~20,女生编号为21~50,间隔为5,依次抽取1号,6号,…,46号便可,B 错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C 和D 均错误,故选A .(2)在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110.故选A .(3)从第6行第6列开始向右依次读取3个数,依次得到的样本为436,535,577,348,522,578,故选D .名师点拨 ☞(1)简单随机抽样满足:①抽取的个体数有限;②逐个抽取;③不放回抽取;④等可能抽取.(2)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况.考点二 系统抽样——师生共研例2 (1)(2019·甘肃张掖诊断)某校高三科创班共48人,班主任为了解学生高考前的心理状况,将学生按1至48的学号用系统抽样方法抽取8人进行调查若抽到的最大学号为48,则抽到的最小学号为__6__.(2)(2019·湖北模拟)将参加数学竞赛决赛的500名学生编号为:001,002,…,500,采用系统抽样的方法抽取一个容量为50的样本,分组后,在第一组采用简单随机抽样抽得的号码为003.这500名学生分别在三个考点考试,从001到200在第一考点,从201到355在第二考点,从356到500在第三考点,则第三考点被抽中的人数为( A )A .14B .15C .16D .21[解析] (1)系统抽样的抽取间隔为488=6,则48-6×7=6,则抽到的最小学号为6,故答案为6。
(2)由题意可知,将500名学生平均分成50组,每组10人,第k (k ∈N *)组抽到的号码为10(k -1)+3.令356≤10(k -1)+3≤500(k ∈N *),解得37≤k ≤50,则满足37≤k ≤50的正整数k 有14个,故第三考点被抽中的学生人数为14人.故选A .名师点拨 ☞系统抽样的特点(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样.(4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn .如果总体容量N 不能被样本容量n 整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样.〔变式训练1〕(2020·安徽黄山质检)某校高三(1)班共有48人,学号依次为1,2,3,…,48,现用系统抽样的办法抽取一个容量为6的样本.已知学号为3,11,19,35,43的同学在样本中,那么还有一个同学的学号应为( A )A .27B .26C .25D .24[解析] 根据系统抽样的规则——“等距离”时抽取,也就抽取的号码差相等,根据抽出的序号可知学号之间的差为8,所以在19与35之间还有27,故选A .考点三 分层抽样——多维探究角度1 求某层入样的个体数例3 (1)(2019·广西南宁、玉林、贵港等市联考)某学校共有教师300人,其中中级教师有120人,高级教师与初级教师的人数比为5:4.为了解教师专业发展要求,现采用分层抽样的方法进行调查,在抽取的样本中有中级教师72人,则该样本中的高级教师人数为__60__.(2)(2019·宁波一模)调查某高中1 000名学生的身高情况得下表,已知从这批学生中随机抽取1名学生,抽到偏矮男生的概率为0.12,若用分层抽样的方法,从这些学生中随机抽取50名,问应在偏高学生中抽取__11__名.偏矮 正常 偏高 女生/人 100 273 y 男生/人x287z[解析] (1)学校共有教师300人,其中中级教师有120人, ∴高级教师与初级教师的人数为300-120=180人, ∵抽取的样本中有中级教师72人,∴设样本人数为n ,则120300=72n ,解得n =180,则抽取的高级教师与初级教师的人数为180-72=108, ∵高级教师与初级教师的人数比为54, ∴该样本中的高级教师人数为55+4×108=60. 故答案为60.(2)由题意可知x =1 000×0.12=120,所以y +z =220.所以偏高学生占学生总数的比例为2201 000=1150,所以抽50名应抽偏高学生50×1150=11(人).角度2 求总体或样本容量例4 (1)(2020·湖南模拟)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n =( D )A .9B .10C .12D .13(2)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为__808__.[解析] (1)由分层抽样可得,360=n260,解得n =13.故选D .(2)由题意知抽样比为1296,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,故有1296=101N,解得N =808.故填808. 名师点拨 ☞进行分层抽样的相关计算时,常用到的两个关系: (1)样本容量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比等于样本中这两层所抽取的个体数之比__. 〔变式训练2〕(1)(角度1)(2019·广东广州模拟)某公司生产A ,B ,C 三种不同型号的轿车,产量之比依次为234,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n 的样本,若样本中A 种型号的轿车比B 种型号的轿车少8辆,则n =( B )A .96B .72C .48D .36(2)(角度2)某高中计划从全校学生中按年级采用分层抽样方法抽取20名学生进行心理测试,其中高三有学生900人,已知高一与高二共抽取了14人,则全校学生的人数为( C )A .2 400B .2 700C .3 000D .3 600[解析] (1)由题意得29n -39n =-8,∴n =72,故选B .(2)设全校学生人数为n , 由题意可知20n =20-14900,解得n =3 000,故选C .MING SHI JIANG TAN SU YANG TI SHENG名师讲坛·素养提升 分层抽样与概率相结合例 5 (2018·天津高考)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(2)设抽出的7名同学分别用A ,B ,C ,D ,E ,F ,G 表示,现从中随机抽取2名同学承担敬老院的卫生工作.①试用所给字母列举出所有可能的抽取结果;②设M 为事件“抽取的2名同学来自同一年级”,求事件M 发生的概率. [解析] (1)由已知,甲、乙、丙三个年级的学生志愿者人数之比为322,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(2)①从抽出的7名同学中随机抽取2名同学的所有可能结果为{A ,B },{A ,C },{A ,D },{A ,E },{A ,F },{A ,G },{B ,C },{B ,D },{B ,E },{B ,F },{B ,G },{C ,D },{C ,E },{C ,F },{C ,G },{D ,E },{D ,F },{D ,G },{E ,F },{E ,G },{F ,G },共21种.②由(1),不妨设抽出的7名同学中,来自甲年级的是A ,B ,C ,来自乙年级的是D ,E ,来自丙年级的是F ,G ,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A ,B },{A ,C },{B ,C },{D ,E },{F ,G },共5种,所以,事件M 发生的概率P (M )=521.名师点拨 ☞分层抽样与概率相结合的题目是高考的热点,解题时先根据分层抽样确定人数,再利用古典概型求解相应的概率.〔变式训练3〕某中学为了更好地开展社团活动,丰富同学们的课余生活,现用分层抽样的方法从“模拟法庭”“街舞”“动漫”“话剧”四个社团中抽取若干人组成校社团指导小组,有关数据见下表:社团 相关人数 抽取人数模拟法庭 24 a 街舞 30 5 动漫 b 4 话剧12c(1)求a ,b ,c 的值;(2)若从“动漫”与“话剧”社团已抽取的人中选2人担任指导小组组长,求这2人分别来自这两个社团的概率.[解析] (1)由表可知抽取比例为530=16,故a =4,b =24,c =2.(2)设“动漫”社团的4人分别为:A 1,A 2,A 3,A 4;“话剧”社团的2人分别为:B 1,B 2.则从中任选2人的所有基本事件为:(A 1,A 2),(A 1,A 3),(A 1,A 4),(A 2,A 3),(A 2,A 4),(A 3,A 4),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(A 4,B 1),(A 4,B 2),(B 1,B 2)共15个.其中2人分别来自这两个社团的基本事件为:(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(A 4,B 1),(A 4,B 2),共8个.所以这2人分别来自这两个社团的概率P =815.(或这2人分别来自这两个社团的概率P =C 14C 12C 26=815)。