第二章统计一、选择题1.某校有40个班,每班有50人,每班选派3人参加“学代会”,在这个问题中样本容量是().A.40 B.50 C.120 D.1502.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是().A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,8,16,323.某单位有老年人27人,中年人54人,青年人81人,为了调查他们身体状况的某项指标,需从他们中抽取一个容量为36的样本,适合抽取样本的方法是().A.抽签法B.系统抽样C.随机数表法D.分层抽样4.为了解某年级女生的身高情况,从中抽出20名进行测量,结果如下:(单位:cm) 149159142160156163145 150148151156144148149 153143168168152155在列样本频率分布表的过程中,如果设组距为4 cm,那么组数为().A.4 B.5 C.6 D.75.右图是由容量为100的样本得到的频率分布直方图.其中前4组的频率成等比数列,后6组的频数成等差数列,设最大频率为a,在4.6到5.0之间的数据个数为b,则a,b的值分别为().A.0.27,78 B.0.27,83 C.2.7,784 D.2.7,836.在方差计算公式s 2=101[(x 1-20)2+(x 2-20)2+…+(x 10-20)2]中,数字10和20分别表示( ).A .数据的个数和方差B .平均数和数据的个数C .数据的个数和平均数D .数据组的方差和平均数7.某地2004年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,则根据表中的数据,就业形势一定是( ).A .计算机行业好于化工行业B .建筑行业好于物流行业C .机械行业最紧张D .营销行业比贸易行业紧张8.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1. 8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A .300克B .360千克C .36千克D .30千克9.为了考查两个变量x 和y 之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1,l 2,已知两人得的试验数据中,变量x 和y 的数据的平均值都分别相等,且值分别为s 与t ,那么下列说法正确的是( ).A .直线l 1和l 2一定有公共点(s ,t )B .直线l 1和l 2相交,但交点不一定是(s ,t )C .必有直线l 1∥l 2D .直线l 1和l 2必定重合10.工人工资(元)依相应产值(千元)变化的回归方程为yˆ=50+80x ,下列判断正确的是( ).A .产值为1 000元时,工资为130元B .产值提高1 000元时,工资提高80元C.产值提高1 000元时,工资提高130元D.当工资为250元时,产值为2 000元二、填空题:11.某工厂生产A,B,C三种不同型号的产品,产品数量之比依次为2∶3∶5.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号的产品有16件,那么此样本的容量n=___________.12.若总体中含有1 650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除________个个体,编号后应均分为_________段,每段有______个个体.13.管理人员从一池塘内捞出30条鱼,做上标记后放回池塘.10天后,又从池塘内捞出50条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内共有_______条鱼.14.已知x,y之间的一组数据:y与x之间的线性回归方程yˆ=bx+a必过定点_________.15.假设学生在初一和初二数学成绩是线性相关的.若10个学生初一数学分数(x)和初二数学分数(y)如下:初一和初二数学分数间的回归方程为___________.16.一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y(小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是___________.三、解答题:17.某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?18.某单位有118名员工,为了完成本月的生产任务,现要从中随机抽取16人加班.请用系统抽样法选出加班的人员.19.写出下列各题的抽样过程:(1)请从拥有500个分数的总体中用简单随机抽样方法抽取一个容量为30的样本.(2)某车间有189名职工,现在要按1∶21的比例选派质量检查员,采用系统抽样的方法进行.(3)一个电视台在因特网上就观众对某一节目喜爱的程度进行调查,被调查的总人数为12 000人,其中持各种态度的人数如下:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 072打算从中抽取60人进行详细调查,如何抽取?20.有一种鱼的身体吸收水银,水银的含量超过1.00 ppm(即百万分之一)时就会对人体产生危害.在30条鱼的样本中发现的水银含量是:0.07 0.24 0.95 0.98 1.02 0.98 1.37 1.40 0.39 1.021.44 1.58 0.54 1.08 0.61 0.72 1.20 1.14 1.62 1.681.85 1.20 0.81 0.82 0.84 1.29 1.262.10 0.91 1.31(1)用前两位数作为茎,做出样本数据的茎叶图;(2)描述一下水银含量的分布特点;(3)从实际情况看,许多鱼的水银含量超标在于有些鱼在出售之前没有被检查过.那么,这种鱼的水银含量的平均水平都比1.00 ppm大吗?(4)求出上述样本数据的均值和标准差;(5)有多少条鱼的水银含量在均值减加两倍标准差的范围内?第二章统计参考答案一、选择题 1.C解析:样本容量等于40×3=120. 2.B解析:根据系统抽样的规则,1到10一段,11到20一段,如此类推,每段10个号码,那么每一段上都应该有号码.3.D解析:总体是由差异明显的几部分组成的. 4.D解析:由于组距为4 cm ,故可分组为142~146,146~150,150~154,154~158,158~162,162~166,166~170.5.A解析:由题意共有100个人.前4组频率成等比数列,由图知:第一组频率为0.01;第二组频率为0.03;所以a =0.27.前3组有100×(0.01+0.03+0.09)=13人,后6组共87人,6组人数成等差数列,所以首项为27,s 6=87,得d =-5,s 4=78,即b =78.6.C解析:对照公式s 2=∑=ni i x -x n121)(即可知道.7.B解析:从表中可以看出,计算机行业应聘人数与招聘人数都比较多,但录用率约占58%.化工行业招聘名额70 436虽少,但应聘它的人数少于应聘贸易行业的人数(65 280),录用率大于58%,故A 不正确.对于建筑行业,应聘人数少于招聘人数,显然好于物流行业.机械行业录用率约46%,但物流、贸易招聘人数未知,无法比较得出机械行业最紧张.营销行业招聘人数与应聘人数的比约为1∶1.5,但贸易行业招聘数不详,无法比较.8.B解析:从草鱼240尾,中任选9尾,这9尾鱼具有代表性,由此可由样本估计总体的情况.9尾鱼中每尾鱼的平均质量为x =91(1.5+1.6+1.4+1.6+1.3+1.4+1.2+1.7+1.8)=1.5(千克),240×1.5=360(千克). 9.A解析:线性回归直线方程为yˆ=a +bx ,而a =x b y -,即a =t -bs ,t =a +bs . ∴(s ,t )在回归直线上,即直线l 1和l 2必有公共点(s ,t ). 10.B解析:回归直线斜率为80,所以x 每增加1,yˆ增加80,即劳动生产率提高1千元时,工资提高80元.二、填空题: 11.答案:80. 解析:n =216×(2+3+5)=80. 12.答案:5;35;47. 解析:1 650除以35商 47余5, ∴ 剔除5个个体.分为35段,每段47个个体. 13.答案:750. 解析:30×250=750 (条). 14.答案:(1.167 5,2.392 5). 解析:必过四组数据的平均数, 即(1.167 5,2.392 5).15.答案:yˆ=1.218x -14.191. 解析:代入求a ,b 值的公式,解得 y ˆ=1.218x -14.191. 16.答案:y ˆ=0.118 1+0.003 585x . 解析:∑∑===-==10121018602971)(762101i ii ix x ,xx ,6534))((85.2101=--=∑=i iiy y x x ,y .三、解答题:17.[解析] 简单随机抽样一般采用两种方法:抽签法和随机数表法.解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00,01,…,99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个随机数为68,34,30,13,70,55,74,77,40,44,这10个号即所要抽取的样本号.18.解析:(1)对这118名员工进行编号; (2)计算间隔k =16118=7.375, 由于k 不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样.例如我们随机剔除了3,46,59,57,112,93这6名员工,然后再对剩余的112位员工进行编号,计算间隔k =7;(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.19.解析:(1)①将总体的500个分数从001开始编号,一直到500号; ②从随机数表第1页第1行第2至第4列的347号开始使用该表; ③抄录入样号码如下:347 437 386 469 011 410 145 073 245 276 329 050 176 099 061 030 227 482 378 096 164 001 068 047 025 212 016 105 443 212 ④按以上编号从总体中将相应的分数提取出来组成样本,抽样完毕. (2)采取系统抽样.189÷21=9,所以将189人分成9组,每组21人,在每一组中随机抽取1人,这9人组成样本.(3)采取分层抽样.总人数为12 000人,12 000÷60=200, 2004352=12…35(人),2005674=22…167(人), 2009263=19…126(人),2000721=5…72(人). 所以从很喜爱的人中剔除35人,再抽取12人;从喜爱的人中剔除167人,再抽取22人;从一般喜爱的人中剔除126人,再抽取19人;从不喜爱的人中剔除72人,再抽取5人.20.解析:(1)茎叶图为:(2)汞含量分布偏向于大于1.00 ppm的方向,即多数鱼的汞含量分布在大于1.00 ppm的区域.(3)不一定.因为我们不知道各批鱼的汞含量分布是否都和这批鱼相同.即使各批鱼的汞含量分布相同,上面的数据只能为这个分布作出估计,不能保证平均汞含量大于1.00 ppm.(4)样本平均数x≈1.08,样本标准差s≈0.45.(5)有28条鱼的汞含量在平均数与两倍标准差的和(差)的范围内.。