统计案例一、选择题1.(2018·长春一模)完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是( )A .①简单随机抽样,②系统抽样B .①分层抽样,②简单随机抽样C .①系统抽样,②分层抽样D .①②都用分层抽样答案:B解析:因为社会购买能力的某项指标受到家庭收入的影响,而社区中各个家庭收入差别明显,所以①用分层抽样法;从某中学的15名艺术特长生中选出3名调查学习负担情况,个体之间差别不大,且总体和样本容量较小,所以②用简单随机抽样法,故选B.2.(2018·贵州遵义联考)某校高三年级有1 000名学生,随机编号为0001,0002,…,1 000.现按系统抽样方法,从中抽出200人,若0122号被抽到了,则下列编号也被抽到的是( )A .0927B .0834C .0726D .0116答案:A解析:系统抽样就是等距抽样,被抽到的编号满足0122+5k ,k ∈Z .因为0927=0122+5×161,故选A.3.(2018·江西九校联考(一))一组数据共有7个数,其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数据的平均数、中位数、众数依次成等差数列,则这个数的所有可能值的和为( )A .3B .17C .-11D .9答案:D解析:设这个数是x ,则平均数为25+x 7,众数为2,若x ≤2,则中位数为2,此时x =-11,若2<x <4,则中位数为x ,此时2x =25+x 7+2,所以x =3,若x ≥4,则中位数为4,此时8=25+x 7+2,所以x=17,所以这个数的所有可能值的和为(-11)+3+17=9.4.(2017·新课标全国卷Ⅲ,3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案:A解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A 错误.5.(2018·山西长治四校联考)某班组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60答案:B 解析:由题图可知,数据落在[20,40),[40,60)内的频率为(0.005+0.010)×20=0.3,∴该班的学生人数是150.3=50.6.(2018·云南曲靖一中月考)下表是x,y的对应数据,由表中数^^相应的y^为()A.38 B.43C.48 D.52答案:B解析:由表中数据,得x=25,y=15.∵回归直线必过点(x,y),∴15=0.8×25-a^,解得a^=5,∴线性回归方程为y^=0.8x-5.∴当x=60时,相应的y^=0.8×60-5=43.7.某赛季甲、乙两名篮球运动员各13场比赛得分情况用茎叶图表示如下:根据上图,对这两名运动员的成绩进行比较,下列四个结论中不正确的是()A.甲运动员得分的极差大于乙运动员得分的极差B.甲运动员得分的中位数大于乙运动员得分的中位数C.甲运动员得分的平均值大于乙运动员得分的平均值D.甲运动员的成绩比乙运动员的成绩稳定答案:D解析:根据茎叶图可知,甲运动员的13场比赛得分分别为19,18,18,26,21,20,35,33,32,30,47,41,40;乙运动员的13场比赛得分分别为17,17,19,19,22,25,26,27,29,29,30,32,33.对于A,极差是数据中最大值与最小值的差,由茎叶图中的数据可得甲运动员得分的极差为47-18=29,乙运动员得分的极差为33-17=16,故甲运动员得分的极差大于乙运动员得分的极差,因此A正确;对于B,甲运动员的得分从低到高依次为18,18,19,20,21,26,30,32,33,35,40,41,47,处于中间的数是30,所以甲运动员得分的中位数是30,同理得乙运动员得分的中位数是26,因此甲运动员得分的中位数大于乙运动员得分的中位数,故B正确;对于C,不难得出甲运动员得分的平均值约为29.2,乙运动员得分的平均值为25,因此甲运动员得分的平均值大于乙运动员得分的平均值,故C 正确;对于D ,甲的方差s 2甲≈113×[(19-29.2)2+(18-29.2)2+…+(40-29.2)2]≈88.18,同理,得乙的方差s 2乙≈29.54,因为乙的方差小于甲的方差,所以乙运动员的成绩比甲运动员的成绩稳定,故D 不正确.故选D.8.(2018·沧州一模)某学校为了制订治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调为( )A .0.1%B .0.5%C .99.5%D .99.9%附:K 2=n (ad -bc )2,其中n =a +b +c +d .解析:因为K 2=50×(20×15-5×10)225×25×30×20≈8.333>7.879,所以约有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”.二、填空题9.(2018·江苏南京调研)为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.答案:80解析:时速在区间[40,60)内的汽车有200×(0.01+0.03)×10=80辆.10.(2017·江苏卷,3)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.答案:18解析:∵ 样本容量总体个数=60200+400+300+100=350, ∴ 应从丙种型号的产品中抽取350×300=18(件).11.(2018·济南一模)2017年2月20日,摩拜单车在某市推出“做文明骑士,周一摩拜单车免费骑”活动,为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为________.答案:4解析:由茎叶图得,该组数据分别是87,89,90,91,93,平均数是87+89+90+91+935=90,故方差s 2=15×(9+1+0+1+9)=4.三、解答题12.(2017·新课标全国卷Ⅰ,19)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个经计算得x =116∑i =116x i =9.97,s =116∑i =116 (xi -x )2=116(∑i =116x 2i -16x 2)≈0.212, ∑i =116 (i -8.5)2≈18.439,∑i =116 (xi -x -)(i -8.5)=-2.78,其中xi 为抽取的第i 个零件的尺寸,i =1,2, (16)(1)求(xi ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x -3s ,x +3s )之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(x --3s ,x -+3s )之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi ,yi )(i =1,2,…,n )的相关系数r =∑i =1n(xi -x -)(yi -y -)∑i =1n (xi -x )2∑i =1n(yi -y -)2.0.008≈0.09.解析:本题考查统计问题中的相关系数及样本数据的均值与方差.(1)由样本数据得(xi ,i )(i =1,2,…,16)的相关系数 r =∑i =116(xi -x -)(i -8.5)∑i =116(xi -x -)2 ∑i =116 (i -8.5)2=-2.780.212×16×18.439≈-0.18. 由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(ⅰ)由于x -=9.97,s ≈0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(x --3s ,x -+3s )以外,因此需对当天的生产过程进行检查.(ⅱ)剔除离群值,即第13个数据,剩下数据的平均数为115(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.i =116x 2i =16×0.2122+16×9.972≈1 591.134,剔除第13个数据,剩下数据的样本方差为115(1 591.134-9.222-15×10.022)≈0.008, 这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.。