考点测试55 用样本估计总体高考概览高考在本考点的常考题型为选择题、填空题,分值为5分,中、低等难度 考纲研读1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点2.理解样本数据标准差的意义和作用,会计算数据的标准差3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释 4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题一、基础小题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60 答案 B解析 根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,所以该班的学生人数是150.3=50.故选B .2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16 答案 D解析 设中间一组的频数为x ,依题意有x 80=141-x80,解得x =16.3.研究人员随机调查统计了某地1000名“上班族”每天在工作之余使用手机上网的时间,并将其绘制为如图所示的频率分布直方图,若同一组数据用该区间的中点值作代表,则可估计该地“上班族”每天在工作之余使用手机上网的平均时间是( )A.1.78小时 B.2.24小时C.3.56小时 D.4.32小时答案 C解析(1×0.12+3×0.2+5×0.1+7×0.08)×2=3.56.4.对于一组数据x i(i=1,2,3,…,n),如果将它们改变为x i+C(i=1,2,3,…,n),其中C≠0,则下列结论正确的是( )A.平均数与方差均不变B.平均数变,方差保持不变C.平均数不变,方差变D.平均数与方差均发生变化答案 B解析由平均数的定义,可知每个个体增加C,则平均数也增加C,方差不变.故选B.5.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数8.38.88.88.7x方差s23.53.62.25.4从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( ) A .甲 B .乙 C .丙 D .丁 答案 C解析 由表格中数据,可知丙平均环数最高,且方差最小,说明丙技术稳定,且成绩好.选C .6.某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品长度的中位数为( )A .20B .25C .22.5D .22.75 答案 C解析 自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x ,则由0.1+0.2+0.08·(x -20)=0.5,得x =22.5.选C .7.甲、乙两名同学在7次数学测试中的成绩如茎叶图所示,其中甲同学成绩的众数是85,乙同学成绩的中位数是83,则成绩较稳定的是________.答案 甲解析 根据众数及中位数的概念易得x =5,y =3,故甲同学成绩的平均数为78+79+80+85+85+92+967=85,乙同学成绩的平均数为72+81+81+83+91+91+967=85,故甲同学成绩的方差为17×(49+36+25+49+121)=40,乙同学成绩的方差为17×(169+16+16+4+36+36+121)=3987>40,故成绩较稳定的是甲.二、高考小题8.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A解析设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.9.(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56 B.60 C.120 D.140答案 D解析由频率分布直方图,知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D.10.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数 答案 B解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B .11.(2018·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.答案 90解析 由茎叶图可知,5位裁判打出的分数分别为89,89,90,91,91,故平均数为89+89+90+91+915=90.三、模拟小题12.(2018·山东济南一模)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( )A .x =4,s 2<2 B .x =4,s 2>2 C .x >4,s 2<2 D .x >4,s 2>2 答案 A解析 ∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴x =28+48=4;又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s2=7×2+4-428=74<2.故选A . 13.(2018·河北石家庄教学质量检测)某学校A ,B 两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;④B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.其中正确结论的编号为( )A .①④B .②③C .②④D .①③ 答案 A解析 A 班兴趣小组的平均成绩为53+62+64+…+92+9515=78,其方差为115×[(53-78)2+(62-78)2+…+(95-78)2]=121.6,则其标准差为121.6≈11.03;B 班兴趣小组的平均成绩为45+48+51+…+9115=66,其方差为115×[(45-66)2+(48-66)2+…+(91-66)2]=175.2,则其标准差为175.2≈13.24.故选A .14.(2018·湖南衡阳二模)已知样本x 1,x 2,…,x n 的平均数为x ;样本y 1,y 2,…,y m 的平均数为y (x ≠y ),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m (n ,m ∈N *)的大小关系为( )A .n =mB .n ≥mC .n <mD .n >m 答案 C解析 由题意得z =1n +m (nx +my )=n n +m x +1-n n +m y ,∴a =n n +m ,∵0<a <12,∴0<n n +m<12,又n ,m ∈N *,∴2n <n +m ,∴n <m .故选C .一、高考大题1.(2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用 水量 [0, 0.1) [0.1, 0.2) [0.2, 0.3) [0.3, 0.4) [0.4, 0.5) [0.5, 0.6) [0.6, 0.7] 频数 13249265使用了节水龙头50天的日用水量频数分布表日用 水量 [0, 0.1) [0.1, 0.2) [0.2, 0.3) [0.3, 0.4) [0.4, 0.5) [0.5, 0.6] 频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).2.(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如右频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 样本中分数在区间[40,50)内的人数为100-100×0.9-5=5, 所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60×12=30,所以样本中的男生人数为30×2=60, 女生人数为100-60=40,所以样本中男生和女生人数的比例为60∶40=3∶2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2.3.(2016·四川高考)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解(1)由频率分布直方图,知月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5a+0.20+0.26+0.5a+0.06+0.04+0.02=1.解得a=0.30.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.二、模拟大题4.(2018·南昌二模)某地区为了解学生学业水平考试的状况,从参加学业水平考试的学生中抽出160名,其数学成绩(均为整数)的频率分布直方图如图所示.(1)估计这次考试数学成绩的平均分和众数;(2)假设在(90,100]段的学生中有3人得满分100分,有2人得99分,其余学生的数学成绩都不相同.现从90分以上的学生中任取2人,求这两人成绩相同的概率.解(1)利用中值估算抽样学生数学成绩的平均分为45×0.005×10+55×0.015×10+65×0.020×10+75×0.030×10+85×0.025×10+95×0.005×10=72(分).众数的估计值为75分.(2)由频率分布直方图知,在160人中,90分以上的学生数为160×0.005×10=8(人).设“从8人中任取2人,这2人成绩相同”为事件A,记这8人编号为1,2,3,4,5,6,7,8,其中4号和5号成绩为99分,6号、7号、8号的成绩为100分.由题意,从8人中任取2人,基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(1,8),(2,3),(2,4),(2,5),(2,6),(2,7),(2,8),(3,4),(3,5),(3,6),(3,7),(3,8),(4,5),(4,6),(4,7),(4,8),(5,6),(5,7),(5,8),(6,7),(6,8),(7,8),共28个,其中事件A所包含的基本事件的个数为4,由古典概型的概率公式得所求概率P(A)=428=17.5.(2018·福州毕业质检)某技术公司新开发一种产品,分别由A,B两条生产线生产.为了检测该产品的某项质量指标值(记为Z),现随机抽取这两条生产线的产品各100件,由检测结果得到如下频率分布直方图:(1)该公司规定:当Z≥76时,产品为正品;当Z<76时,产品为次品.试估计A,B两条生产线生产的产品正品率分别是多少?(2)分别估计A,B两条生产线的产品质量指标值的平均数(同一组数据中的数据用该组区间的中点值作代表),从平均数结果看,哪条生产线的质量指标值更好?(3)根据(2)的结果,能否认为该公司生产的产品符合“质量指标值不低于84的产品至少要占全部产品40%”的规定?解(1)由频率估计概率,A生产线的产品为正品的概率为(0.05375+0.03500+0.01125)×8=0.8;B生产线的产品为正品的概率为(0.06250+0.03375+0.00250)×8=0.79.(2)设A生产线的产品质量指标值的平均数为x,B生产线的产品质量指标值的平均数为y,由频率分布直方图,可得x=64×0.05+72×0.15+80×0.43+88×0.28+96×0.09=81.68,y=64×0.05+72×0.16+80×0.5+88×0.27+96×0.02=80.4,由以上计算结果可得x>y,因此A生产线的产品质量指标值更好.(3)由(2)知,A生产线的产品质量指标值更高,它不低于84的产品所占比例的估计值为(0.03500+0.01125)×8=0.37<0.4,所以B生产线的产品质量指标值的估计值也小于0.4,故不能认为该公司生产的产品符合“质量指标值不低于84的产品至少要占全部产品40%”的规定.如有侵权请联系告知删除,感谢你们的配合!。