[高考专项训练]统计与统计案例小题押题16—14⎪⎪统计与统计案例卷别年份考题位置考查内容命题规律分析全国卷Ⅱ2015选择题第3题条形图、两变量间的相关性统计与统计案例部分,抽样方法考查较少,且考查时题目较简单;回归分析与独立性检验在客观题中单独考查时较少;随机抽样、用样本估计总体以及全国卷Ⅲ2017选择题第3题折线图的应用2016选择题第4题统计图表的应用 变量的相关性是命题热点,难度较低.江苏 2018 第3题 平均数、茎叶图考查点一 抽样方法1.(2015·北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )类别 人数老年教师900中年教师1 800青年教师1 600合计4 300A.90B.100 C.180 D.300解析:选C设该样本中的老年教师人数为x,由题意及分层抽样的特点得x900=3201 600,解得x=180.2.(2015·四川高考)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A.抽签法B.系统抽样法C.分层抽样法D.随机数法解析:选C根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为().A.89 B.91C.90 D.900解析:选C考察平均数的计算与茎叶图的转换关系考查点二用样本估计总体4.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数解析:选B标准差能反映一组数据的稳定程度.故选B.5.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为 5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个解析:选D由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B 正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确,故选D.6.(2015·山东高考)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③B.①④C.②③D.②④=解析:选B法一:∵x甲26+28+29+31+315=29,x乙=28+29+30+31+325=30,∴x甲<x乙,又s2甲=9+1+0+4+45=185,s2乙=4+1+0+1+45=2,∴s甲>s乙.故可判断结论①④正确.法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.7.(2014·广东高考)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,10 B.200,10C.100,20 D.200,20解析:选D易知(3 500+4 500+2 000)×2%=200,即样本容量;抽取的高中生人数为2 000×2%=40,由于其近视率为50%,所以近视的人数为40×50%=20.8.(2015·湖北高考)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.解析:(1)由0.1×1.5+0.1×2.5+0.1×a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.答案:(1)3(2)6 000考查点三变量间的相关关系、统计案例9.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.11.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程y^=b^x+a^,其中b^=0.76,a^=y--b^x-.据此估计,该社区一户年收入为15万元家庭的年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元解析:选B由题意知,x=8.2+8.6+10.0+11.3+11.95=10,y=6.2+7.5+8.0+8.5+9.85=8,∴a^=8-0.76×10=0.4,∴当x=15时,y^=0.76×15+0.4=11.8(万元).10.(2014·江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1成绩性别不及格及格总计男61420 女102232 总计163652表2视力性别好差总计男41620女12232总计163652 表3智商性别偏高正常总计男81220 女82432 总计163652表4阅读量性别丰富不丰富总计男14620女23032总计163652A.成绩B.视力C.智商D.阅读量解析:选D因为K21=52×(6×22-14×10)2 16×36×32×20=52×8216×36×32×20,K22=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,K23=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,K24=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则有K24>K22>K23>K21,所以阅读量与性别关联的可能性最大.11.(2015·北京高考)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.答案:(1)乙(2)数学重点突破——用样本估计总体的2个常考点考法(一)频率分布直方图与样本的数字特征1.对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图所示,则估计此样本的众数为________.解析:众数是指样本中出现频率最高的数,在频率分布直方图中通常取最高的小长方形底边中点的横坐标,所以众数为2+2.52=2.25.答案:2.252.对一批电子元件进行寿命追踪调查,从这批产品中抽取N个产品(N≥200),得到频率分布直方图如下:(1)图中m的值为________;(2)由频率分布直方图估计这批电子元件寿命的中位数是________.解析:(1)由0.001×100+m×100+0.004×100+0.002×100+m×100=1,得m=0.001 5.(2)设中位数为b,则0.001×100+0.001 5×100+0.004×(b-300)=0.5,解得b=362.5.答案:(1)0.001 5(2)362.53.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)图中a的值为________;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分为________.解析:(1)由(2a+0.02+0.03+0.04)×10=1,解得a=0.005.(2)0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.答案:(1)0.005(2)73[解题方略]从频率分布直方图中得出有关数据的方法(1)频率:频率分布直方图中横轴表示组别(样本的连续可取数值),纵轴表示频率组距,频率=组距×频率组距; (2)频率比:频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比,从而根据已知的几组数据个数比求有关值;(3)众数:最高小长方形底边中点的横坐标;(4)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(5)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和;(6)性质应用:若纵轴上存在参数值,则根据所有小长方形的高之和×组距=1,列方程即可求得参数值.考法(二)茎叶图与样本的数字特征茎叶图在样本数据较少、较为集中且位数不多时应用比较适宜.由于它保留了原始数据,所以不仅可以帮助分析样本的频率分布,还可以用来分析样本数据的一些数字特征,如平均数、众数、方差等.[题组突破]1.(2017·岳阳质检)甲、乙两位歌手在“中国好声音”选拔赛中,5次得分情况如图所示.记甲、乙两人的平均得分分别为x甲,x乙,则下列判断正确的是()甲乙677 588868409 3A.x甲<x乙,甲比乙成绩稳定B.x甲<x乙,乙比甲成绩稳定C.x甲>x乙,甲比乙成绩稳定D.x 甲>x乙,乙比甲成绩稳定解析:选B x甲=76+77+88+90+945=85,x乙=75+88+86+88+935=86,s2甲=15[(76-85)2+(77-85)2+(88-85)2+(90-85)2+(94-85)2]=52,s2乙=15[(75-86)2+(88-86)2+(86-86)2+(88-86)2+(93-86)2]=35.6,所以x甲<x乙,s2甲>s2乙,故乙比甲成绩稳定.2.(2017·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值mn=________.甲 乙7 2 n 9 m 3 2 4 8解析:由茎叶图可知甲的数据为27,30+m,39,乙的数据为20+n,32,34,38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有14(20+n +32+34+38)=33,所以n =8,所以m n =38. 答案:383.(2017·黄山检测)如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1,a 2,则它们的大小关系是________(用“>”表示).甲乙07954551844647m 9 3解析:由题意知去掉一个最高分和一个最低分后,可以求得甲和乙两名选手得分的平均数分别为a1=1+4+5×35+80=84,a2=4×3+6+75+80=85,所以a2>a1.答案:a2>a1[解题方略]从茎叶图中得出有关数据的方法到目前为止,茎叶图中的数据多为两位数(茎叶图中,一位数的“茎”处为数字0),明确每一行中,“茎”处数字是该行数字共用的十位数字,“叶”处数字是个位数字,求解的关键是正确写出茎叶图中的所有数字,再根据平均数、中位数、众数、方差、标准差的概念进行相关计算.失误防范——回归分析中的1个易错点回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(\x\to(x),\x\to(y))点,可能所有的样本数据点都不在直线上.[针对训练]1.(2017·兰州模拟)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x 24568y 345m7根据表中提供的全部数据,用最小二乘法得出y与x的线性回归方程为y^=6.5x+17.5,则表中m的值为()A.45B.50C.55 D.60解析:选D∵x=2+4+5+6+85=5,y=30+40+50+m+705=190+m5,∴当x=5时,y=6.5×5+17.5=50,∴190+m5=50,解得m=60.2.(2017·惠州模拟)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):零件数x/个12345加工时间y/分钟6268758189由最小二乘法求得回归方程y^=0.67x+a^,则a^的值为________.解析:因为x=10+20+30+40+505=30,y=62+68+75+81+895=75,所以回归直线一定过样本点的中心(30,75),则由y^=0.67x+a^可得75=30×0.67+a^,求得a^=54.9.答案:54.91.(2017·南京模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么n=()A.860B.720C.1 020 D.1 040解析:选D根据分层抽样方法,得1 2001 000+1 200+n×81=30,解得n=1 040.2.(2017·天津渤海一中质检)有一个食品商店为了调查气温对热饮销售的影响,经过调查得到关于卖出的热饮杯数与当天气温的数据如下表,绘出散点图如下.通过计算,可以得到对应的回归方程y^=-2.352x+147.767,根据以上信息,判断下列结论中正确的是()摄氏温度-504712151923273136热1515131213111089756028064936 4 饮杯数A.气温与热饮的销售杯数之间成正相关B.当天气温为2 ℃时,这天大约可以卖出143杯热饮C.当天气温为10 ℃时,这天恰卖出124杯热饮D.由于x=0时,y^的值与调查数据不符,故气温与卖出热饮杯数不存在线性相关性解析:选B当x=2时,y^=-2×2.352+147.767=143.063,即这天大约可以卖出143杯热饮,故B正确.3.如图,茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()甲组乙组909x 21 5 y8742 4A.2,5 B.5,5C.5,8 D.8,8解析:选C∵甲组数据的中位数为15=10+x,∴x=5.又乙组数据的平均数为9+15+(10+y)+18+245=16.8,∴y=8.∴x,y的值分别为5,8.4.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析:选A根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A错误.由图可知,B、C、D 正确.5.(2017·长沙模拟)如图是民航部门统计的2017年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是()A.深圳的变化幅度最小,北京的平均价格最高B.深圳和厦门的春运期间往返机票价格同去年相比有所下降C.平均价格从高到低居于前三位的城市为北京、深圳、广州D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门解析:选D由图可知深圳对应的小黑点最接近0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故A正确;由图可知深圳和厦门对应的小黑点在0%以下,故深圳和厦门的价格同去年相比有所下降,故B 正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故C正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故D错误,选D.6.(2018届高三·豫东、豫北十所名校联考)根据如下样本数据:x 34567y 4.a-5.4-0.50.5b-0.6得到的回归方程为y=bx+a.若样本点的中心为(5,0.9),则当x每增加1个单位时,y就() A.增加1.4个单位B.减少1.4个单位C.增加7.9个单位D.减少7.9个单位解析:选B依题意得,a+b-25=0.9,故a+b=6.5①;又样本点的中心为(5,0.9),故0.9=5b+a②,联立①②,解得b=-1.4,a=7.9,则y^=-1.4x+7.9,可知当x每增加1个单位时,y就减少1.4个单位.7.(2017·哈尔滨四校统考)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A.13,12 B.13,13C.12,13 D.13,14解析:选B设等差数列{a n}的公差为d(d≠0),a3=8,a1a7=a23=64,即(8-2d)(8+4d)=64,化简得2d-d2=0,又d≠0,故d=2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为S1010=(4+22)×510=13,中位数为12+142=13.8.(2017·重庆南开中学月考)一个样本a,3,4,5,6的平均数是b,且不等式x2-6x+c<0的解集为(a,b),则这个样本的标准差是() A.1 B. 2C. 3 D.2解析:选B由题意得a+3+4+5+6=5b,a+b=6,解得a=2,b=4,所以样本方差s2=15[(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2]=2,所以标准差为 2.9.某工厂对一批产品进行了抽样检测,如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A.90 B.75C.60 D.45解析:选A产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36.设样本容量为n,则36 n=0.300,所以n=120,净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.10.(2018届高三·湖南师大附中摸底)某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:使用智能手机不使用智能手机总计学习成绩优秀4812 学习成绩不优秀16218 总计201030附表:P(K2≥k0)0.10.050.0100.0050.001k02.7063.8416.6357.87910.828计算得K2=10,则下列选项正确的是()A.有99.5%的把握认为使用智能手机对学习有影响B.有99.5%的把握认为使用智能手机对学习无影响C.在犯错误的概率不超过0.1%的前提下,认为使用智能手机对学习有影响D.在犯错误的概率不超过1%的前提下,认为使用智能手机对学习无影响解析:选A因为7.879<K2<10.828,所以有99.5%的把握认为使用智能手机对学习有影响.11.如图所示,茎叶图记录了甲、乙两组各4名学生完成某道数学题的得分情况,该题满分为12分.已知甲、乙两组学生的平均成绩相同,乙组某个数据的个位数字模糊,记为x.则下列命题中正确的是()A.甲组学生的成绩比乙组稳定B.乙组学生的成绩比甲组稳定C.两组学生的成绩有相同的稳定性D.无法判断甲、乙两组学生的成绩的稳定性解析:选A x甲=14×(9+9+11+11)=10,x乙=14×(8+9+10+x+12)=10,解得x=1.又s2甲=14×[(9-10)2+(9-10)2+(11-10)2+(11-10)2]=1,s2乙=14×[(8-10)2+(9-10)2+(11-10)2+(12-10)2]=52,∴s2甲<s2乙,∴甲组学生的成绩比乙组稳定.12.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e,众数为m0,平均数为x,则()A.m e=m0=x B.m0<x<m eC.m e<m0<x D.m0<m e<x解析:选D由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e=5.5,5出现的次数最多,故众数为m0=5,平均数为x=130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m0<m e <x.13.(2017·石家庄模拟)设样本数据x1,x2,…,x2 017的方差是4,若y i=x i-1(i=1,2,…,2 017),则y1,y2,…,y2 017的方差为______.解析:设样本数据x1,x2,…,x2 017的平均数为x,又y i=x i-1,所以样本数据y1,y2,…,y2 017的平均数为x-1,则样本数据y1,y2,…,y2 017的方差为12 017[(x1-1-x+1)2+(x2-1-x+1)2+…+(x2 017-1-x+1)2]=12 017[(x1-x)2+(x2-x)2+…+(x2 017-x)2]=4.答案:414.(2018届高三·石家庄摸底)为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科文科总计男131023女72027总计203050已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2=50×(13×20-10×7)223×27×20×30≈4.844,则认为选修文理科与性别有关系出错的可能性约为________.解析:由K2=4.844>3.841.故认为选修文理科与性别有关系出错的可能性约为5%.答案:5%15.甲、乙两人在5次综合测评中成绩的茎叶图如图所示,其中一个数字被污损,记甲、乙的平均成绩分别为x甲,x乙,则x甲>x乙的概率是________.解析:由茎叶图知x乙=86+87+91+92+945=90,x甲=84+87+85+99+90+x5=89+x5.污损处可取数字0,1,2,…,9,共10种,而x甲>x乙时,污损处对应的数字有6,7,8,9,共4种,故x甲>x乙的概率为410=25.答案:2 516.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n为________.解析:总体容量为6+12+18=36.当样本容量为n时,由题意可知,系统抽样的抽样间距为36n ,分层抽样的抽样比是n 36,则采用分层抽样法抽取的乒乓球运动员人数为6×n 36=n 6,篮球运动员人数为12×n 36=n 3,足球运动员人数为18×n 36=n 2,可知n 应是6的倍数,36的约数,故n =6,12,18.当样本容量为n +1时,剔除1个个体,此时总体容量为35,系统抽样的抽样距为35n +1,因为35n +1必须是整数,所以n 只能取6,即样本容量n 为6.答案:6。