当前位置:文档之家› 必修三统计高考真题

必修三统计高考真题

2017年04月19日的高中数学组卷一.选择题(共11小题)1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:8.28.610.011.311.9收入x(万元)6.27.58.08.59.8支出y(万元)根据上表可得回归直线方程,其中,据此估计,该社区一户收入为15万元家庭年支出为()A .11.4万元B.11.8万元C.12.0万元D.12.2万元2.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是()A.=0.4x+2.3 B.=2x﹣2.4 C.=﹣2x+9.5 D.=﹣0.3x+4.43.根据如下样本数据,得到回归方程=bx+a,则()x345678y 4.0 2.5﹣0.50.5﹣2.0﹣3.0A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<04.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A.抽签法B.系统抽样法C.分层抽样法D.随机数法5.根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关6.重庆市2013年各月的平均气温(℃)数据的茎叶图如,则这组数据的中位数是()A.19 B.20 C.21.5 D.237.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1﹣35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3 B.4 C.5 D.68.若样本数据x1,x2,…,x10的标准差为8,则数据2x1﹣1,2x2﹣1,…,2x10﹣1的标准差为()A.8 B.15 C.16 D.329.为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8 C.12 D.1810.某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11 B.12 C.13 D.1411.一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7 C.8,15,12,5 D.8,16,10,6二.解答题(共7小题)12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(x i﹣)2(w i﹣)2(x i ﹣)(y i﹣)(w i ﹣)(y i﹣)46.6563 6.8289.8 1.61469108.8表中w i =i,=(Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x.根据(Ⅱ)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1 v1),(u2 v2)…..(u n v n),其回归线v=α+βu 的斜率和截距的最小二乘估计分别为:=,=﹣.13.如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1﹣7分别对应年份2008﹣2014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:y i=9.32,t i y i=40.17,=0.55,≈2.646.参考公式:r=,回归方程=+t中斜率和截距的最小二乘估计公式分别为:=,=﹣.14.某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表:年份2007200820092010201120122013年份代号t1234567人均纯收入 2.9 3.3 3.6 4.4 4.8 5.2 5.9y(Ⅰ)求y关于t的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=﹣.15.从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得,,,.(Ⅰ)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(Ⅱ)判断变量x与y之间是正相关还是负相关;(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y=bx+a中,,,其中,为样本平均值,线性回归方程也可写为.16.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…[4,4.5]分成9组,制成了如图所示的频率分布直方图.(I)求直方图中的a值;(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;(Ⅲ)估计居民月均用水量的中位数.17.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?18.某工厂36名工人年龄数据如图:工人编号年龄工人编号年龄工人编号年龄工人编号年龄1 240441011363119202743282934393 4 5 6 7 8 940413340454243121314151617183839434539383621222324252627413734423744423031323334353643384253374939(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值和方差s2;(3)36名工人中年龄在﹣s和+s之间有多少人?所占百分比是多少(精确到0.01%)?2017年04月19日的高中数学组卷参考答案与试题解析一.选择题(共11小题)1.(2015•福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:8.28.610.011.311.9收入x (万元)6.27.58.08.59.8支出y (万元)根据上表可得回归直线方程,其中,据此估计,该社区一户收入为15万元家庭年支出为()A .11.4万元B.11.8万元C.12.0万元D.12.2万元【解答】解:由题意可得=(8.2+8.6+10.0+11.3+11.9)=10,=(6.2+7.5+8.0+8.5+9.8)=8,代入回归方程可得=8﹣0.76×10=0.4,∴回归方程为=0.76x +0.4,把x=15代入方程可得y=0.76×15+0.4=11.8,故选:B.2.(2014•重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是()A.=0.4x+2.3 B.=2x﹣2.4 C.=﹣2x+9.5 D.=﹣0.3x+4.4【解答】解:∵变量x与y正相关,∴可以排除C,D;样本平均数=3,=3.5,代入A符合,B不符合,故选:A.3.(2014•湖北)根据如下样本数据,得到回归方程=bx+a,则()x345678y 4.0 2.5﹣0.50.5﹣2.0﹣3.0A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0【解答】解:由题意可知:回归方程经过的样本数据对应的点附近,是减函数,所以b<0,且回归方程经过(3,4)与(4,3.5)附近,所以a>0.故选:B.4.(2015•四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A.抽签法B.系统抽样法C.分层抽样法D.随机数法【解答】解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,这种方式具有代表性,比较合理.故选:C.5.(2015•新课标Ⅱ)根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关【解答】解:A从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量明显减少,且减少的最多,故A正确;B2004﹣2006年二氧化硫排放量越来越多,从2007年开始二氧化硫排放量变少,故B正确;C从图中看出,2006年以来我国二氧化硫年排放量越来越少,故C正确;D2006年以来我国二氧化硫年排放量越来越少,而不是与年份正相关,故D错误.故选:D6.(2015•重庆)重庆市2013年各月的平均气温(℃)数据的茎叶图如,则这组数据的中位数是()A.19 B.20 C.21.5 D.23【解答】解:样本数据有12个,位于中间的两个数为20,20,则中位数为,故选:B7.(2015•湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1﹣35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3 B.4 C.5 D.6【解答】解:由已知,将个数据分为三个层次是[130,138],[139,151],[152,153],根据系统抽样方法从中抽取7人,得到抽取比例为,所以成绩在区间[139,151]中共有20名运动员,抽取人数为20×=4;故选B.8.(2015•安徽)若样本数据x1,x2,…,x10的标准差为8,则数据2x1﹣1,2x2﹣1,…,2x10﹣1的标准差为()A.8 B.15 C.16 D.32【解答】解:∵样本数据x1,x2,…,x10的标准差为8,∴=8,即DX=64,数据2x1﹣1,2x2﹣1,…,2x10﹣1的方差为D(2X﹣1)=4DX=4×64,则对应的标准差为==16,故选:C.9.(2014•山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8 C.12 D.18【解答】解:由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.故选:C.10.(2013•陕西)某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11 B.12 C.13 D.14【解答】解:使用系统抽样方法,从840人中抽取42人,即从20人抽取1人.所以从编号1~480的人中,恰好抽取=24人,接着从编号481~720共240人中抽取=12人.故:B.11.(2010•四川)一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7 C.8,15,12,5 D.8,16,10,6【解答】解:因为=,故各层中依次抽取的人数分别是=8,=16,=10,=6,故选D.二.解答题(共7小题)12.(2015•新课标Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(x i﹣)2(w i﹣)2(x i ﹣)(y i﹣)(w i﹣)(y i﹣)46.6563 6.8289.8 1.61469108.8表中w i =i,=(Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x.根据(Ⅱ)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1 v1),(u2 v2)…..(u n v n),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:=,=﹣.【解答】解:(Ⅰ)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型;(Ⅱ)令w=,先建立y关于w的线性回归方程,由于==68,=﹣=563﹣68×6.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68,(Ⅲ)(i)由(Ⅱ)知,当x=49时,年销售量y的预报值=100.6+68=576.6,年利润z的预报值=576.6×0.2﹣49=66.32,(ii)根据(Ⅱ)的结果可知,年利润z的预报值=0.2(100.6+68)﹣x=﹣x+13.6+20.12,当==6.8时,即当x=46.24时,年利润的预报值最大.13.(2016•新课标Ⅲ)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1﹣7分别对应年份2008﹣2014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:y i=9.32,t i y i=40.17,=0.55,≈2.646.参考公式:r=,回归方程=+t中斜率和截距的最小二乘估计公式分别为:=,=﹣.【解答】解:(1)由折线图看出,y与t之间存在较强的正相关关系,理由如下:∵r==≈≈≈0.993,∵0.993>0.75,故y与t之间存在较强的正相关关系;(2)==≈≈0.103,=﹣≈1.331﹣0.103×4≈0.92,∴y关于t的回归方程=0.10t+0.92,2016年对应的t值为9,故=0.10×9+0.92=1.82,预测2016年我国生活垃圾无害化处理量为1.82亿吨.14.(2014•新课标Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表:年份2007200820092010201120122013年份代号t 12345672.93.3 3.64.4 4.85.2 5.9人均纯收入y(Ⅰ)求y关于t的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=﹣.【解答】解:(Ⅰ)由题意,=×(1+2+3+4+5+6+7)=4,=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∴== =0.5,=﹣=4.3﹣0.5×4=2.3.∴y关于t的线性回归方程为=0.5t+2.3;(Ⅱ)由(Ⅰ)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入=0.5t+2.3,得:=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.15.(2013•重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得,,,.(Ⅰ)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(Ⅱ)判断变量x与y之间是正相关还是负相关;(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y=bx+a中,,,其中,为样本平均值,线性回归方程也可写为.【解答】解:(Ⅰ)由题意可知n=10,===8,===2,故l xx==720﹣10×82=80,l xy==184﹣10×8×2=24,故可得b=═=0.3,a==2﹣0.3×8=﹣0.4,故所求的回归方程为:y=0.3x﹣0.4;(Ⅱ)由(Ⅰ)可知b=0.3>0,即变量y随x的增加而增加,故x与y之间是正相关;(Ⅲ)把x=7代入回归方程可预测该家庭的月储蓄为y=0.3×7﹣0.4=1.7(千元).16.(2016•四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…[4,4.5]分成9组,制成了如图所示的频率分布直方图.(I)求直方图中的a值;(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由;(Ⅲ)估计居民月均用水量的中位数.【解答】解:(I)∵1=(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5,整理可得:2=1.4+2a,∴解得:a=0.3.(II)估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下:由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12,又样本容量=30万,则样本中月均用水量不低于3吨的户数为30×0.12=3.6万.(Ⅲ)根据频率分布直方图,得;0.08×0.5+0.16×0.5+0.30×0.5+0.40×0.5=0.47<0.5,0.47+0.5×0.52=0.73>0.5,∴中位数应在(2,2.5]组内,设出未知数x,令0.08×0.5+0.16×0.5+0.30×0.5+0.4×0.5+0.5×x=0.5,解得x=0.06;∴中位数是2+0.06=2.06.17.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?【解答】解:(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解方程可得x=0.0075,∴直方图中x的值为0.0075;(2)月平均用电量的众数是=230,∵(0.002+0.0095+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.002+0.0095+0.011)×20+0.0125×(a﹣220)=0.5可得a=224,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.0125×20×100=25,月平均用电量为[240,260)的用户有0.0075×20×100=15,月平均用电量为[260,280)的用户有0.005×20×100=10,月平均用电量为[280,300)的用户有0.0025×20×100=5,∴抽取比例为=,∴月平均用电量在[220,240)的用户中应抽取25×=5户.18.(2015•广东)某工厂36名工人年龄数据如图:工人编年龄工人编年龄工人编年龄工人编年龄百度文库- 让每个人平等地提升自我21 号号号号123456789404440413340454243101112131415161718363138394345393836192021222324252627274341373442374442282930313233343536343943384253374939(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值和方差s2;(3)36名工人中年龄在﹣s 和+s 之间有多少人?所占百分比是多少(精确到0.01%)?【解答】解:(1)由系统抽样知,36人分成9组,每组4人,其中第一组的工人年龄为44,所以其编号为2,∴所有样本数据的编号为:4n﹣2,(n=1,2,…,9),其数据为:44,40,36,43,36,37,44,43,37.(2)由平均值公式得=(44+40+36+43+36+37+44+43+37)=40.由方差公式得s2=[(44﹣40)2+(40﹣40)2+…+(37﹣40)2]=.(3)∵s2=.∴s=∈(3,4),∴36名工人中年龄在﹣s和+s之间的人数等于区间[37,43]的人数,即40,40,41,…,39,共23人.∴36名工人中年龄在﹣s和+s之间所占百分比为≈63.89%.。

相关主题