专题19 统计知识及统计案例大题部分【训练目标】1、理解简单随机抽样每个个体被抽取的概率相等,掌握简单随机抽样,系统抽样,分层抽样的方法和本质;2、掌握频率分布直方图的画法和性质,能够根据频率分布直方图计算平均数、中位数、众数和方差;3、能根据茎叶图计算平均数、中位数、众数和方差;4、能看懂条形图,扇形统计图,雷达图,折线统计图等常见的统计图表;5、熟记平均数,方差的计算公式及性质,理解平均数,中位数,众数,方差的实际意义;6、能根据数据和公式求线性回归方程,把握线性回归方程的核心即一定经过样本中心点(),x y;7、理解相关系数,残差等概念及相应的含义,并能正确的使用公式求解;8、会根据数据列22⨯列联表,掌握利用2κ公式进行独立性检验的方法;【温馨小提示】此类问题在高考中属于必考题,一般在大题或者小题中出现,所占分值比重较大,题目容易,但是阅读量大,需要学生能够快速准确的把握题目的核心,同时计算量也偏大,另外要求学生多加训练,解出各种统计的题型,知晓解题方法。
【名校试题荟萃】1、如图,从参加环保知识竞赛的学生中抽出名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛成绩的平均数、众数、中位数;(不要求写过程)(3)从成绩是分以上(包括分)的学生中选两人,求他们在同一分数段的概率.【答案】(1)4 (2)68.5、75、70 (3).⨯=,设为,(3)记“取出的2人在同一分数段”为事件,因为之间的人数为400.14之间有人,设为,从这6人中选出2人,有,,,,共15个基本事件,其中事件A包括,,,,共7个基本事件,则.2、2018年为我国改革开放40周年,某事业单位共有职工600人,其年龄与人数分布表如下:年龄段[)45,55[)55,5922,35[)35,45[)人数(单位:人)180 180 160 80约定:此单位45岁—59岁为中年人,其余为青年人,现按照分层抽样抽取30人作为全市庆祝晚会的观众.(1)抽出的青年观众与中年观众分别为多少人?(2)若所抽取出的青年观众与中年观众中分别有12人和5人不热衷关心民生大事,其余人热衷关心民生大事.完成下列2×2列联表,并回答能否有90%的把握认为年龄层与热衷关心民生大事有关?热衷关心民生大事不热衷关心民生大事总计青年12中年 5总计30(3)若从热衷关心民生大事的青年观众(其中1人擅长歌舞,3人擅长乐器)中,随机抽取2人上台表演节目,则抽出的2人能胜任才艺表演的概率是多少?【答案】(1)18,12 (2)否(3)2 5【解析】(1)根据分层抽样可知抽出的青年观众为18人,中年观众12人;(2)2×2列联表如下:热衷关心民生大事不热衷关心民生大事总计青年 6 12 18中年7 5 12总计13 17 30,∴没有90%的把握认为年龄层与热衷关心民生大事有关;3、随着网络的发展,人们可以在网络上购物、玩游戏、聊天、导航等,所以人们对上网流量的需求越来越大。
某电信运营商推出一款新的“流量包”套餐.为了调查不同年龄的人是否愿意选择此款“流量包”套餐,随机抽取个用户按年龄分组进行访谈,统计结果如下表.(1)若在第组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取人,则各组应分别抽取多少人;(2)若从第组的被调查者访谈人中随机选取人进行追踪调查,求人中至少有人愿意选择此款“流量包”套餐的概率;(3)按以上统计数据填写下面列联表,并判断以岁为分界点,能否在犯错误不超过的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关.参考公式:,其中.【答案】(1)各组分别为人,人,人(2)(3)在犯错误不超过的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关.【解析】(1)因为,,,所以第组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取人,各组分别为人,人,人.(3)列联表:∴,∴在犯错误不超过的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关.4、某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与医院抄录了至月份每月日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料.该兴趣小组确定的研究方案是:先从这六组数据中选取组,用剩下的组数据求线性回归方程,再用被选取的组数据进行检验.日期月日月日月日月日月日月日昼夜温差()就诊人数(个)(1)若选取的是月与月的两组数据,请根据至月份的数据,求出关于的线性回归方程;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想.(参考公式:)【答案】(1);(2)该小组所得线性回归方程是理想的.5、2018年月以来南昌市遭受连日大暴雨天气,某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照南昌暴雨前后两个时间收集有效投票,暴雨后的投票收集了份,暴雨前的投票也收集了份,所得统计结果如下表:支持不支持总计南昌暴雨后南昌暴雨前总计已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为.(1)求列表中数据的值;(2)能够有多大把握认为南昌暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关系?参考临界值表:0.15 0.100.05 0.025 0.010 0.005 0.0012.072 2.7063.841 5.024 6.635 7.879 10.828参考公式:(其中为样本容量).【答案】(1),,,,(2)有把握认为南昌暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关系.6、在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在S 市的A 区开设分店,为了确定在该区开设分店的个数,该公司对在该市其他区开设的分店的数据作了初步处理后得到下列表格.记x 表示在各区开设分店的个数,y 表示这x 个分店的年收入之和.x (个)2 3 4 5 6 y (百万元)2.5344.56(1)该公司已经过初步判断,可用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程∧∧∧+=a x b y ;(2)假设该公司在A 区获得的总年利润z (单位:百万元)与y x ,之间的关系,请结合(1)中的线性回归方程,估算该公司应在A 区开设多少个分店时,才能使A区平均每个分店的年利润最大?(参考公式【答案】 (1)(2)4=x 【解析】 (1)代入数据得:,,,∴.(2)由题意,可知总收入的预报值∧z 与之间的关系为:,设该区每个分店的平均利润为t ,则xzt =,故t 的预报值与之间的关系为,则当4=x 时,∧t 取到最大值。
7、随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A 和B 两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:(1)试估计使用A 款订餐软件的50个商家的“平均送达时间”的众数及平均数; (2)根据以上抽样调查数据,将频率视为概率,回答下列问题:①能否认为使用B 款订餐软件“平均送达时间”不超过40分钟的商家达到75%? ②如果你要从A 和B 两款订餐软件中选择一款订餐,你会选择哪款?说明理由. 【答案】(1)55,40 (2)75%,B8、为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)和年利润z 的影响,对近五年该农产品的年产量和价格统计如下表:x 1 2 3 4 5 y7.06.55.53.82.2(1)求y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z 取到最大值?(保留两位小数)参考公式:b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a ^=y --b ^x -【答案】(1)y ^=-1.23x +8.69 (2)2.72(2)年利润z =x (-1.23x +8.69)-2x =-1.23x 2+6.69x =-1.23⎝ ⎛⎭⎪⎫x -6.692.462+1.23×⎝ ⎛⎭⎪⎫6.692.462 即当x =6.692.46≈2.72时,年利润z 最大.9、下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17y i -y2=0.55,7≈2.646.参考公式:相关系数r =∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .【答案】(1)见解析 (2)1.82(2)由y =9.327≈1.331及(1)得 b ^=∑i =17t i -ty i -y∑i =17t i -t2=2.8928≈0.103,a ^=y -b ^ t ≈1.331-0.103×4≈0.92. 所以y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.10、某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w∑i =18(x i -x )2∑i =18(w i -w )2∑i =18(x i -x )(y i -y ) ∑i =18(w i -w )(y i-y ) 46.6 563 6.8 289.8 1.61 469108.8表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i -uv i -v∑i =1nu i -u2,α^=v -β^u .【答案】(1)详见解析 (2)46.24 【解析】(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18w i -wy i -y∑i =18w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x .11、某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间(x 个月)和市场占有率(y %)的几组相关对应数据:x 1 2 3 4 5 y0.020.050.10.150.18(1)根据上表中的数据,用最小二乘法求出y 关于x 的线性回归方程;(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%(精确到月).附:b ^=∑i =1nx i y i -n x -·y-∑i =1nx 2i -n x -2,a ^=y --b ^x -. 【答案】(1)y ^=0.042x -0.026 (2)13(2)由(1)中的回归方程可知,上市时间与市场占有率正相关,即上市时间每增加1个月,市场占有率约增加0.042个百分点.由y ^=0.042x -0.026>0.5,解得x ≥13, 故预计上市13个月时,该款旗舰机型市场占有率能超过0.5%.12、某市春节期间7家超市的广告费支出x i (万元)和销售额y i (万元)数据如下:超市 ABCDEFG广告费支出x i 1 2 4 6 11 13 19 销售额y i19324044525354(1)若用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程;(2)用对数回归模型拟合y 与x 的关系,可得回归方程y ^=12ln x +22,经计算得出线性回归模型和对数模型的R 2分别约为0.75和0.97,请用R 2说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出为8万元时的销售额.参数数据及公式:x -=8,y -=42,∑7i =1x i y i =2 794,∑7i =1x 2i =708,b ^=错误!,错误!=错误!-错误!错误!,ln2≈0.7.【答案】(1)y ^=1.7x +28.4. (2)47.2【解析】(1)∵x-=8,y-=42,∑7i=1x i y i=2 794,∑7i=1x2i=708.∴b^=错误!=错误!=1.7,因此a^=y--b^x-=42-1.7×8=28.4.所以,y关于x的线性回归方程是y^=1.7x+28.4.(2)∵0.75<0.97,∴对数回归模型更合适.当x=8时,y^=12ln 8+22=36ln 2+22=36×0.7+22=47.2(万元).∴广告费支出8万元时,预测A超市销售额为47.2万元.13、为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得x-=116∑16i=1x i=9.97,s=错误!=错误!≈0.212,错误!≈18.439,错误!(x i-错误!)(i-8.5)=-2.78,其中x i为抽取的第i个零件的尺寸,i=1,2, (16)(1)求(x i,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x--3s,x-+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x--3s,x-+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i,y i)(i=1,2,…,n)的相关系数r=错误!,错误!≈0.09.【答案】(1)见解析(2)0.09【解析】(1)由样本数据得(x i,i)(i=1,2,…,16)的相关系数r=错误!≈错误!≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.剔除第13个数据,剩下数据的样本方差为1(1 591.134-9.222-15×10.022)≈0.008,15这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.。