专题突破练20 统计与统计案例1.(2019四川成都二模,理18)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就是子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部职员对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表:(1)根据列联表,能否有99%的把握认为满意程度与年龄有关?(2)为了帮助年龄在40岁以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x (单位:分)给予相应的住房补贴y (单位:元),现有两种补贴方案,方案甲:y=1 000+700x ;方案乙:y={3 000,0<x ≤5,5 600,5<x ≤10,9 000,x >10.已知这8名员工的贡献积分为2分,3分,6分,7分,7分,11分,12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为“A 类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A 类员工”的概率.附:K 2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d ),其中n=a+b+c+d.参考数据:2.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.3.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧养殖法新养殖法(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:,K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).4.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x=116∑i=116x i=9.97,s=√116∑i=116(x i-x)2=√116(∑i=116x i2-16x2)≈0.212,√∑i=116(i-8.5)2≈18.439,∑i=116(x i-x)(i-8.5)=-2.78,其中x i为抽取的第i个零件的尺寸,i=1,2, (16)(1)求(x i,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i,y i)(i=1,2,…,n)的相关系数r=∑i=1n(x i-x)(y i-y)√∑i=1(x i-x)2√∑i=1(y i-y)2.√0.008≈0.09.5.(2019山东实验等四校联考,理19)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人).(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;②将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为X ,求随机变量X 的数学期望和方差.参考公式:K 2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d ),n=a+b+c+d.6.随着食品安全问题逐渐引起人们的重视,有机、健康的高端绿色蔬菜越来越受到消费者的欢迎,同时生产—运输—销售一体化的直销供应模式,不仅减少了成本,而且减去了蔬菜的二次污染等问题.(1)在有机蔬菜的种植过程中,有机肥料使用是必不可少的.根据统计某种有机蔬菜的产量与有机肥料的用量有关系,每个有机蔬菜大棚产量的增加量y(百斤)与使用堆沤肥料x(千克)之间对应数据如下表:依据表中的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x+a ^;并根据所求线性回归方程,估计如果每个有机蔬菜大棚使用堆沤肥料10千克,则每个有机蔬菜大棚产量增加量y 是多少百斤? (2)某大棚蔬菜种植基地将采摘的有机蔬菜以每份三斤称重并保鲜分装,以每份10元的价格销售到生鲜超市.“乐购”生鲜超市以每份15元的价格卖给顾客,如果当天前8小时卖不完,则超市通过促销以每份5元的价格卖给顾客(根据经验,当天能够把剩余的有机蔬菜都低价处理完毕,且处理完毕后,当天不再进货).该生鲜超市统计了100天有机蔬菜在每天的前8小时内的销售量(单位:份),制成如下表格(注:x ,y ∈N *,且x+y=30):若以100天记录的频率作为每日前8小时销售量发生的概率,该生鲜超市当天销售有机蔬菜利润的期望值为决策依据,当购进17份比购进18份的利润的期望值大时,求x 的取值范围.附:b ^=∑i=1n(x i -x )(y i -y )∑i=1n(x i -x )2=∑i=1nx i y i -nx y∑i=1nx i 2-nx2,a ^=y −b ^x .7.(2019陕西第二次质检,理18)某市场研究人员为了了解产业园引进的甲公司前期的经营状况,对该公司2018年连续6个月的利润进行了统计,并根据得到的数据绘制了相应的折线图,如图所示.(1)由折线图可以看出,可用线性回归模型拟合月利润y(单位:百万元)与月份代码x之间的关系,求y 关于x的线性回归方程,并预测该公司2019年3月份的利润;(2)甲公司新研制了一款产品,需要采购一批新型材料,现有采购成本分别为10万元/包和12万元/包的A,B两种型号的新型材料可供选择,按规定每种新型材料最多可使用4个月,但新材料的不稳定性会导致材料损坏的年限不相同,现对A,B两种新型材料对应的产品各100件进行科学模拟测试,得到两种新型材料使用寿命的频数统计如下表:经甲公司测算,平均每包新型材料每月可以带来5万元收入,不考虑除采购成本之外的其他成本,假设每包新型材料的使用寿命都是整数月,且以频率作为每包新型材料使用寿命的概率,如果你是甲公司的负责人,以每包新型材料产生利润的期望值为决策依据,你会选择采购哪款新型材料?参考数据:∑i=16y i =96,∑i=16x i y i =371.附:b ^=∑i=1n(x i -x )(y i -y )∑i=1n(x i -x )2=∑i=1nx i y i -nx y∑i=1nx i 2-nx2,a ^=y −b ^x .8.(2019山东青岛二模,理20)“爱国,是人世间最深层、最持久的情感,是一个人立德之源、立功之本.”在中华民族几千年绵延发展的历史长河中,爱国主义始终是激昂的主旋律.爱国汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x (亿元)与科技改造直接收益y (亿元)的数据统计如下:当0<x ≤17时,建立了y 与x 的两个回归模型:模型①:y ^=4.1x+11.8;模型②:y ^=21.3√x -14.4;当x>17时,确定y 与x 满足的线性回归方程为:y ^=-0.7x+a ^.(1)根据下列表格中的数据,比较当0<x ≤17时模型①、②的相关指数R 2,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车发动机科技改造的投入为17亿元时的直接收益.附:刻画回归效果的相关指数R 2=1-∑i=1n(y i-y ^i)2∑i=1n(y i -y )2,√17≈4.1.(2)为鼓励科技创新,当科技改造的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入17亿元与20亿元时公司实际收益的大小;(附:用最小二乘法求线性回归方程y ^=b ^x+a ^的系数公式b ^=∑i=1nx i y i -nx ·y∑i=1nx i 2-nx2=∑i=1n(x i -x )(y i -y )∑i=1n(x i -x )2;a ^=y −b ^x )(3)科技改造后,“东方红”款汽车发动机的热效率X 大幅提高,X 服从正态分布N (0.52,0.012),公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予奖励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励5万元.求每台发动机获得奖励的数学期望.(附:随机变量ξ服从正态分布N (μ,σ2),则P (μ-σ<ξ<μ+σ)=0.682 6,P (μ-2σ<ξ<μ+2σ)=0.954 4.)参考答案专题突破练20 统计与统计案例1.解 (1)根据列联表可以求得K 2的观测值:k=80(25×30-10×15)235×45×40×40=807≈11.429>6.635,故有99%的把握认为满意程度与年龄有关.(2)据题意,该8名员工的贡献积分及按甲乙两种方案所获补贴情况为:由表可知,“A 类员工”有5名,设从这8名员工中随机抽取4名进行面谈,恰好抽到3名“A 类员工”的概率为P ,则P=C 53C 31C 84=37.2.解 (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可)3.解 (1)记B 表示事件“旧养殖法的箱产量低于50 kg ”,C 表示事件“新养殖法的箱产量不低于50 kg ”.由题意知P (A )=P (BC )=P (B )P (C ).旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P (B )的估计值为0.62.新养殖法的箱产量不低于50 kg 的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P (C )的估计值为0.66.因此,事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得列联表箱产量<50 kg 箱产量≥50kg旧养殖法 6238新养殖法3466K2=200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法箱产量的中位数的估计值为50+0.5-0.34≈52.35(kg).4.解 (1)由样本数据得(x i ,i )(i=1,2,…,16)的相关系数为r=∑i=116(x i -x )(i -8.5)√∑i=1(x i -x )2√∑i=1(i -8.5)2=0.212×√16×18.439≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于x =9.97,s ≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x -3s ,x +3s )以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为115(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.∑i=116x i 2=16×0.2122+16×9.972≈1591.134,剔除第13个数据,剩下数据的样本方差为115(1 591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为√0.008≈0.09. 5.解 (1)k2=200×(50×30-50×70)2=25≈8.333>6.635,故能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关. (2)①由题意,所抽取的10名女市民中,经常网购的有10×70100=7人, 偶尔或不用网购的有10-7=3人,所以选取的3人中至少有2人经常网购的概率P=C 72C 31+C 73C 103=4960.②由2×2列联表可知,抽到经常网购的市民频率为120200=0.6.将频率视为概率,从我市所有参与调查的市民中随机抽取1人,恰好抽到经常网购市民的概率为0.6.由题意X~B (10,0.6),E (X )=10×0.6=6,D (X )=10×0.6×(1-0.6)=2.4. 6.解 (1)x =2+4+5+6+85=5, y =3+4+4+4+55=4. ∑i=15x i y i =2×3+4×4+5×4+6×4+8×5=106,∑i=15x i 2=22+42+52+62+82=145,b ^=106-5×5×4145-5×52=0.3,a ^=y −b ^ x =4-0.3×5=2.5,所以y 关于x 的线性回归方程为y ^=0.3x+2.5.当x=10时,y ^=0.3×10+2.5=5.5百斤,所以如果每个有机蔬菜大棚使用堆沤肥料10千克,估计每个有机蔬菜大棚产量的增加量y 是5.5百斤.(2)若该超市一天购进17份这种有机蔬菜,Y 1表示当天的利润(单位:元),那么Y 1的分布列为Y 1的数学期望是E (Y 1)=65×10100+75×x100+85×90-x100=8 300-10x100; 若该超市一天购进18份这种有机蔬菜,Y 2表示当天的利润(单位:元),那么Y 2的分布列为Y 2的数学期望是E (Y 2)=60×10100+70×x100+80×16100+90×74-x100=8 540-20x100; 又购进17份比购进18份的利润的期望值大,故8 300-10x 100>8 540-20x100,求得x>24,故x的取值范围是(24,30),x ∈N *.7.解 (1)由折线图可知统计数据(x i ,y i )共6组,即(1,11),(2,13),(3,16),(4,15),(5,20),(6,21),计算可得x =16(1+2+3+4+5+6)=3.5,y =16∑i=16y i =16×96=16,∑i=1nx i 2-n x 2=12+22+32+42+52+62-6×3.52=17.5.故b ^=371-6×3.5×1617.5=2,故a ^=y −b ^ x =16-2×3.5=9,∴x 关于y 的线性回归方程为y ^=2x+9,故x=11时,则y ^=2×11+9=31,即预测公司2019年3月份(即x=11时)的利润为31百万元.(2)由频率估计概率,A 型材料可使用1个月,2个月,3个月、4个月的概率分别为0.2,0.35,0.35,0.1,∴A 型材料利润的数学期望为(5-10)×0.2+(10-10)×0.35+(15-10)×0.35+(20-10)×0.1=1.75万元;B 型材料可使用1个月,2个月,3个月、4个月的概率分别为0.1,0.3,0.4,0.2,∴B 型材料利润的数学期望为(5-12)×0.1+(10-12)×0.3+(15-12)×0.4+(20-12)×0.2=1.50万元;∵1.75>1.50,∴应该采购A 型材料. 8.解 (1)由表格中的数据,有182.4>79.2,即182.4∑i=17(y i -y )2>79.2∑i=17(y i -y )2,所以模型①的R 2小于模型②,说明回归模型②刻画的拟合效果更好.所以当x=17亿元时,科技改造直接收益的预测值为y ^=21.3×√17-14.4≈21.3×4.1-14.4=72.93(亿元).(2)由已知可得:x -20=1+2+3+4+55=3,所以x =23, y -60=8.5+8+7.5+6+65=7.2,所以y =67.2.所以a ^=y +0.7x =67.2+0.7×23=83.3.所以当x>17亿元时,y 与x 满足的线性回归方程为:y ^=-0.7x+83.3.所以当x=20亿元时,科技改造直接收益的预测值y ^=-0.7×20+83.3=69.3,所以当x=20亿元时,实际收益的预测值为69.3+10=79.3亿元>72.93亿元, 所以科技改造投入20亿元时,公司的实际收益的更大. (3)因为P (0.52-0.02<X<0.52+0.02)=0.954 4, 所以P (X>0.50)=1+0.954 42=0.977 2, P (X ≤0.50)=1-0.954 42=0.022 8. 因为P (0.52-0.01<X<0.52+0.01)=0.682 6, 所以P (X>0.53)=1-0.682 62=0.158 7, 所以P (0.50<X ≤0.53)=0.977 2-0.158 7=0.818 5. 设每台发动机获得的奖励为Y (万元),则Y 的分布列为:所以每台发动机获得奖励的数学期望为E (Y )=0×0.022 8+2×0.818 5+5×0.158 7=2.430 5(万元).。