高中数学:统计与统计案例练习A组一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1∶3∶5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()A.200 B.240C.400 D.480解析:选C设频率分布直方图中从左到右前3个小矩形的面积分别为P,3P,5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)×2=0.1.因为频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即P=0.1.所以平均每周上网时间少于4 h的学生所占比例为P+3P=0.4,由此估计学生人数为0.4×1 000=400.2.AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0~50),二级良(51~100),三级轻度污染(101~150),四级中度污染(151~200),五级重度污染(201~300),六级严重污染(大于300).如图是昆明市2019年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2020年4月份空气质量优的天数为()A.3 B.4C.12 D.21解析:选C从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为410=25,所以估计昆明市2020年4月份空气质量为优的天数为30×25=12,故选C.3.(成都模拟)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图.已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是()A.最低气温与最高气温为正相关B.10月的最高气温不低于5月的最高气温C.月温差(最高气温减最低气温)的最大值出现在1月D.最低气温低于0 ℃的月份有4个解析:选D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误.故选D.4.(承德模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是()A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选C.5.(石家庄模拟)某学校A,B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.①A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;②B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;③A班兴趣小组成绩的标准差大于B班兴趣小组成绩的标准差;④B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.其中正确结论的编号为()A.①④B.②③C.②④D.①③解析:选A A班兴趣小组的平均成绩为53+62+64+…+92+9515=78,其方差为115×[(53-78)2+(62-78)2+…+(95-78)2]=121.6, 则其标准差为121.6≈11.03;B班兴趣小组的平均成绩为45+48+51+…+9115=66,其方差为115×[(45-66)2+(48-66)2+…+(91-66)2]=169.2,则其标准差为169.2≈13.01.故选A.6.某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x(个)为每天商品的销量,y(元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率为()A.19B.110C.15D.18解析:选B 由题意知y =⎩⎨⎧5x ,x =18,19,95+(x -19)(4-3),x =20,21, 即y =⎩⎨⎧5x ,x =18,19,76+x ,x =20,21.当日销量不少于20个时,日利润不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利润为96元的有3天,记为a ,b ,c ,日利润为97元的有2天,记为A ,B ,从中任选2天有(a ,A ),(a ,B ),(a ,b ),(a ,c ),(b ,A ),(b ,B ),(b ,c ),(c ,A ),(c ,B ),(A ,B ),共10种情况.其中选出的这2天日利润都是97元的有(A ,B )1种情况. 故所求概率为110.故选B. 二、填空题7.某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x /元 3.0 3.2 3.4 3.6 3.8 4.0 销量y /瓶504443403528已知x ,y 的关系符合回归方程y =b x +a ,其中b =-20.若该品牌饮料的进价为2元,为使利润最大,零售价应定为________元.解析:依题意得:x =3.5,y =40, 所以a^=40-(-20)×3.5=110, 所以回归直线方程为y ^=-20x +110,利润L=(x-2)(-20x+110)=-20x2+150x-220,所以x=15040=3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是________.解析:设所求的人数为n,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08+0.16)×2.5=0.7,∴n=0.7×200=140.答案:1409.为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为________.解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+m,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m+32)÷5=30,解得m=1,则甲地该月11时的平均气温的标准差为15×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]= 2.答案: 2三、解答题10.某篮球运动员的投篮命中率为50%,他想提高自己的投篮水平,制定了一个夏季训练计划,为了了解训练效果,执行训练前,他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为46.3.执行训练后也统计了10场比赛的得分,茎叶图如图所示:(1)请计算该篮球运动员执行训练后统计的10场比赛得分的中位数、平均得分与方差;(2)如果仅从执行训练前后统计的各10场比赛得分数据分析,你认为训练计划对该运动员的投篮水平的提高是否有帮助?为什么?解:(1)训练后得分的中位数为14+152=14.5;平均得分为8+9+12+14+14+15+16+18+21+2310=15;方差为110×[(8-15)2+(9-15)2+(12-15)2+(14-15)2+(14-15)2+(15-15)2+(16-15)2+(18-15)2+(21-15)2+(23-15)2]=20.6.(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练后方差20.6小于训练前方差46.3,说明训练后得分稳定性提高了(阐述观点合理即可),这是投篮水平提高的表现.故此训练计划对该篮球运动员的投篮水平的提高有帮助.11.(西安八校联考)在2018年俄罗斯世界杯期间,莫斯科的部分餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:等级代码数值x384858687888销售单价y/元16.818.820.822.82425.8(1)(系数精确到0.1);(2)若莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b^x +a ^的斜率和截距的最小二乘估计分别为b^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a^=y -b ^x . 参考数据:∑i =16x i y i =8 440,∑i =16x 2i =25 564.解:(1)由题意,得x =38+48+58+68+78+886=63,y =16.8+18.8+20.8+22.8+24+25.86=21.5,b ^=∑i =16x i y i -6x y∑i =16x 2i -6x 2=8 440-6×63×21.525 564-6×63×63≈0.2,a^=y -b ^x =21.5-0.2×63=8.9. 故所求线性回归方程为y ^=0.2x +8.9.(2)由(1)知,当x =98时,y =0.2×98+8.9=28.5. ∴估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制的频率分布直方图如图所示.规定80分以上者晋级成功,否则晋级失败(满分为100分).(1)求图中a 的值;(2)估计该次考试的平均分x (同一组中的数据用该组的区间中点值代表);(3)根据已知条件完成下面2×2列联表,并判断能否有85%的把握认为“晋级成功”与性别有关.晋级成功晋级失败合计男16女50 合计参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+dP(K2≥k)0.400.250.150.100.050.025k 0.708 1.323 2.072 2.706 3.841 5.024 解:(1)0.040)×10=1,解得a=0.005.(2)由频率分布直方图知,各小组的中点值依次是55,65,75,85,95,对应的频率分别为0.05,0.30,0.40,0.20,0.05,则估计该次考试的平均分为x=55×0.05+65×0.30+75×0.40+85×0.20+95×0.05=74(分).(3)由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25,故晋级成功的人数为100×0.25=25,填写2×2列联表如下:晋级成功晋级失败合计男163450女94150合计2575100K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(16×41-34×9)225×75×50×50≈2.613>2.072,所以有85%的把握认为“晋级成功”与性别有关.B组1.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:248256232243188268278266289312274296288302295228287217329283(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)(2)由题意可得8×(0.30+0.10+0.05)=3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x=190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(小时),所以样本的平均无故障连续使用时限为269小时.2.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法(3)附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解:(1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62.(2)根据箱产量的频率分布直方图得到联表:K 2=200×(62×66100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:=116∑i =116x 2i -16x 2≈0.212, ∑i =116(i -8.5)2≈18.439,∑i =116(x i -x )(i -8.5)=-2.78,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)(1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(x -3s ,x +3s )之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x -3s ,x +3s )之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i ,y i )(i =1,2,…,n )的相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2.0.008≈0.09.解:(1)由样本数据得(x i ,i )(i =1,2,…,16)的相关系数为r =∑i =116(x i -x )(i -8.5)∑i =116(x i -x )2∑i =116(i -8.5)2=-2.780.212×16×18.439≈-0.18.由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于x =9.97,s ≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x -3s ,x +3s )以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为115×(16×9.97-9.22)=10.02, 这条生产线当天生产的零件尺寸的均值的估计值为10.02.∑i =116x 2i =16×0.2122+16×9.972≈1 591.134,剔除第13个数据,剩下数据的样本方差为115×(1 591.134-9.222-15×10.022)≈0.008, 这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.4.(昆明模拟)“工资条里显红利,个税新政入民心”.随着2019年新年钟声的敲响,我国自1980年以来,力度最大的一次个人所得税(简称个税)改革迎来了全面实施的阶段.某IT 从业者为了解自己在个税新政下能享受多少税收红利,绘制了他在26~35岁(2009~2018年)之间各年的月平均收入y (单位:千元)的散点图:(1)由散点图知,可用回归模型y =b ln x +a 拟合y 与x 的关系,试根据有关数据建立y 关于x 的回归方程;(2)如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用(1)的结果,将月平均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.附注:参考数据:∑i =110x i =55,∑i =110y i =155.5,∑i =110(x i -x )2=82.5,∑i =110(x i -x )(y i -y )=94.9,∑i =110t i =15.1,∑i =110(t i -t )2=4.84,∑i =110(t i -t )(y i -y )=24.2,其中t i =ln x i ;取ln 11=2.4,ln 36=3.6.参考公式:回归方程v =b^u +a ^中斜率和截距的最小二乘估计分别为b ^=∑i =1n(u i -u )(v i -v )∑i =1n(u i -u )2,a^=v -b ^u .新旧个税政策下每月应纳税所得额(含税)计算方法及税率表如下:b^=∑i=110(t i-t)(y i-y)∑i=110(t i-t)2=24.24.84=5,y=∑i=110y i10=155.510=15.55,t=∑i=110t i10=15.110=1.51,a^=y-b^t=15.55-5×1.51=8,所以y关于t的回归方程为y=5t+8.因为t=ln x,所以y关于x的回归方程为y=5ln x+8.(2)由(1)得,该IT从业者36岁时月平均收入为y=5ln 11+8=5×2.4+8=20(千元).旧个税政策下每个月应缴纳的个人所得税为1 500×3%+3 000×10%+4 500×20%+(20 000-3 500-9 000)×25%=3 120(元).新个税政策下每个月应缴纳的个人所得税为3 000×3%+(20 000-5 000-3 000-3 000)×10%=990(元).故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(元).。