概率与统计 大题练习31.某校决定为本校上学所需时间超过30分钟的学生提供校车接送服务(所有学生上学时间均不超过60分钟).为了解学生上学所需时间,从全校600名学生中抽取50人统计上学所需时间(单位:分),将600人随机编号,为001,002,…,600,将抽取的50名学生的上学所需时间分成六组:第一组(0,10],第二组(10,20],…,第六组(50,60],得到如图所示的频率分布直方图.(1)若抽取的50个样本是用系统抽样的方法得到的,且第一个抽取的编号为006,则第5个抽取的编号是多少?(2)若从50个样本中属于第四组和第六组的所有人中随机抽取2人,设他们上学所需时间分别为a 分钟,b 分钟,求满足|a -b |>10的概率.(3)设学校配备的校车每辆可搭载40名学生,请根据抽样的结果估计全校应有多少辆这样的校车?解析:(1)因为600÷50=12,且第一个抽取的编号为006,所以第5个抽取的数是6+(5-1)×12=54,即第5个抽取的编号是054.(2)第四组的人数为0.008×10×50=4,设这4人分别为A ,B ,C ,D ,第六组的人数为0.004×10×50=2,设这2人分别为x ,y ,随机抽取2人的可能情况有AB ,AC ,AD ,BC ,BD ,CD ,xy ,Ax ,Ay ,Bx ,By ,Cx ,Cy ,Dx ,Dy ,共15种,其中他们上学所需时间满足|a -b |>10的情况有Ax ,Ay ,Bx ,By ,Cx ,Cy ,Dx ,Dy ,共8种.所以满足|a -b |>10的概率P =815.(3)全校上学所需时间超过30分钟的学生约有600×(0.008+0.008+0.004)×10=120(人), 所以估计全校应有120÷40=3辆这样的校车.2.某教师统计甲、乙两位同学20次考试的数学成绩(满分150分),根据所得数据绘制茎叶图如图所示.(1)根据茎叶图求甲、乙两位同学成绩的中位数; (2)根据茎叶图比较甲、乙两位同学数学成绩的平均值及稳定程度(不要求计算出具体值,给出结论即可); (3)现从甲、乙两位同学的不低于140分的成绩中任意选出2个,设事件A 为“选出的2个成绩分别属于不同的同学”,求事件A 发生的概率.解析:(1)甲同学成绩的中位数是116+1122=119,乙同学的中位数是128+1282=128.(2)从茎叶图可以看出,乙同学成绩的平均值比甲同学成绩的平均值高,乙同学的成绩比甲同学的成绩更稳定.(3)甲同学的不低于140分的成绩有2个,分别设为a ,b ,乙同学的不低于140分的成绩有3个,分别设为c ,d ,e .从甲、乙两位同学的不低于140分的成绩中任意选出2个的情况有{a ,b },{a ,c },{a ,d },{a ,e },{b ,c },{b ,d },{b ,e },{c ,d },{c ,e },{d ,e },共10种,而选出的2个成绩分别属于不同的同学的情况有{a ,c },{a ,d },{a ,e },{b ,c },{b ,d },{b ,c },共6种,因此P (A )=610=35.3、为了调查一款电视机的使用寿命(单位:年),研究人员对该款电视机进行了相应的调查,得到的数据如下图所示.并对不同年龄层的市民对这款电视机的购买意愿作出调查,得到的数据如下表所示.愿意购买 该款电视机 不愿意购买该款电视机合计40岁及以上 800 1 000 40岁以下 600 合计 1 200(1)(2)根据表中数据判断,是否有99.9%的把握认为“是否愿意购买该款电视机”与“市民的年龄”有关; (3)若按照电视机的使用寿命进行分层抽样,从使用寿命在[0,4)和[4,20]内的电视机中抽取5台,再从这5台中随机抽取2台进行配件检测,求被抽取的2台电视机的使用寿命都在[4,20]内的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .P (K 2≥k 0) 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828(2)依题意,完善表格如下表所示,愿意购买该 款电视机 不愿意购买该款电视机合计40岁及以上 800 200 1 000 40岁以下 400 600 1 000 合计 1 200 800 2 000 故K 2=2 000×(800×600-200×400)1 000×1 000×1 200×800≈333.333>10.828,故有99.9%的把握认为“是否原意购买该款电视机”与“市民的年龄”有关.(3)依题意知,抽取的5台电视机中使用寿命在[0,4)内的有1台,使用寿命在[4,20]内的有4台,则从5台电视机中随机抽取2台,所有的情况有C 25=10(种),其中满足条件的有C 24=6(种),故所求概率P =610=35.4.某校学生参与一项社会实践活动,受生产厂家的委托,采取随机抽样的方法调查某市市民对某新研发品牌洗发水的满意度,被调查者在0分到100分的整数中给出自己的认可分数.现将收集到的100位市民的认可分数分为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]6组,并根据数据绘制出如图所示的频率分布直方图.(1)求这100位市民认可分数的中位数(精确到0.1),平均数(同一组中的数据用所在区间的中点值代表); (2)生产厂家根据同学们收集到的数据,拟随机在认可分数为80及其以上的市民中选出2位市民当产品宣传员,求这2位宣传员的认可分数都在[90,100]内的概率.解析:(1)由于[40,50),[50,60),[60,70)这三组的频率分别为0.1,0.2,0.3,故中位数位于[60,70)中,为60+10×23≈66.7,平均数为10×(45×0.01+55×0.02+65×0.03+75×0.025+85×0.01+95×0.005)=67. (2)易知认可分数在[80,90)内的人数为10,认可分数在[90,100]内的人数为5.从认可分数在[90,100]内的5人中随机选择2人的基本事件有1+2+3+4=10(个),从认可分数在[80,90)和[90,100]内的15人中随机选择2人的基本事件有1+2+3+…+14=105(个).故这2位宣传员的认可分数都在[90,100]内的概率为P =10105=221.5.在2018年俄罗斯世界杯期间,莫斯科的某商场推出了来自中国的某商品,该商品按等级分类,有等级代码,为得到该商品的等级代码数值x 与销售单价y 之间的关系,经统计得到如下数据:等级代码数值x 38 48 58 68 78 88 销售单价y /元 16.8 18.8 20.8 22.8 24 25.8(1)(系数精确到0.1);(2)若该商场销售的此商品的等级代码数值为98,请估计该等级的此商品的销售单价为多少元.参考公式:对一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线的斜率和截距的最小二乘估计分别为1221ˆni ii nii x ynx y bxnx ==-=-∑∑,ˆˆay bx =-, 参考数据:6i =1x i y i =8 440,6i =1x 2i =25 564.解析:(1)由题意,得x -=38+48+58+68+78+886=63,y -=16.8+18.8+20.8+22.8+24+25.86=21.5,所以1221ˆni ii nii x ynx ybxnx ==-=-∑∑=8 440-6×63×21.525 564-6×632≈0.2,a ^=y --b ^x -=21.5-0.2×63=8.9,故所求线性回归方程为y ^=0.2x +8.9.(2)由(1)知,当x =98时,y ^=0.2×98+8.9=28.5. 故估计该等级的此商品的销售单价为28.5元.6、某保险公司决定每月给推销员确定一个具体的销售目标,对推销员实行目标管理,销售目标确定的适当与否,直接影响公司的经济效益和推销员的工作积极性,为此该公司随机抽取了50位推销员上个月的月销售额(单位:万元),绘制成如图所示的频率分布直方图([14,16)小组对应的数据缺失):(1)(ⅰ)根据图中数据,求出月销售额在[14,16)内的频率; (ⅱ)根据频率分布直方图估计月销售额目标定为多少万元时,能够使70%的推销员完成任务,说明理由; (2)该公司决定从月销售额在[22,24)和[24,26]两个小组的推销员中,选取2位介绍销售经验,求选出的推销员来自同一个小组的概率.解析:(1)(ⅰ)月销售额在[14,16)内的频率为1-2×(0.03+0.12+0.18+0.07+0.02+0.02)=0.12. (ⅱ)若70%的推销员能完成月销售额目标,则意味着30%的推销员不能完成该目标,根据频率分布直方图知,[12,14)和[14,16)两组的频率之和为0.18,故估计月销售额目标应定为16+0.120.24×2=17(万元).(2)根据频率分布直方图可知,[22,24)和[24,26]两组的频率之和为0.08,由50×0.08=4可知待选的推销员一共有4人,设这4人分别为A 1,A 2,B 1,B 2,则不同的选择有{A 1,A 2},{A 1,B 1},{A 1,B 2},{A 2,B 1},{A 2,B 2},{B 1,B 2},一共6种情况,每一种情况都是等可能的,而2人来自同一组的情况有2种,故选出的推销员来自同一个小组的概率为P =26=13.7、已知药用昆虫的产卵数y 与一定范围内的温度x 有关,现收集了该中药用昆虫的6组观测数据如表: 温度x /℃ 21 23 24 27 29 32 产卵数y /个61120275777经计算得:6666211111126,33,()()557,()84,66i i i i i i i i i x x y y x x y y x x ========--=-=∑∑∑∑621()3930ii y y =-=∑,线性回归模型的残差平方和为31670605.8≈e ,分别为观察数据中温度和产卵数1,2,3,4,5,6i =,(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆy bx a =+(精确到0.1 );(2)若用非线性回归模型求得y 关于x 的回归方程xe y2303.006.0ˆ=,且相关指数20.9952R =,①试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好;②用拟合效果更好的模型预测温度为35℃时该中药用昆虫的产卵数(结果取整数). 附:一组数据1122(,),(,),,(,)n n x y x y x y ,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计分为121()()ˆˆˆ,()niii nii x x y y bay bx x x ==--==--∑∑,相关指数R 2=∑∑==---n i ini i iy yyy1212)()ˆ(1答案及解析:(1)依题意,61621()()557ˆ6, 6.684()iii ii x x y y n bx x ==--===≈-∑∑, 所以ˆ33 6.626138.6a≈-⨯=-, 所以y 关于x 的线性回归方程为ˆ 6.6138.6yx =-。