专题十二概率统计大题(一)命题特点和预测:分析近8年的全国新课标1理数试卷,发现8年8考,每年1题.以实际生活问题为背景,第1问多为考查抽样方法、总体估计等统计问题或概率计算、条件概率、正态分布等概率问题,第2问多为随机变量分布列及其期望计算、回归分析或独立性检验等问题,位置为18题或19题,难度为中档题.2019年仍将以实际生活问题为背景,第1问多为考查抽样方法、总体估计等统计问题或概率计算、条件概率、正态分布等概率问题,第2问多为随机变量分布列及其期望计算、回归分析或独立性检验等问题,难度仍为中档题.(二)历年试题比较:年份题目2018年【2018新课标1,理20】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为,求的最大值点.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求;(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?2017年【2017新课标1,理19】(12分)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布2 (,)Nμσ.(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在之外的零件数,求(1)P X≥及X的数学期望;(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.0410.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得,,其中ix 为抽取的第i 个零件的尺寸,.用样本平均数x 作为μ的估计值ˆμ,用样本标准差s 作为σ的估计值ˆσ,利用估计值判断是否需对当天的生产过程进行检查?剔除之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布2(,)N μσ,则,,.2016年 【2016高考新课标理数1】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X 表示2台机器三年内共需更换的易损零件数,n 表示购买2台机器的同时购买的易损零件数.(I )求X 的分布列; (II )若要求,确定n 的最小值;(III )以购买易损零件所需费用的期望值为决策依据,在19n =与20n =之中选其一,应选用哪个?2015年 【2015高考新课标1,理19】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xy w821()ii x x =-∑46.656.36.8289.81.61469108.8表中i i w x = ,w =1881ii w=∑(Ⅰ)根据散点图判断,y=a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为z =0.2y -x.根据(Ⅱ)的结果回答下列问题: (ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,)u v ,……,(,)n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为:,=v u αβ-2014年 【2014课标Ⅰ,理18】从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下图频率分布直方图:(I)求这500件产品质量指标值的样本平均值x和样本方差2s(同一组的数据用该组区间的中点值作代表);(II)由直方图可以认为,这种产品的质量指标Z服从正态分布()2,Nμσ,其中μ近似为样本平均数x,2σ近似为样本方差2s.(i)利用该正态分布,求;(ii)某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间的产品件数.利用(i)的结果,求EX.附:若则,。
2013年【2013课标全国Ⅰ,理19】(本小题满分12分)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的每件产品是优质品的概率都为12,且各件产品是否为优质品相互独立.(1)求这批产品通过检验的概率;(2)已知每件产品的检验费用为100元,且抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.2012年【2012全国,理18】某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果当天卖不完,剩下的玫瑰花作垃圾处理.(1)若花店一天购进16枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,n∈N)的函数解析式;(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表:日需求量n 14151617181920频数10201616151310以100天记录的各需求量的频率作为各需求量发生的概率.①若花店一天购进16枝玫瑰花,X表示当天的利润(单位:元),求X的分布列、数学期望及方差;②若花店计划一天购进16枝或17枝玫瑰花,你认为应购进16枝还是17枝?请说明理由.2011年【2011全国新课标,理19】某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A配方的频数分布表指标值分组[90,94)[94,98)[98,102)[102,106)[106,110] 频数82042228B配方的频数分布表指标值分组[90,94)[94,98)[98,102)[102,106)[106,110] 频数412423210(1)分别估计用A配方,B配方生产的产品的优质品率;(2)(理)已知用B配方生产的一件产品的利润y(单位:元)与其质量指标值t的关系式为从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)【解析与点睛】(2018年(20)【解析】(1)20件产品中恰有2件不合格品的概率为.因此.令,得.当时,;当时,.所以的最大值点为.(2)由(1)知,.(i)令表示余下的180件产品中的不合格品件数,依题意知,,即.所以.(ii )如果对余下的产品作检验,则这一箱产品所需要的检验费为400元. 由于,故应该对余下的产品作检验.点睛:该题考查的是有关随机变量的问题,在解题的过程中,一是需要明确独立重复试验成功次数对应的概率公式,再者就是对其用函数的思想来研究,应用导数求得其最小值点,在做第二问的时候,需要明确离散型随机变量的可取值以及对应的概率,应用期望公式求得结果,再有就是通过期望的大小关系得到结论.(2017年)【解析】试题分析:(1)根据题设条件知一个零件的尺寸在之内的概率为0.9974,则零件的尺寸在(ii )由,得μ的估计值为ˆ9.97μ=,σ的估计值为ˆ0.212σ=,由样本数据可以看出有一个零件的尺寸在之外,因此需对当天的生产过程进行检查.剔除之外的数据9.22,剩下数据的平均数为,因此μ的估计值为10.02.,剔除之外的数据9.22,剩下数据的样本方差为,因此σ的估计值为.【考点】正态分布,随机变量的期望和方差【名师点睛】数学期望是离散型随机变量中重要的数学概念,反映随机变量取值的平均水平.求解离散型随机变量的分布列、数学期望时,首先要分清事件的构成与性质,确定离散型随机变量的所有取值,然后根据概率类型选择公式,计算每个变量取每个值的概率,列出对应的分布列,最后求出数学期望.正态分布是一种重要的分布,之前考过一次,尤其是正态分布的3σ原则.(2016年)【答案】(I )见解析;(II )19;(III )19n =.【解析】所以X 的分布列为X16 17 18 19 20 21 22P 04.0 16.0 24.0 24.0 2.0 08.0 04.0(II )由(I )知,,故n 的最小值为19.(III )记Y 表示2台机器在购买易损零件上所需的费用(单位:元). 当19=n 时,.当20=n 时,4080=.可知当19=n 时所需费用的期望值小于20=n 时所需费用的期望值,故应选19=n . 【考点】概率与统计、随机变量的分布列【名师点睛】本题把随机变量的分布列与统计及函数结合在一起进行考查,有一定的综合性,但难度不是太大,求解的关键是读懂题意,所以提醒考生要重视数学中的阅读理解问题.(2015年)【解析】=576.6,. ……9分(ⅱ)根据(Ⅱ)的结果知,年利润z 的预报值,∴当x=13.6=6.82,即46.24x=时,z取得最大值.故宣传费用为46.24千元时,年利润的预报值最大.……12分【考点定位】非线性拟合;线性回归方程求法;利用回归方程进行预报预测;应用意识(2014年)【答案】(I)200,150;(II)(i)0.6826;(ii)68.26.【解析】(I)抽取产品的质量指标值的样本平均值x和样本方差2s分别为2300.02⨯200=,150=.(II)(i)由(I)知,Z服从正态分布,从而.(ii)由(i)可知,一件产品的质量指标值位于区间的概率为0.6826,依题意知,所以.X 400500800P 111611614EX==506.25.(2012年)【解析】:(1)当日需求量n ≥16时,利润y =80.当日需求量n <16时,利润y =10n -80. 所以y 关于n 的函数解析式为(2)①X 可能的取值为60,70,80,并且P (X =60)=0.1,P (X =70)=0.2,P (X =80)=0.7. X 的分布列为X 6070 80 P0.10.20.7X 的数学期望为EX =60×0.1+70×0.2+80×0.7=76. X 的方差为DX =(60-76)2×0.1+(70-76)2×0.2+(80-76)2×0.7=44. ②答案一:花店一天应购进16枝玫瑰花.理由如下:若花店一天购进17枝玫瑰花,Y 表示当天的利润(单位:元),那么Y 的分布列为Y 55 65 75 85 P0.10.20.160.54Y 55 65 75 85P0.10.20.160.54Y 的数学期望为EY =55×0.1+65×0.2+75×0.16+85×0.54=76.4.由以上的计算结果可以看出,EX <EY ,即购进17枝玫瑰花时的平均利润大于购进16枝时的平均利润.故花店一天应购进17枝玫瑰花.(2011年)【解析】:(1)由试验结果知,用A 配方生产的产品中优质品的频率为2280.3100+=,所以用A配方生产的产品的优质品率的估计值为0.3.由试验结果知,用B配方生产的产品中优质品的频率为,所以用B配方生产的产品的优质品率的估计值为0.42.(2)用B配方生产的100件产品中,其质量指标值落入区间[90,94),[94,102),[102,110]的频率分别为0.04,0.54,0.42,因此P(X=-2)=0.04,P(X=2)=0.54,P(X=4)=0.42,即X的分布列为X -22 4P 0.040.540.42X的数学期望(三)命题专家押题题号试题1. 随着互联网的兴起,越来越多的人选择网上购物.某购物平台为了吸引顾客,提升销售额,每年双十一都会进行某种商品的促销活动.该商品促销活动规则如下:①“价由客定”,即所有参与该商品促销活动的人进行网络报价,每个人并不知晓其他人的报价,也不知道参与该商品促销活动的总人数;②报价时间截止后,系统根据当年双十一该商品数量配额,按照参与该商品促销活动人员的报价从高到低分配名额;③每人限购一件,且参与人员分配到名额时必须购买.某位顾客拟参加2019双十一该商品促销活动,他为了预测该商品最低成交价,根据该购物平台的公告,统计了最近5年双十一参与该商品促销活动的人数(见下表)年份2014 2015 2016 2017 2018年份编号t 1 2 3 4 5参与人数(百万人)0.5 0.6 1 1.4 1.7(1)由收集数据的散点图发现,可用线性回归模型模拟拟合参与人数(百万人)与年份编号之间的相关关系.请用最小二乘法求关于的线性回归方程:,并预测2019年双十一参与该商品促销活动的人数;(2)该购物平台调研部门对2000位拟参与2019年双十一该商品促销活动人员的报价价格进行了一个抽样调查,得到如下的一份频数表:报价区间(千元)频数200 600 600 300 200 100①求这2000为参与人员报价的平均值和样本方差(同一区间的报价可用该价格区间的中点值代替);②假设所有参与该商品促销活动人员的报价可视为服从正态分布,且与可分别由①中所求的样本平均值和样本方差估值.若预计2019年双十一该商品最终销售量为317400,请你合理预测(需说明理由)该商品的最低成交价.参考公式即数据(i)回归方程:,其中,(ii)(iii)若随机变量服从正态分布,则,,2. 2020年开始,国家逐步推行全新的高考制度.新高考不再分文理科,采用3+3模式,其中语文、数学、外语三科为必考科目,满分各150分,另外考生还要依据想考取的高校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化学、生物6门科目中自选3门参加考试(6选3),每科目满分100分.为了应对新高考,某高中从高一年级1000名学生(其中男生550人,女生450人)中,根据性别分层,采用分层抽样的方法从中抽取100名学生进行调查.(1)学校计划在高一上学期开设选修中的“物理”和“地理”两个科目,为了了解学生对这两个科目的选课情况,对抽取到的100名学生进行问卷调查(假定每名学生在这两个科目中必须选择一个科目且只能选择一个科目),如表是根据调查结果得到的2×2列联表.请将列联表补充完整,并判断是否有99%的把握认为选择科目与性别有关?说明你的理由;(2)在抽取到的女生中按(1)中的选课情况进行分层抽样,从中抽出9名女生,再从这9名女生中随机抽取4人,设这4人中选择“地理”的人数为,求的分布列及数学期望.选择“物理”选择“地理”总计男生10女生25总计附参考公式及数据:,其中0.05 0.013.841 6.6353.某企业生产一种产品,从流水线上随机抽取100件产品,统计其质量指标值并绘制频率分布直方图(如图):规定产品的质量指标值在的为劣质品,在的为优等品,在的为特优品,销售时劣质品每件亏损1元,优等品每件盈利3元,特优品每件盈利5元.以这100 件产品的质量指标值位于各区间的频率代替产品的质量指标值位于该区间的概率.(1)求每件产品的平均销售利润;(2)该企业为了解年营销费用(单位:万元)对年销售量(单位:万件)的影响,对近5年年营销费用和年销售量数据做了初步处理,得到如图的散点图及一些统计量的值.16.30 23.20 0.81 1.62表中,,,.根据散点图判断,可以作为年销售量(万件)关于年营销费用(万元)的回归方程.①求关于的回归方程;⑦用所求的回归方程估计该企业应投人多少年营销费,才能使得该企业的年收益的预报值达到最大?(收益=销售利润营销费用,取)附:对于一组数据,,…,其回归直线均斜率和截距的最小二乘估计分别为,.4.微信作为一款社交软件已经在支付,理财,交通,运动等各方面给人的生活带来各种各样的便利.手机微信中的“微信运动”,不仅可以看自己每天的运动步数,还可以看到朋友圈里好友的步数. 先生朋友圈里有大量好友使用了“微信运动”这项功能.他随机选取了其中40名,记录了他们某一天的走路步数,统计数据如下表所示:(1)以样本估计总体,视样本频率为概率,在先生的微信朋友圈里的男性好友中任意选取3名,其中走路步数不低于6000步的有名,求的分布列和数学期望;(2)如果某人一天的走路步数不低于8000步,此人将被“微信运动”评定为“运动达人”,否则为“运动鸟人”.根据题意完成下面的列联表,并据此判断能否有90%以上的把握认为“评定类型”与“性别”有关?附:.5.某快餐连锁店招聘外卖骑手,该快餐连锁店提供了两种日工资方案:方案(1)规定每日底薪50元,快递业务每完成一单提成3元;方案(2)规定每日底薪100元,快递业务的前44单没有提成,从第45单开始,每完成一单提成5元,该快餐连锁店记录了每天骑手的人均业务量,现随机抽取100天的数据,将样本数据分为[ 25,35),[35,45),[45,55),[55,65),[65,75),[75,85),[85,95]七组,整理得到如图所示的频率分布直方图。