高考专题突破六 高考中的概率与统计问题概率与统计的综合应用例1 槟榔原产于马来西亚,在中国主要分布在云南、海南及台湾等热带地区.槟榔是重要的中药材,在南方一些少数民族还将果实作为一种咀嚼嗜好品,但其被世界卫生组织国际癌症研究机构列为致癌物清单Ⅰ类致癌物.云南某民族中学为了解A ,B 两个少数民族班的学生咀嚼槟榔的情况,分别从这两个班中随机抽取5名学生进行调查,将他们平均每周咀嚼槟榔的颗数作为样本,绘制成如图所示的茎叶图(图中的茎表示十位数字,叶表示个位数字).(1)你能否估计哪个班的学生平均每周咀嚼槟榔的颗数较多?(2)在被抽取的10名学生中,从平均每周咀嚼槟榔的颗数不低于20颗的学生中随机抽取3名学生,求抽取B 班学生人数X 的分布列和期望.解 (1)A 班样本数据的平均值为15×(9+11+14+20+31)=17,由此估计A 班学生平均每周咀嚼槟榔的颗数为17,B 班样本数据的平均值为15×(11+12+21+25+26)=19,由此估计B 班学生平均每周咀嚼槟榔的颗数为19, 故估计B 班学生平均每周咀嚼槟榔的颗数较多. (2)∵平均每周咀嚼槟榔的颗数不低于20颗的学生中, A 班有2人,B 班有3人,共有5人, ∴X 的可能取值为1,2,3,P (X =1)=C 13C 22C 35=310,P (X =2)=C 23C 12C 35=35,P (X =3)=C 33C 02C 35=110,∴X 的分布列为X 1 2 3 P31035110∴E (X )=1×310+2×35+3×110=95.思维升华 概率与统计作为考查学生应用意识的重要载体,已成为近几年高考一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性. 跟踪训练1 从某企业生产的某种产品中抽取100件,测量这些产品的质量指标值,由测量结果得到如图所示的频率分布直方图,质量指标值落在区间[55,65),[65,75),[75,85]内的频率之比为4∶2∶1.(1)求这些产品的质量指标值落在区间[75,85]内的频率;(2)若将频率视为概率,从该企业生产的这种产品中随机抽取3件,记这3件产品中质量指标值位于[45,75)内的产品件数为X ,求X 的分布列与期望.解 (1)设落在区间[75,85]内的频率为x ,则落在区间[55,65),[65,75)内的频率分别为4x 和2x , 依题意得(0.004+0.012+0.019+0.030)×10+4x +2x +x =1, 解得x =0.05.所以落在区间[75,85]内的频率为0.05.(2)从该企业生产的该种产品中随机抽取3件,相当于进行了3次独立重复试验,所以X 服从二项分布B (n ,p ),其中n =3.由(1)得,落在区间[45,75)内的频率为0.3+0.2+0.1=0.6,将频率视为概率得p =0.6. 因为X 的所有可能取值为0,1,2,3, 则P (X =0)=C03×0.60×0.43=0.064, P (X =1)=C13×0.61×0.42=0.288, P (X =2)=C23×0.62×0.41=0.432, P (X =3)=C33×0.63×0.40=0.216, 所以X 的分布列为X 0 1 2 3 P0.0640.2880.4320.216所以X 的期望为E (X )=0×0.064+1×0.288+2×0.432+3×0.216=1.8. (或直接根据二项分布的期望公式得到E (X )=np =3×0.6=1.8)概率与统计案例的综合应用例2(2020·华中师大附中模拟)中国大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接受大学思维方式、学习方法的训练,为大学学习乃至未来的职业生涯做好准备.某高中开设大学先修课程已有两年,两年共招收学生2 000人,其中有300人参与学习先修课程,两年全校共有优等生200人,学习先修课程的优等生有60人.这两年学习先修课程的学生都参加了考试,并且都参加了某高校的自主招生考试(满分100分),结果如表所示:分数a 95≤a≤10085≤a<9575≤a<8560≤a<75a<60人数20551057050自招通0.90.80.60.50.4过率(1)填写列联表,并画出列联表的等高条形图,并通过图形判断学习先修课程与优等生是否有关系,根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系?优等生非优等生总计学习大学先修课程没有学习大学先修课程总计(2)已知今年有150名学生报名学习大学先修课程,以前两年参加大学先修课程学习成绩的频率作为今年参加大学先修课程学习成绩的概率.①在今年参加大学先修课程的学生中任取一人,求他获得某高校自主招生通过的概率;②设今年全校参加大学先修课程的学生通过某高校自主招生考试人数为ξ,求E(ξ).参考数据:P(χ2≥k0)0.150.100.050.0250.0100.005k 02.072 2.7063.841 5.024 6.635 7.879参考公式:χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2.解 (1)列联表如下:优等生 非优等生 总计 学习大学先修课程 60 240 300 没有学习大学先修课程140 1 560 1 700 总计2001 8002 000等高条形图如图:通过图形可判断学习先修课程与优等生有关系,又 χ2=2 000(60×1 560-140×240)2300×1 700×200×1 800≈39.216>6.635,因此在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系. (2)①P =20300×0.9+55300×0.8+105300×0.6+70300×0.5+50300×0.4=0.6.②设通过某高校自主招生考试的人数为ξ, 则ξ~B ⎝⎛⎭⎫150,35, P (x =k )=C k 150⎝⎛⎭⎫35k ⎝⎛⎭⎫25150-k ,k =0,1,2,…,150, 所以E (ξ)=150×35=90.思维升华 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练2 某商场营销人员进行某商品M 市场营销调查发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到下表:(1)经分析发现,可用线性回归模型拟合当地该商品销量y (百件)与返还点数t 之间的相关关系,请用最小二乘法求y 关于t 的回归直线方程y ^=b ^t +a ^,并预测若返还6个点时该商品每天的销量;(2)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:①求这200位拟购买该商品的消费者对返还点数的心理预期值X 的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);②将对返还点数的心理预期值在[1,3)和[11,13]的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中“欲望膨胀型”消费者的人数为随机变量X ,求X 的分布列及期望.参考公式及数据:b ^=∑i =1nt i y i -n t y∑i =1nt 2i -n t 2,a ^=y -b ^t ;∑i =15tiyi =18.8.解 (1)由题意知t =1+2+3+4+55=3,y =0.5+0.6+1+1.4+1.75=1.04,∑i =15t 2i =12+22+32+42+52=55,b ^=∑i =15t i yi -5t y∑i =15t 2i -5t2=18.8-5×3×1.0455-5×32=0.32,a ^=y -b ^t =1.04-0.32×3=0.08, 则y 关于t 的回归直线方程为y ^=0.32t +0.08,当t =6时,y ^=2.00,即返还6个点时该商品每天销量约为200件.(2)①根据题意,这200位拟购买该商品的消费者对返还点数的心理预期值X 的样本平均数x 为x =2×0.1+4×0.3+6×0.3+8×0.15+10×0.1+12×0.05=6, 中位数的估计值为5+2×100-20-6060=5+23≈5.7.②抽取的6名消费者中“欲望紧缩型”消费者人数为6×2030=4,“欲望膨胀型”消费者人数为6×1030=2.故X 的所有可能取值为0,1,2.P (X =2)=C 14C 22C 36=15,P (X =1)=C 24C 12C 36=35,P (X =0)=C 34C 02C 36=15,故随机变量X 的分布列为X 0 1 2 P153515E (X )=2×15+1×35+0×15=1.期望与方差在决策中的应用例3 (2018·全国Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件做检验,再根据检验结果决定是否对余下的所有新产品做检验.设每件产品为不合格品的概率都为p (0<p <1),且各件产品为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p ),求f (p )的最大值点p 0;(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品做出检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品做检验?解(1)20件产品中恰有2件不合格品的概率为f(p)=C220·p2(1-p)18.因此f′(p)=C220[2p(1-p)18-18p2(1-p)17]=2C220p(1-p)17(1-10p).令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0.所以f(p)的最大值点为p0=0.1.(2)由(1)知,p=0.1①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以E(X)=E(40+25Y)=40+25E(Y)=490.②如果对余下的产品做检验,则这一箱产品所需要的检验费为400元.由于E(X)=490>400,故应该对余下的产品做检验.思维升华随机变量的期望反映了随机变量取值的平均水平,方差反映了随机变量偏离均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要依据,一般先比较期望,若期望相同,再由方差来决定.跟踪训练3(2020·100所名校最新冲刺卷)某中学是走读中学,为了让学生更有效率的利用下午放学后的时间,学校在本学期第一次月考后设立了多间自习室,以便让学生在自习室自主学习、完成作业,同时每天派老师轮流值班.在本学期第二次月考后,高一某班数学老师统计了两次考试该班数学成绩优良人数和非优良人数,得到如下2×2列联表:(1)能否在犯错的概率不超过0.005的前提下认为设立自习室对提高学生成绩有效?(2)设从该班第一次月考的所有数学成绩中任取两个,取到成绩优良数为X;从该班第二次月考的所有数学成绩中任取两个,取到成绩优良数为Y,求X与Y的期望并比较大小,请解释所得结论的实际含义. 下面的临界值表供参考:P (χ2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828(参考公式:χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2.解(1) χ2=80(25×30-15×10)240×40×35×45≈11.43>7.879,所以能在犯错的概率不超过0.005的前提下认为设立自习室对提高学生成绩有效. (2)X 的所有可能取值为0,1,2,则P (X =0)=C 225C 240=513,P (X =1)=C 125C 115C 240=2552,P (X =2)=C 215C 240=752,X 0 1 2 P5132552752所以E (X )=0×513+1×2552+2×752=34.Y 的所有可能取值为0,1,2,则P (Y =0)=C 210C 240=352,P (Y =1)=C 110C 130C 240=513,P (Y =2)=C 230C 240=2952,Y 0 1 2 P3525132952所以E (Y )=0×352+1×513+2×2952=32,即E (X )<E (Y ),其实际含义是设立自习室后学生的数学成绩提高,说明设立自习室对提高学生成绩有效.例 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率; (2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1 000元的人数,求X 的分布列和期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2 000元的人数有变化?说明理由. 规范解答解 (1)由题意知,样本中仅使用A 的学生有18+9+3=30(人),仅使用B 的学生有10+14+1=25(人),A ,B 两种支付方式都不使用的学生有5人,故样本中A ,B 两种支付方式都使用的学生有100-30-25-5=40(人).[1分]所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率为40100=0.4.[2分](2)X 的所有可能值为0,1,2.[3分]记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于 1 000元”.由题设知,事件C ,D 相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6,[4分]所以P (X =2)=P (CD )=P (C )P (D )=0.24.[5分] P (X =1)=P (C D ∪C D ) =P (C )P (D )+P (C )P (D ) =0.4×(1-0.6)+(1-0.4)×0.6 =0.52,[6分]P (X =0)=P (C D )=P (C )P (D )=0.24.[7分]所以X的分布列为X 01 2P 0.240.520.24[8分]故X的期望E(X)=0×0.24+1×0.52+2×0.24=1.0.[9分](3)记事件E为“从样本仅使用A的学生中随机抽查3人,他们本月的支付金额大于2 000元”.假设样本仅使用A的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P(E)=1C330=14 060.[11分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分]答案示例2:无法确定有没有变化,理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母.第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值.第四步:作出判断得结论,依据题意,借助数表作出正确判断.第五步:反思回顾,查看关键点、易错点和答题规范性.。