概率统计(二)1.某批零件的尺寸X 服从正态分布()210,N σ,且满足()198P x <=,零件的尺寸与10的误差不超过1即合格,从这批产品中抽取n 件,若要保证抽取的合格零件不少于2件的概率不低于0.9,则n 的最小值为2.网购作为一种新的消费方式,因其具有快捷、商品种类齐全、性价比高等优势而深受广大消费者认可.某网购公司统计了近五年在本公司网购的人数,得到如下的相关数据(其中“x =1”表示2015年,“x =2”表示2016年,依次类推;y 表示人数):(1)试根据表中的数据,求出y 关于x 的线性回归方程,并预测到哪一年该公司的网购人数能超过300万人;(2)该公司为了吸引网购者,特别推出“玩网络游戏,送免费购物券”活动,网购者可根据抛掷骰子的结果,操控微型遥控车在方格图上行进. 若遥控车最终停在“胜利大本营”,则网购者可获得免费购物券500元;若遥控车最终停在“失败大本营”,则网购者可获得免费购物券200元. 已知骰子出现奇数与偶数的概率都是12,方格图上标有第0格、第1格、第2格、…、第20格。
遥控车开始在第0格,网购者每抛掷一次骰子,遥控车向前移动一次.若掷出奇数,遥控车向前移动一格(从k 到1k +)若掷出偶数遥控车向前移动两格(从k 到2k +),直到遥控车移到第19格胜利大本营)或第20格(失败大本营)时,游戏结束。
设遥控车移到第(119)n n ≤≤格的概率为n P ,试证明{}1n n P P --是等比数列,并求网购者参与游戏一次获得免费购物券金额的期望值.附:在线性回归方程ˆˆˆybx a =+中,1221ˆˆˆ,ni ii nii x y nxyb ay b x xnx ==-==--∑∑. 3.湖南省会城市长沙又称星城,是楚文明和湖湘文化的发源地,是国家首批历史文化名城.城内既有岳麓山、橘子洲等人文景观,又有岳麓书院、马王堆汉墓等名胜古迹,每年都有大量游客来长沙参观旅游.为合理配置旅游资源,管理部门对首次来岳麓山景区游览的游客进行了问卷调查,据统计,其中13的人计划只游览岳麓山,另外23的人计划既游览岳麓山又参观马王堆.每位游客若只游览岳麓山,则记1分;若既游览岳麓山又参观马王堆,则记2分.假设每位首次来岳麓山景区游览的游客计划是否参观马王堆相互独立,视频率为概率. (1)从游客中随机抽取3人,记这3人的合计得分为X ,求X 的分布列和数学期望; (2)从游客中随机抽取n 人(*n ∈N ),记这n 人的合计得分恰为1n +分的概率为n P ,求12n P P P +++L ;(3)从游客中随机抽取若干人,记这些人的合计得分恰为n 分的概率为n a ,随着抽取人数的无限增加,n a 是否趋近于某个常数?若是,求出这个常数;若不是,说明理由. 4. 随着现代社会的发展,我国对于环境保护越来越重视,企业的环保意识也越来越强.现某大型企业为此建立了5套环境监测系统,并制定如下方案:每年企业的环境监测费用预算定为1200万元,日常全天候开启3套环境监测系统,若至少..有2套系统监测出排放超标,则立即检查污染源处理系统;若有且只有....1套系统监测出排放超标,则立即同时启动另外2套系统进行1小时的监测,且后启动的这2套监测系统中只要有1套系统监测出排放超标,也立即检查污染源处理系统.设每个时间段(以.1.小时为计量单位.......)被每套系统监测出排放超标的概率均为(01)p p <<,且各个时间段每套系统监测出排放超标情况相互独立. (1)当12p =时,求某个时间段需要检查污染源处理系统的概率; (2)若每套环境监测系统运行成本为300元/小时(不启动则不产生运行费用),除运行费用外,所有的环境监测系统每年的维修和保养费用共需要100万元.现以此方案实施,问该企业的环境监测费用是否会超过预算(全年按9000小时计算)?并说明理由.5. 某电子公司新开发一电子产品,该电子产品的一个系统G 有3个电子元件组成,各个电子元件能否正常工作的概率均为12,且每个电子元件能否正常工作相互独立.若系统C 中有超过一半的电子元件正常工作,则G 可以正常工作,否则就需要维修,且维修所需费用为500元.(1)求系统不需要维修的概率;(2)该电子产品共由3个系统G 组成,设E 为电子产品需要维修的系统所需的费用,求ξ的分布列与期望;(3)为提高G 系统正常工作概率,在系统内增加两个功能完全一样的其他品牌的电子元件,每个新元件正常工作的概率均为p ,且新增元件后有超过一半的电子元件正常工作,则C 可以正常工作,问:p 满足什么条件时,可以提高整个G 系统的正常工作概率?6.在全球关注的抗击“新冠肺炎”中,某跨国科研中心的一个团队,研制了甲、乙两种治疗“新冠肺炎”新药,希望知道哪种新药更有效,为此进行动物试验,试验方案如下:第一种:选取,,,,,,,,,A B C D E F G H I J 共10只患病白鼠,服用甲药后某项指标分别为:84,87,89,91,92,92,86,89,90,90;第二种:选取,,,,,,,,,a b c d e f g h i j 共10只患病白鼠,服用乙药后某项指标分别为:81,87,83,82,80,90,86,89,84,79;该团队判定患病白鼠服药后这项指标不低于85的确认为药物有效,否则确认为药物无效.(1)已知第一种试验方案的10个数据的平均数为89,求这组数据的方差;(2)现需要从已服用乙药的10只白鼠中随机抽取7只,记其中服药有效的只数为ξ,求ξ的分布列与期望;(3)该团队的另一实验室有1000只白鼠,其中900只为正常白鼠,100只为患病白鼠,每用新研制的甲药给所有患病白鼠服用一次,患病白鼠中有90%变为正常白鼠,但正常白鼠仍有%010t t <<()变为患病白鼠,假设实验室的所有白鼠都活着且数量不变,且记服用n 次甲药后此实验室正常白鼠的只数为n a .(i )求1a 并写出1n a +与n a 的关系式;(ii )要使服用甲药两次后,该实验室正常白鼠至少有950只,求最大的正整数t 的值. 7.红铃虫能对农作物造成严重伤害,每只红铃虫的平均产卵数y 和平均温度x 有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.(表中711ln ,7i i i z y z z ===∑)(1)根据散点图判断,y a bx =+与dxy ce =(其中e 2.718=L 自然对数的底数)哪一个更适宜作为平均产卵数y 关于平均温度x 的回归方程类型?(给出判断即可,不必说明理由)并由判断结果及表中数据,求出y 关于x 的回归方程.(结果精确到小数点后第三位) (2)根据以往统计,该地每年平均温度达到28℃以上时红铃虫会造成严重伤害,需要人工防治,其他情况均不需要人工防治,记该地每年平均温度达到28℃以上的概率为()01p p <<.℃记该地今后5年中,恰好需要3次人工防治的概率为()f p ,求()f p 的最大值,并求出相应的概率p .℃当()f p 取最大值时,记该地今后5年中,需要人工防治的次数为X ,求X 的数学期望和方差.附:线性回归方程系数公式()()()121ˆˆˆ,niii nii x x y y bay bx x x ==-⋅-==--∑∑. 8.公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,x 表示活动推出的天数,y 表示每天使用扫码支付的人次(单位:十人次),统计数据如表下所示:根据以上数据,绘制了散点图.(1)根据散点图判断,在推广期内,y a bx =+与x y c d =⋅(,c d 均为大于零的常数),哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型?(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表1中的数据,建立y 与x 的回归方程,并预测活动推出第8天使用扫码支付的人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下表:西安公交六公司车队为缓解周边居民出行压力,以80万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0.66万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有16的概率享受7折优惠,有13的概率享受8折优惠,有12的概率享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据所给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,假设这批车需要n (n ∈+N )年才能开始盈利,求n 的值. 参考数据:yv71i ii x y=∑71i ii x v=∑0.541062.14 1.54 2535 50.12 3.47其中其中lg i i v y =,7117i i v v ==∑,参考公式:对于一组数据11(,)u v ,22(,)u v ,L ,(,)n n u v ,其回归直线ˆˆv u αβ=+的斜率和截距的最小二乘估计公式分别为:1221ˆni i i nii u v nu vunu β==-⋅=-∑∑,ˆˆv u αβ=-. 9 某果园种植“糖心苹果”已有十余年,根据其种植规模与以往的种植经验,产自该果园的单个“糖心苹果”的果径(最大横切面直径,单位:mm )在正常环境下服从正态分布()6836N ,.(1)一顾客购买了20个该果园的“糖心苹果”,求会买到果径小于56mm 的概率; (2)为了提高利润,该果园每年投入一定的资金,对种植、采摘、包装、宣传等环节进行改进.如图是2009年至2018年,该果园每年的投资金额x (单位:万元)与年利润增量y (单位:万元)的散点图:该果园为了预测2019年投资金额为20万元时的年利润增量,建立了y 关于x 的两个回归模型;模型℃:由最小二乘公式可求得y 与x 的线性回归方程: 2.5020ˆ.5yx =-; 模型℃:由图中样本点的分布,可以认为样本点集中在曲线:ln y b x a =+的附近,对投资金额x 做交换,令ln t x =,则y b t a =⋅+,且有10122.00ii t==∑,101230i i y ==∑,101569.00i i i t y ==∑,102150.92i i t ==∑. (I )根据所给的统计量,求模型℃中y 关于x 的回归方程;(II )根据下列表格中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测投资金额为20万元时的年利润增量(结果保留两位小数).附:若随机变量()2X N μσ:,,则()220.9544P X μσμσ-≤≤+=,()330.9974P X μσμσ-≤≤+=;样本()(),12i i t y i n =⋅⋅⋅,,,的最小乘估计公式为()()()121ˆni i i nii t t y y btt==--=-∑∑,ˆˆay bt =-;相关指数()()22121ˆ1ni i nii y yR y y ==-=--∑∑.参考数据:200.97720.6305≈,200.99870.9743≈,ln 20.6931≈,ln5 1.6094≈.10.2020年,新冠状肺炎疫情牵动每一个中国人的心,危难时刻众志成城,共克时艰,为疫区助力.福建省漳州市东山县共101个海鲜商家及个人为缓解武汉物质压力,募捐价值百万的海鲜输送武汉.东山岛,别称陵岛,形似蝴蝶亦称蝶岛,隶属于福建省漳州市东山县,是福建省第二大岛,中国第七大岛,介于厦门市和广东省汕头之间,东南是著名的闽南渔场和粤东渔场交汇处,因地理位置发展海产品养殖业具有得天独厚的优势.根据养殖规模与以往的养殖经验,某海鲜商家的海产品每只质量(克)在正常环境下服从正态分布(280,25)N .(1)随机购买10只该商家的海产品,求至少买到一只质量小于265克该海产品的概率; (2)2020年该商家考虑增加先进养殖技术投入,该商家欲预测先进养殖技术投入为49千元时的年收益增量.现用以往的先进养殖技术投入i x (千元)与年收益增量i y (千元).(1,2,3,,8)i =⋅⋅⋅的数据绘制散点图,由散点图的样本点分布,可以认为样本点集中在曲线y a =+46.6,x =563,y = 6.8,t =()821289.8,i i x x =-=∑()8211.6ii tt=-=∑,()()811469,i i i x x y y =--=∑()()81108.8i i i t ty y =--=∑,其中i t =8118i i t t ==∑.根据所给的统计量,求y 关于x 的回归方程,并预测先进养殖技术投入为49千元时的年收益增量.附:若随机变量~(1,4)Z N ,则(57)0.9974,P Z -<<=100.99870.9871≈;对于一组数据()11,,u v ()22,,u v ,⋅⋅⋅(),n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆ,niii ni i u u v v u u β==--=-∑∑ˆˆv u αβ=-. 主干知识夯实提升之概率统计(二)答案1.4.因为()210,X N σ:,且()198P X <=,所以()39114P X <<=,即每个零件合格的概率为34.合格零件不少于2件的对立事件是合格零件个数为零个或一个.合格零件个数为零个或一个的概率为101131C C 444nn n n -⎛⎫⎛⎫⎛⎫+⋅⋅ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,()1310.14nn ⎛⎫+< ⎪⎝⎭①, 令()()()1314nf n n n *⎛⎫=+∈ ⎪⎝⎭N .因为()()1341124f n n f n n ++=<+,所以()f n 单调递减,又因为()40.1f <,()30.1f >,所以不等式①的解集为4n ≥. 2.解:(1)3,x =100y = ,511202503100415051801920i ii x y==⨯+⨯+⨯+⨯+⨯=∑522222211234555,ii x==++++=∑,故19205310042,5559b-⨯⨯==-⨯$ 从而$10042326,a y bx =-=-⨯=-$所以所求线性回归方程为$4226y x =-,令*4226300,x x N ->∈,解得8x ≥.故预计到2022年该公司的网购人数能超过300万人(2)遥控车开始在第0格为必然事件,01P =,第一次掷骰子出现奇数,遥控车移到第一格,其概率为12,即112P =.遥控车移到第n (219n 剟)格的情况是下列两种,而且也只有两种.①遥控车先到第2n -格,又掷出奇数,其概率为212n P -;①遥控车先到第1n -格,又掷出偶数,其概率为112n P -所以211122n n n P P P --=+,1121()2n n n n P P P P ---∴-=-- ∴当119n 剟时,数列1{}n n P P --是公比为12-的等比数列2312132111111,(),(),()2222nn n P P P P P P P -∴-=--=--=-⋅⋅⋅-=-,以上各式相加,得2311111()()()()2222n n P -=-+-+-+⋅⋅⋅+-=11()1()32n ⎡⎤---⎢⎥⎣⎦,1211()32n n P +⎡⎤∴=--⎢⎥⎣⎦(0,1,2,,19n =⋅⋅⋅), ∴获胜的概率2019211()32P ⎡⎤=--⎢⎥⎣⎦,失败的概率1920181111232P P ⎡⎤==+⎢⎥⎣⎦()∴设参与游戏一次的顾客获得优惠券金额为X 元,200X =或500∴X 的期望201919211115001()2001()1004()32322EX ⎡⎤⎡⎤⎡⎤=⨯-+⨯+=-⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦,∴参与游戏一次的顾客获得优惠券金额的期望值为1911004()2⎡⎤-⎢⎥⎣⎦,约400元.3解:(1)据题意,每位游客计划不参观马王堆的概率为13,记1分;参观马王堆的概率为23,记2分,则X 的可能取值为3,4,5,6.其中311(3)327P X ⎛⎫=== ⎪⎝⎭,213212(4)C 339P X ⎛⎫==⋅⋅= ⎪⎝⎭,223214(5)C 339P X ⎛⎫==⋅⋅= ⎪⎝⎭,328(6)327P X ⎛⎫===⎪⎝⎭. 所以X 的分布列为34565279927EX =⨯+⨯+⨯+⨯=. (2)因为这n 人的合计得分为1n +分,则其中有且只有1人计划参观马王堆, 所以11212C 333n nnnnP -⎛⎫=⋅⋅=⎪⎝⎭.设1232324623333n n n n S P P P P =++++=+++⋯+L ,则2311242(1)233333n n n n nS +-=++⋅⋅⋅++. 两式相减,得231222222333333n n n n S +=+++⋅⋅⋅+-11111223332113313n n n nn ++⎛⎫- ⎪+⎝⎭=⨯-=--,所以121323123n n n n P P P S ++⎛⎫+++==- ⎪⎝⎭L . (3)在随机抽取若干人的合计得分为1n -分的基础上再抽取1人,则这些人的合计得分可能为n 分或1n +分,记“合计得n 分”为事件A ,“合计得1n +分”为事件B ,则A 与B 为对立事件.因为()n P A a =,12()3n P B a -=,则1213n n a a -+=(2n ≥),即1323535n n a a -⎛⎫-=-- ⎪⎝⎭(2n ≥).因为113a =,则数列35n a ⎧⎫-⎨⎬⎩⎭是首项为415-,公比为23-的等比数列,所以13425153n n a -⎛⎫-=-⋅- ⎪⎝⎭,即13423225153553n nn a -⎛⎫⎛⎫=-⋅-=+⋅- ⎪⎪⎝⎭⎝⎭.因为2013<-<,则n →∞时,203n⎛⎫-→ ⎪⎝⎭,从而35n a →,所以随着抽取人数的无限增加,n a 趋近于常数35.4.(1)Q 某个时间段在开启3套系统就被确定需要检查污染源处理系统的概率为2332333333321111()()112()()22222C C C C ⨯==++,某个时间段在需要开启另外2套系统才能确定需要检查污染源处理系统的概率为1323119()[1()]2232C -=∴某个时间段需要检查污染源处理系统的概率为192523232+=.(2)设某个时间段环境监测系统的运行费用为X 元,则X 的可能取值为900,1500.123(1500)(1)P X C p p ==-Q ,123(900)1(1)==--P X C p p121233()900[1(1)]1500(1)E X C p p C p p ∴=---⨯⨯+29001800(1)p p =+-令2()(1),(0,1)g p p p p =-∈,则2()(1)2(1)(31)(1)g p p p p p p '=---=-- 当1(0,)3p ∈时,()0g p '>,()g p 在1(0,)3上单调递增;当1()1,3p ∈时,()0g p '<,()g p 在上1(,1)3单调递减,()g p ∴的最大值为14()327=g ,∴实施此方案,最高费用为441009000(9001800)10115027-+=⨯+⨯⨯(万元),11501200<Q ,故不会超过预算. 5(1)系统不需要维修的概率为23233311112222C C ⎛⎫⎛⎫⋅⋅+⋅= ⎪ ⎪⎝⎭⎝⎭.(2)设X 为维修维修的系统的个数,则13,2X B ⎛⎫ ⎪⎝⎭:,且500X ξ=,所以()()3311500,0,1,2,322kkk P k P X k C k ξ-⎛⎫⎛⎫====⋅⋅= ⎪⎪⎝⎭⎝⎭.所以ξ的分布列为所以ξ的期望为()50037502E ξ=⨯⨯=. (3)当系统G 有5个电子元件时,原来3个电子元件中至少有1个元件正常工作,G 系统的才正常工作.若前3个电子元件中有1个正常工作,同时新增的两个必须都正常工作,则概率为21223113228C p p ⎛⎫⋅⋅⋅= ⎪⎝⎭;若前3个电子元件中有两个正常工作,同时新增的两个至少有1个正常工作,则概率为()()2221222323111131222228C C p p C p p p ⎛⎫⎛⎫⋅⋅⋅⋅⋅-+⋅⋅⋅=- ⎪ ⎪⎝⎭⎝⎭;若前3个电子元件中3个都正常工作,则不管新增两个元件能否正常工作,系统G 均能正常工作,则概率为3331128C ⎛⎫⋅= ⎪⎝⎭.所以新增两个元件后系统G 能正常工作的概率为()2233131288848p p p p +-+=+,于是由()3113214828p p +-=-知,当210p ->时,即112p <<时,可以提高整个G 系统的正常工作概率. 6.(1)方差21(25404999011) 6.210s =+++++++++= (2)在第二种试验中服药有效的白鼠有4只,服药无效的白鼠有6只,故ξ的可能取值为1,2,3,4.16467104(1)120C C P C ξ===,254671036(2)120C C P C ξ===,344671060(3)120C C P C ξ===,434671020(4)120C C P C ξ===,因此ξ的分布列为()13111412343010265E ξ=⨯+⨯+⨯+⨯= (3)(①)19909a t =-,依题设知()191100010010n nn t a a a +⎛⎫=-+- ⎪⎝⎭,即110900(010)100n n t a a t +-=+<<(①)211010900(9909)900100100t ta a t --=+=-+,由2950a ≥可得()()9909105000t t --≥记函数()()()990910f t t t =--,其中0t 10<<,则函数()()()990910f t t t =--在()0,10上单调递减,且()45724f =,()54725f =,故最大的正整数4t =7解:(1)根据散点图可以判断,dxy ce =更适宜作为平均产卵数y 关于平均温度x 的回归方程类型;对dxy ce =两边取自然对数,得ln ln y c dx =+;令ln ,ln ,z y a c b d ===,得z a bx =+;因为()()()7121740.182ˆ0.272147.714iii i i x x zz bx x ==--==≈-∑∑,ˆˆ 3.6120.27227.429 3.849az bx =-=-⨯≈-;所以z 关于x 的回归方程为ˆ0.272 3.849zx =-;所以y 关于x 的回归方程为0.272 3.849ˆx y e -=; (2)(i )由5332()(1)f p C p p =⋅⋅-,得()325(1)(35)f C p p p p '=⋅--,因为01p <<,令()0f p '>,得350p ->,解得305p <<;所以()f p 在30,5⎛⎫ ⎪⎝⎭上单调递增,在3,15⎛⎫⎪⎝⎭上单调递减,所以()f p 有唯一的极大值为35f ⎛⎫ ⎪⎝⎭,也是最大值;所以当35p =时,()max 32165625f p f ⎛⎫== ⎪⎝⎭;(ii )由(i )知,当()f p 取最大值时,35p =,所以3~5,5X B ⎛⎫⎪⎝⎭,所以X 的数学期望为3()535E X =⨯=,方差为326()5555D X =⨯⨯=. 8.(1)根据散点图判断,在推广期内, x y c d =⋅(,c d 均为大于零的常数),适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型.(2)根据(1)的判断结果xy c d =⋅,两边取对数得lg lg lg y c d x =+⋅,其中lg i i v y =,711 1.547i i v v ===∑,7721150,12,4,140i i i i i x x v x =====∑∑,71221lg 0.2ˆ5i i i ni i x v nx v d x nxβ==-⋅===-∑∑,ˆˆlg 0.54c v x αβ==-=,所以lg 0.540.25y x =+⋅。