当前位置:文档之家› 北邮概率论与数理统计条件概率1.3

北邮概率论与数理统计条件概率1.3

§1.3 条件概率条件概率是概率论中的一个基本概念,也是概率论中的一个重要工具,它既可以帮助我们认识更复杂的随机事件,也可以帮助我们计算一些复杂事件的概率。

1. 条件概率的定义及计算在一个随机试验中或随机现象中,当我们已知一个事件B 发生了,这时对另外一个事件A 发生的概率往往需要重新给出度量.称事件A 的这个新概率为在事件B 发生的条件下事件A 发生的条件概率,记为)|(B A P .为了对条件概率有一个直观的认识以及考虑该如何给出条件概率的数学定义,我们先看一个例子.例1 一批同类产品由甲、乙两个车间生产,各车间生产的产品数及正品和次品的情况如下表甲车间 乙车间合计 正品 465 510975 次品 15 1025 合计 480520 1000 从这批产品中任取一件,则这件产品是次品的概率为%5.2100025= 现在假设被告知取出的产品是由甲车间生产的,那么这件产品为次品的概率就不再是%5.2,而是%125.348015= 在本例中,设B 表示事件“取出的产品是由甲车间生产的”,A 表示事件“取出的产品是次品”,前面算出的事件A 的概率是在没有任可进一步的信息的情况下得到的,而后面算出的事件A 的概率是在有了 “事件B 发生了”这一信息的情况下得到的.后一个概率就是在事件B 发生的条件下事件A 发生的条件概率.与此对应,我们可以把前一个概率称为无条件概率。

经过简单计算有)()(1000/4801000/1548015)|(B P AB P B A P === 这个关系式尽管是从本例得出的,但它具有普遍意义.受由启发,我们可以在一般的样本空间中给出条件概率的数学定义.定义 设B A ,是样本空间Ω中的两个事件,且0)(>B P ,在事件B 发生的条件下,事件A 的条件概率定义为)()()|(B P AB P B A P = 根据条件概率的定义,不难验证条件概率满足概率定义中的三条公理:(1)非负性:对任一事件B ,有0)|(≥A B P ;(2)规范性:1)|(=ΩA P ;(3)可列可加性:设⋅⋅⋅⋅⋅⋅,,,,21n B B B 是两两互不相容的事件,则有∑∞=∞==⋃11)|()|(n n n n A B P A B P 自然地,条件概率也具有三条公理导出的一切性质. 比如)|(1)|(A B P A B P -=,)|()|()|()|(212121A B B P A B P A B P A B B P -+=⋃.例2 将一骰子掷两次, 已知两次的点数之和为6,求第一次的点数大于第二次点数的概率. 解:设事件=A “两次的点数之和为6”, 事件=B “第一次的点数大于第二次点数2” 方法一(在缩减的样本空间中计算).在事件A 发生的条件下,样本空间缩减为)}3,3(),2,4(),4,2(),1,5(),5,1{(=ΩA在此样本空间中考虑,事件B 包含2个样本点,所以52)|(=A B P . 方法二.365)(=A P , 362)(=AB P ,所以 5236/536/2)|(==A B P . 例 3 对于寿险产品设计而言,需关注不同年龄的人能继续存活若干年的概率.假设根据经验或某种寿命分布理论,人的寿命超过60岁的概率为0.9, 超过70岁的概率为0.8.求60岁的人能继续存活10年的概率.解:设事件=A “人的超过60岁”, =B “人的超过70岁”,则9.0)(=A P ,8.0)(=B P ,且A B ⊂,所求的概率为98)()()()()|(===A P B P A P AB P A B P . 思考:1.考虑恰有2个小孩的家庭,从这样的家庭中任选一家,已知这个家有男孩,那么这家两个小孩都是男孩的概率是多少?2.随机地遇到一男孩,并发现他属于两个孩子的家庭,那么他家的另一个小孩也是男孩的概率是多少?3.有3张完全相同的卡片,第一张卡片两面全涂成红色,第二张卡片两面全涂成黑色,第三张卡片一面涂成红色一面涂成黑色.现从3张卡片中随机取1张并放在桌面上,如果朝上的一面是红色,那么另一面是黑色的概率有多大?4.(领奖问题)某人参加了有奖竞答活动,他全过关了,现到领奖阶段,领奖规则是:有三个房间,其中一个房间里放有奖品,而另外二个房间没有奖品,全过关的选手任选一个房间,若房间里有奖品则他获得此奖品,否则没有奖品.现此人选了一房间,在他还没有打开房门时主持人打开了另外二个房门中的一个,结果没有奖品,这时该选手还有重新选择的机会,你认为应该坚持原来的选择还是换一个选择或两者皆可?二.条件概率的应用下面给出条件概率的三个非常实用的公式: (1)乘法公式;(2)全概率公式;(3)贝叶斯公式.1. 乘法公式由条件概率的定义易知)|()()(A B P A P AB P =上面公式只是条件概率定义的平凡变形,但在具体的概率计算问题中如果)|()(A B P A P ,都可方便地算出,那么利用上式就可方便地算出)(AB P .上面公式可推广至多个事件的情形:)|()|()|()()(12121312121-⋅⋅⋅⋅⋅⋅=⋅⋅⋅n n n A A A A P A A A P A A P A P A A A P ,为保证上面公式中涉及到的条件概率有意义,需要前提:0)(121>⋅⋅⋅-n A A A P .上面公式称为乘法公式.例4 一个袋有7个球,其中5个红球,2个白球.从中依次取3次球,每次取一个,取后不放回.试求事件=A “前2次取到红球,最后1次取到白球”的概率.解:设=i A “第i 次取到红球”,3,2,1=i ,则321A A A A =,从而 214526475)|()|()()()(213121321=⨯⨯===A A A P A A P A P A A A P A P .例5(Polya 罐子模型) 设一罐子有b 个黑球,r 个红球,每次随机地取一个球,取出的球放回罐子中,还加进c 个同色球和d 个异色球,如此反复取3次球.记i B 为事件“第i 次取出的球是黑球”, j R 为事件“第j 次取出的球是红球”,求)(321R R R P ,)(321R B R P . 解:)(321R R R P )(22)|()|()(213121d c r b c r d c r b c r r b r R R R P R R P R P ++++⋅++++⋅+==, )(321R B R P )(2)|()|()(213121d c r b d c r d c r b d b r b r B R R P R B P R P +++++⋅++++⋅+==.Polya 罐子模型包含有多种模型.(1) 如0,1=-=d c ,则为不放回抽样模型;(2) 如0,0==d c ,则为放回抽样模型;(3) 如0,0=>d c ,则称为传染病模型;(4) 如0,0>=d c ,则称为安全生产模型.例6 甲袋子里有n 个红球,乙袋子里有n 个黑球,按以下方式操作:从甲袋中随意地取走一个球,然后从乙袋中取出一球放入甲袋中(如果乙袋中还有球的话).一直如此操作直至n 2个球全被取走,求最后取走的是红球的概率,如n 很大,这个概率近似值是多少?解:设想甲袋中的n 个红球分别编号n ,2,1⋅⋅⋅,.记=i A “最后取走的是i 号红球”,n i ,,2,1⋅⋅⋅=,则n A A ,,1⋅⋅⋅两两互不相容,由对称性知)()()(21n A P A P A P =⋅⋅⋅==.又记=A “最后取走的是红球”,则i n i A U A 1==,从而)()()()()(121A nP A P A P A P A P n =+⋅⋅⋅++=,下面来求)(1A P .设i N 表示事件“在甲袋中的第i 次取球没有取走1号红球”,n i ,,2,1⋅⋅⋅=,那么 1211A N N N A n ⋅⋅⋅=,并且n n n N P 111)(1-=-=,n N N P 11)|(12-=,…,nN N N P n n 11)|(11-=⋅⋅⋅-, n N N A P n 1)|(11=⋅⋅⋅. 由乘法公式知)|()|()|()()(11111211n n n N N A P N N N P N N P N P A P ⋅⋅⋅⋅⋅⋅⋅⋅⋅=- nn n 1)11(-= 从而得n nA nP A P )11()()(1-== 易见, n 很大时,这个概率近似值为1)(-≈e A P .2. 全概率公式定义 设n A A A ,,,21⋅⋅⋅为n 个事件,若满足(1)j i A A j i ≠φ=,;(2)Ω=⋃=i n i A 1, 则称n A A A ,,,21⋅⋅⋅为样本空间Ω的一个分割.易见对任一事件A ,A 与A 构成一个分割.思考:一个分割n A A A ,,,21⋅⋅⋅,用概率的语言该怎么说?如果n 个事件构成样本空间Ω的一个分割,B 为该样本空间的另一个事件,那么事件B A B A B A n ,,,21⋅⋅⋅将构成B 的一个分割,即有B B A B A B A n ⋅⋅⋅=21且上式右边的n 个事件互不相容,从而有)(B P )()()(21B A P B A P B A P n +⋅⋅⋅++=)|()()|()()|()(2211n n A B P A P A B P A P A B P A P +⋅⋅⋅++=.这便证明了下面定理.定理(全概率公式) 设n A A A ,,,21⋅⋅⋅为样本空间Ω的一个分割,且n i A P i ,,2,1,0)(⋅⋅⋅=>,则对于任一事件B ,有∑==ni i i A B P A P B P 1)|()()(.上面公式叫作全概率公式,该公式表示事件B 的概率等于诸条件概率)|(i A B P 的加权平均,权重为)(i A P .另外也能看出:n A A A ,,,21⋅⋅⋅两两互不相容且i ni A B 1=⊂U (可以不要求Ω==i ni A 1U )时,全概率公式亦成立. 例7 (续抽签与顺序无关问题)求第2次取到红球的概率;第3次取到红球的概率. 解:设i A 表示事件“第i 次取到红球”,3,2,1=i 。

由全概率公式有 7565726475)|()()|()()(1211212=⨯+⨯=+=A A P A P A A P A P A P 。

)|()()|()( )|()()|()()(213212132121321213213A A A P A A P A A A P A A P A A A P A A P A A A P A A P A P +++= 16712546725546752536745⨯⨯⨯+⨯⨯⨯+⨯⨯⨯+⨯⨯⨯= 75=. 例8(续Polya 罐子模型) 设一罐子有b 个黑球,r 个红球,每次随机地取一个球,取出的球放回罐子中,还加进c 个同色球,如此反复进行.求第2次取到黑球的概率.解:设=A “第1次取到黑球”, =B “第2次取到黑球”,则 )|()()|()()(A B P A P A B P A P B P += cr b b r b r c r b c b r b b ++⋅+++++⋅+=rb b +=. 思考:在上例中,第k 次取到黑球的概率是多少?例9 保险公司认为某险种的投保人可分为两类:一类为易出事故者,另一类为安全者.统计表明:一个易出事故者在一年内发生事故的概率为4.0,而安全者为1.0.假定第一类人占此险种投保人的%20.现有一个新投保人,问该投保人在一年内将出事故的概率.解:记=A “投保人为易出事故者”, =B “投保人第一年出事故”,则有2.0)(=A P , 8.0)(=A P ,4.0)|(=A B P ,1.0)|(=A B P由全概率公式得 )|()()|()()(A B P A P A B P A P B P +=16.01.08.04.02.0=⨯+⨯=.下面介绍全概率公式的一个应用:敏感性问题调查方案的设计.敏感性问题的调查是社会调查的一类,如一群人中有赌博习惯的比例,吸毒人的比例,偷税漏税的比例等等.这类调查如直接调查,被调查者很少会如实地回答问题,因比需设计调查方案以使被调查者愿意如实地回答问题.下面介绍两种调查方案.沃纳模型(Warner model )沃纳模型是沃纳1965年提出的,它的提出开创了随机化回答的先河.其设计原则是这样的:根据敏感性特征设计两个相互对立的问题,比如,问题A:你是否吸毒过? 问题B:你是否没吸毒过? 再让被调查者按预定的概率从中任选一个问题回答,比如被调查者先从一袋中任取一球如取到红球则回答问题A,否则回答问题B.调查者无权过问被调查者究竟回答的是哪个问题,比如被调查者独自一人在一房间里操作和回答问题,并且只需在答卷上的“是”和“否”中选其一打钩,然后把答卷放入一密封的投票箱内.假设调查了n 个人即有n 张答卷,其中有k 张回答“是”,袋中的红球所占比例为%100α.如何估计人群中吸过毒的人的比例呢?记事件=A “被调查者回答的问题是A 问题”, =B “被调查者的答案是“是””,假设人群中吸过毒的人的比例为%100p ,p 是未知的,我们需估计p .那么有α=)(A P ,p A B P =)|(,p A B P -=1)|(由全概率公式得)|()()|()()(A B P A P A B P A P B P +=)1)(1(p p -α-+α= ①从而可得 12)1()(-αα--=B P p 由调查结果可得)(B P 的估计值为n k B P=)(ˆ,因此可得p 的估计值为12)1(ˆ-αα--=n k p Simmons 模型是1967年由Simmons 提出的,其设计思想仍是基于沃纳的随机化回答思想,只是在设计中,用与问题A 毫无关联的另一个问题代替与A 对立的问题(要求在人群中对此问题的答案为“是”的比例是已知的),比如在上面的问题中把问题B:“你是否没吸毒过?”改为“你的生日是否在7月1日之前?”,那么5.0)|(=A B P ,①式变为 )(B P )1(5.0α-+α=pp 的估计值为 αα--=)1(5.0ˆn k p 下面介绍全概率公式在遗学中的应用,下面问题作为思考题留给同学们去解决。

相关主题