第六章 概率论与数学建模一、随机事件及其概率1.随机事件:可重复;可预测结果且结果明确;试验前出现那个结果不能确定例如:抛骰子一次,抛一枚硬币三次等。
2.事件的运算及其含义:B A ⊂:A 为B 的子事件。
其含义是:A 发生则B 必发生 B A =:事件A ,B 相等。
其含义是:A 发生则B 必发生,反之亦然C B A =⋂:事件A 与B 的交。
其含义是:C 发生当且仅当A ,B 同时发生C B A =⋃:事件A 与B 的并(和)。
其含义是:C 发生当且仅当A ,B 中至少有一个发生。
C B A =-:事件A 与B 的差。
其含义是:C 发生当且仅当A 发生并且B 不发生。
φ=AB :事件A 与B 互不相容。
其含义是:A 与B 不可能同时发生。
A :事件A 的对立事件。
3.概率:刻化某一事件在一次试验中发生的可能性大小的数量指标。
(当∞→n 时,)()(A P A f P −→−) 4.古典概论:某个试验共有n 个等可能的结果(样本点),事件A 包含其中m 个结果(样本点),则认为nm 就是事件A 的概率。
这种基于等可能性确定概率的模型称为古典概率模型。
例6.1.1(Monte Hall Problem )20世纪60,70年代,美国“电视游戏秀”曾经非常流行一个名叫“Let ’s Make a Deal ”的节目,由Monte Hall 主持。
游戏过程如下:有三扇关着的门,其中一扇门后面有奖品(一辆汽车),其余两扇门后面则没有奖品,若猜中了有奖品的门就能赢取这辆汽车。
你从中挑选一扇门,但暂不打开。
这时,主持人在另外两扇门中挑一个没有奖品的门打开,并展示给你和观众。
然后,主持人问你:是坚持原来的选择,还是换成最后那扇门?解:从能不能得奖的角度看,这个游戏只有两个结果:不换门得奖(A )、换门能得奖(B )。
第一个门是你“三选一”随机(等可能地)挑选的,故P(A)=1/3,自然,另一个结果的概率就是P(B)=2/3。
因此,正确的决定是换成那扇门。
例6.1.2(抽签原理)袋中有2只红球8只黑球(除颜色外无法再分辨)。
10个人依次摸球,得红球者中奖。
求:k A ={第k 个摸球者中奖}的概率,k=1,2,…,10解法一:假定对解题者来说这些球可辨别。
样本点为一轮抽签结束后这10个球的排列,共有10!个等可能的样本点。
事件k A 所含样本点的特征是:两个红球中任选一个排在第k 位(有12C 种可能),而其余9个球在其余9个位置上可任意排列(有9!种可能)。
因此k A 包含了9!12C 个样本点,故51!10!9)(12==C A P K . 解法二:假定球不可辨,只需关注红球落入哪两个人之手,样本空间共有45210=C 个等可能的样本点。
事件k A 发生意味着第k 个人得一红球,另一红球落入其余9人中某一人之手,这有19C 种可能,所以51459)(==K A P 。
例6.1.3(分球入盒模型)将2只球随机地放入3个可辨的盒子中。
求事件A={甲乙两个盒子中各有一只球}的概率。
模型一:假定球可辨,根据乘法原理,样本空间有23个等可能的样本点,而事件A 所含的样本点有222=P 个(两只球的排列),所以92)(=A P . 模型二:假定球不可辨,则样本空间共有624=C 个样本点(两块隔板就可以代表三个盒子,两只球以及两块隔板共4个位置,任选其中两个放置隔板):⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯,,,,, 而事件A 所含的样本点只有一个。
人的直觉经验一般应该是这样的:从物理学上说,球总是可辨的(难以想象这个球既是这个球又是那个球),所谓不可辨,也只是根据问题或研究的目的,不在乎它们之间的区别而已。
如果需要,后三种情形还是可以区别的。
因此,现在这6个样本点不是等可能的:前三个均为91,后三个均为92。
故答案应该还是92)(=A P 。
例6.1.4(浦丰投针问题)在平面上画一些间距为d 的平行线,向此平面投掷一根长为l 的(l<a )的针,试求A={此针能与某一直线相交}的概率。
略。
5.条件概率、乘法公式、独立性、全概率公式、贝叶斯公式(1)条件概率:)/(B A P 表示事件B 发生的条件下事件A 发生的概率。
且 )()()/(B P AB P B A P =(2) 乘法公式:若0)(>B P ,有)()/()(B P B A P AB P ⋅=.(3)独立性:若0)(>B P ,0)(>B P 有)()()(B P A P AB P ⋅=或)()/(A P B A P =。
则称A 、B 相互独立。
(4)全概率公式:设n B B ,,1Λ是S 的一个分割,且0)(>j B P ,则对任一事件S A ⊂,有∑==NJ J J B A P B P A P 1)/()()(.条件全概率公式:设n B B ,,1Λ是S 的一个分割,且0)(>j B P ,0)(>C P ,0)(>C B P j ,则∑==nj j j CB A P C B P C A P 1)/()/()/(例6.1.5(Polya 模型)罐子里有r 只红球和b 只黑球,随机取出一球,放回后再加入同颜色的球c 只。
如此下去,求第n 次取出红球的概率。
解:设n R ={第n 次取出的是红球},n B ={第n 次取出的是黑球},n=1,2,….根据全概率公式,有br r c b r r b r b c b r c r b r r B R P B P R R P R P R P +=++⋅+++++⋅+=+=)/()()/()()(1211212 依次递推,易知有br r R P n +=)(。
(5)贝叶斯公式:设n B B ,,1Λ是S 的一个分割,且0)(>j B P ,则对概率大于零的事件S A ⊂,有∑==n j j j i i i B A P BP B A P B P A B P 1)/()()/()()/( i=1,2,…,n 例6.1.6一个从不抽烟的60岁男性去医院看病,主诉有症状A={慢性咳嗽及非经常性憋气},医生安排他做肺部活组织检验,假定检验只有三种可能的结果:1B ={正常(没有严重的肺病)},2B ={肺癌},3B ={结节病}。
假设医生根据临床经验,得知这三种病与该组症状之间的关联(条件概率)如下:001.0)/(1=B A P ,9.0)/(2=B A P ,9.0)/(3=B A P另外,从疾病资料库中“年龄-性别-抽烟”这个症状组合栏目可以找到,在60岁从不抽烟的男性群体中,患这三种病的先验概率(频率)为 99.0)(1=B P ,001.0)(2=B P ,009.0)(3=B P问:肺部活组织检查前,医生对该名男子应该如何诊断? 解:用贝叶斯公式,已知症状组合A,三种疾病321,,B B B 的条件概率分别为0991.09.0009.09.0001.0001.099.0001.099.0)/(1≈⨯+⨯+⨯⨯=A B P 0901.09.0009.09.0001.0001.099.09.0001.0)/(2≈⨯+⨯+⨯⨯=A B P 8108.09.0009.09.0001.0001.099.0001.0009.0)/(3≈⨯+⨯+⨯⨯=A B P 虽然结节病的先验概率很小,但他患有结节病的后验概率却高达.也就是说,虽然这组症状与两种疾病(肺癌和结节病)都比较相符,但结合病人的年龄、性别和抽烟等情况综合考虑,应该诊断为结节病。
下面举一个综合运用加法公式、乘法公式、全概率公式、贝叶斯公式和独立性的例子。
例6.1.7一个罪犯单独作案,在现场留下了一些DNA 信息。
法医研究后发现能够辨别的只有5对,而且无罪的人也可能与此匹配,匹配的概率为510-。
检查官认为罪犯就是该城镇100万居民之一。
过去10年,该城镇曾有包括琼斯在内的10000人蹲过监狱,他们的DNA 资料均记录在案。
在检查对比这些DNA 文档之前,检察官根据经验,认为有前科的人又犯罪的概率是没有前科的人犯罪概率的k 倍。
实际的DNA 对比结果是:琼斯是唯一匹配的人。
琼斯有罪的概率是多少? 解:设有前科者的犯罪概率为α,无前科者的犯罪概率为β,则βαk =。
由于是单独作案,某甲作案与某乙作案不相容,且必有一人作案,故 199000010000=+βα,因此99000010000+=k k α,990000100001+=k β 记A={琼斯是作案者},B={琼斯是10000人中唯一与现场留下的DNA 信息匹配的人},则α=)(A P 。
我们要求的概率是)/(B A P ,由贝叶斯公式)/()()/()()/()()/(A B P A P A B P A P A B P A P B A P ⋅+⋅⋅=在10000个有前科的DNA 对比试验中,每个人是否与现场DNA 信息匹配是相互独立的。
这里我们必须再补充一个假设:DNA 对比试验技术上完美无缺(即,事实上匹配的人,对比结果必然匹配,事实上不匹配的人,对比结果必然不匹配)。
因此,在琼斯是作案者(其他9999人都不是作案者)的前提下,琼斯匹配而其他9999人都不匹配的概率应该是99995)101(1)/(--⋅=A B P 现来求)/(A B P .设C ={琼斯以外的9999个有前科者这次都没作案},根据条件全概率公式,有)/()/()/()/()/(A C B P A C P A C B P A C P A B P +=显然其中的0)/(=A C B P ,999955)101(10)/(---=A C B P 注意到,事件A C 意为“该案是990000个没有前科者之一所为”,故 β990000)(=A C P ,即α100001-。
于是αα--==1100001)()()/(A P A C P A C P 最终,我们得到kB A P 9.911)100001(101100001)101(10)1()101()101()/(59999559999599995+=-+=--⋅-⋅⋅-+--=-----αααααααα 例如,若10=k 则新的DNA 证据表明琼斯作案的概率为5025.099.11)/(≈=B A P ,若100=k 则琼斯作案的概率为9099.0099.11)/(≈=B A P 。
二、随机变量1.随机变量的概念:2.常见的随机变量:(1)泊松分布:k e P X k k k λλ-(=)=,=0、1、2、、、!实际应用:一本书中一页中的印刷错误数。
(小概率事件)某地区在一天内邮件遗失的信件数。
某一天内医院的急症病人数。
某一地区一个时间间隔内发生交通事故的次数 一个时间间隔内某种放射性物质发出的经过计数器的α粒子数等等……(2)指数分布:⎩⎨⎧≤>=-0,00,)(x x e x f x λλ 其中>0λ为常数 ,记为 )(~λExp X特点:无记忆性P(/)()X s t X s P X t >+>=>一个元件已经使用了s 小时,在此情形下,它总共能使用至少s+t 小时的概率,与开始使用时算起它至少能使用t 小时的概率相等,即元件对已使用过s 小时无记忆。