当前位置:文档之家› (完整版)概率的定义及其确定方法

(完整版)概率的定义及其确定方法

§1.2 概率的定义及其确定方法在本节,我们要给出概率的定义,这是概率论中最基本的概念。

本节中我们还将介绍几种确定概率的方法。

随机事件的发生有偶然性,但我们常常会觉察到随机事件发生的可能性是有大小之分的。

例如,购买彩票后可能中大奖,可能不中奖,但中大奖的可能性远比不中奖的可能性小。

既然各种事件发生的可能性有大有小,自然使人们想到用一个数字表示事件发生的可能性大小。

这个数字就称为事件的概率。

然而,对于给定的事件A ,该用哪个数字作为它的概率呢?这决定于所研究的随机现象或随机试验以及事件A 的特殊性,不能一概而论。

在概率论的发展历史上,人们针对特定的随机试验提出过不同的概率的定义和确定概率的方法:古典定义、几何定义和频率定义。

这些概率的定义和确定方法虽然有其合理性,但也只适合于特定的随机现象,有很大的局限性。

那么如何给出适合于一切随机现象的概率的最一般的定义呢? 1900年数学家希尔伯特提出要建立概率的公理化定义以解决这个问题,即以最少的几条本质特性出发去刻画概率的概念.1933年数学家柯尔莫哥洛夫首次提出了概率的公理化定义,这一公理化体系迅速得到举世公认,有了这个定义后,概率论才被正式承认为一个数学分支,并得到迅猛发展.1. 概率的公理化定义定义1.2.1 设Ω为样本空间,F 为Ω的某些子集组成的事件域.))((F A A P ∈是定义在事件域F 上的实值集函数,如果它满足:(1) 非负性公理 对于任一F A ∈,有0)(≥A P ;(2) 正则性公理 1)(=ΩP ;(3) 可列可加性公理 若,,21A A …,,n A …两两互不相容,则则称)(A P 为事件A 的概率,称三元总体),,(P F Ω为概率空间.概率的公理化定义刻画了概率的本质,概率是集合(事件)的实值函数,若在事件域上给出一个函数,只要这个函数满足上述三条公理就称为概率。

这个定义只涉及样本空间和事件域及概率的最本质的性质而与具体的随机现象无关。

对于具体的随机现象中的给定的事件,其概率如何合理地确定那要依据具体情况而定。

历史上出现的概率的频率定义、古典定义和几何定义都是特定的场合下有着各自的确定概率的方法。

在有了概率的公理化定义之后,把它们看作确定概率的方法是恰当的。

下面介绍这些确定概率的方法。

2. 频率方法设E 为一随机试验,A 为其中一事件,在相同条件下将E 独立重复做n 次,记)(A n 为事件A 发生的次数(也叫频数),比值 称为事件A 在这n 次试验中的频率。

容易验证频率满足概率的公理化定义中的三条公理。

一般地,如事件A 发生的可能性愈大,那么在多次重复试验中, 事件A 发生愈频繁即频率)(A f n 也愈大.反之,频率)(A f n 愈大表明事件A 发生的可能性愈大.因此事件频率的大小与事件发生的可能性大小有密切的联系.但是还不能把事件的频率就确定为概率,因为频率有“波动性”.长期实践表明,随着试验次数n 的增加,频率)(A f n 会稳定于某一个常数p ,这个频率的稳定值是由事件本身决定的并且这样的稳定值满足概率的公理化定义中的三条公理,因能把这个稳定值确定为事件的概率是合理的.这种确定概率的方法虽然有其合理性,但其缺点是明显的:在现实世界里,人们无法把一个试验无限次地重复下去,因此我们无法精确地得到频率的稳定值.尽管有明显的缺点,但这种方法有其重大意义:一方面,频率具有稳定性这一客观事实给概率提供经验背景.同时频率方法给我们提供了一个可以想象的具体值,并且在试验次数较大时,可用频率给出概率的近似值.例如,工业生产中,依据抽检的一些产品估计产品的废品率.另一方面,它提供了检验理论正确与否的准则.设想依据某一理论或假定算出了某事件A 的概率为p ,这一理论或假定是否与实际相符,我们并无把握,于是我们可诉诸试验,即进行大量重复试验以观察事件A 的频率)(A f n .若频率)(A f n 与p 接近,则可认为试验结果支持了有关理论或假定.若频率)(A f n 与p 相差较大,则认为理论可能有误.例如,在抛硬币的试验中,假定正反面出现的可能性相等,则出现正面的概率与出现反面的概率都是0.5, 如果我们多次抛掷硬币,若正面出现的频率与0.5相差甚远,那么正反面出现的可能性相等这个假定的正确性值得怀疑.下面是频率稳定性的几个实例.3. 古典方法确定概率的古典方法是概率论历史上最早研究的情形,它简单、直观、不需做大量重复试验。

先看一个简单试验:掷一个六面均匀的骰子,这个试验有6个基本结果,如果六个面是平等看待,那么可以认为每个面朝上的可能性相同,即每个点数出现的概率相等,这样的试验称为古典概型。

在古典概型中,事件的概率应该与事件包含的样本点个数成正比,事件的概率也就能容易地确定。

如果试验E 具有下列性质(1) 试验的基本结果只有有限个,即试验的样本空间Ω为有限样本空间;(2) 一切基本事科发生的可能性相等。

则称试验E 为古典概型。

设试验E 为古典概型,样本空间Ω包含有n 个样本点,A 为试验E 的一事件,且事件A 包含k 个样本点,则事件A 的概率为古典方法是概率论发展初期确定概率的常用方法,在古典方法中,为求一个事件A 的概率,需求出试验的等可能的基本结果总数和事件A 包含的基本结果数。

例 将一硬币抛3次,假设每次抛掷中出现正面和反面的可能性相等,求恰好出现1次正面的概率。

解:由于每次抛掷中出现正面和反面的可能性相等,因此该试验的等可能的基本结果有8个。

即样本空间取为且各个基本结果具有等可能性,而事件=A “恰好出现1次正面”包含1个样本点“HHH ”,即{HHH}A =,所以所求的概率为注意,此试验中若我们考虑的样本空间为}3,2,1,0{=Ω,那么=A “恰好出现1次正面”为Ω的子事}1{,但并不能由此得出A 的概率为41,因为样本空间为}3,2,1,0{=Ω的各个基本事件不具有等可能性.因此用古典方法确定概率时一定要注意“基本事件的等可能性”.当样本空间中样本点较多时,我们不必将样本点一一列举出来,而只需求出样本点总数n 和事件A 包含的样本点个数k ,但要注意“等可能性”.下面介绍古典概型中几件常见的模型.一、抽样模型(也叫取球模型)抽样有两种方式:不放回抽样与放回抽样1. 不放回抽样:一个总体由两类元素(用A,B 表示)组成,共有N 元素,其中有M 个A 类元素,M N -个B 类元素,从中任取n 个元素,我们常关注取出元素A 类成B 类元素的个数.求事件=m A “取出的n 个元素中有m 个A 类元素”的概率.解:样本空间中样本点的总数为n N C ,事件m A 包含的样本点个数为m n M N m M C C --.由于是随机抽取的,所以这n N C 个基本事件是等可能,故所求的概率是若引入随机变量X :取出的A 类元素的个数,则可得X 的概率分布(或分布列。

随机变量的概率分布就是全面地、动态地描述随机变量取各个可能值的概率规律)为)(m X P =n Nm n M N m N C C C --=,),min(),0max(M n m N M n ≤≤-+ 为方便,我们约定:,0=k mC 0<k 或m k >,那么上述概率分布可写为 )(m X P =n Nm n M N m M C C C --=,n m ,,1,0 = 以上的概率分布称为超几何分布(后面章节会继续讨论这种分布),这种分布在抽样调查中是很重要的.比如N 件产品中有M 件不合格品, M N -件合格品,从中抽检n 件产品.在实际问题中,N 的值已知,而M 的值未知,要根据抽查的n 件产品中的次品件数去推断M 的值,这属于统计问题.也有M 的值已知,而N 的值未知的情况,例如,从某一湖里,捕捉M 尾鱼,将这些鱼作上某种标记,然后放回湖中,过一段时间后,再从湖中捕捉出n 尾鱼,发现其中有m 尾有标记,对该湖中鱼的总数N 能作出什么结论?这个问题在学习数理统计时再来讨论.注: 1.对以上模型作稍微的改变:一个袋有7个球,其中5个红球,2个白球.从中依次取3次球,每次取一个,取后不放回.试求下列事件的概率,(1) =A “前2次取到红球,最后1次取到白球”;(2) =B “取到2个红球,1个白球”;(3) =C “第2次取到红球”.解: (1)214567245)(=⨯⨯⨯⨯=A P 错解: 37245)(C A P ⨯⨯=(2) 745673245)(=⨯⨯⨯⨯⨯=B P 或 74)(371225==C C C B P 在此问题中,两种做法都可得出正确答案,为什么? (3) 75567152452245345)(=⨯⨯⨯⨯+⨯⨯+⨯⨯+⨯⨯=C P 或75675245)(=⨯⨯+⨯=C P 可以看出,第2次取到红球的概率与第1次取到红球的概率相等,同样地可算出第3次取到红球的的概率也是75.这就是“抽签与顺序无关”的原理,从概率论上解释了“抓阄的公平性”.2. 以上模型可推广至N 个元素由多类元素组成的情形,比如,一批产品共N 件,其中有1M 件一等品, 2M 件二等品, 3M 件三等品(N M M M =++321),从中任取n 件产品,则取到1m 件一等品, 2m 件二等品, 3m 件三等品(n m m m =++321)的概率为教材的例若引入随机变量Y X ,:Y X ,分别表示取出的一等品和二等品件数,则),(Y X 的概率分布属于多项超几何分布.2. 放回抽样: 一个总体由两类元素(用A,B 表示)组成,共有N 元素,其中有M 个A 类元素,M N -个B 类元素,从中依次取n 次,每次取1个元素,取后放回.求事件=m A “取出的n 个元素中有m 个A 类元素”的概率.解:样本空间中样本点的总数为n N ,事件m A 包含的样本点个数为m n m m n M N M C --)(.由于是随机抽取的,所以这n N C 个基本事件是等可能,故所求的概率是将上面结果变形为m n m m n m p p C A P --=)1()(, 其中NM p =,这是什么模型的概率问题(这是你们中学学过的)? 若引入随机变量X :X 表示取出的A 类元素的个数,则可得X 的概率分布为 )(m X P =m n m m n p p C --=)1(,n m ,, 1,0=,N M p =以上的概率分布称为二项分布(后面章节会继续讨论这种分布).二项分布的一种推广就是多项分布.二、盒子模型(也叫放球模型)设有n 个球,每个球都等可能地放到N 个盒子中的任一个,盒子的容量不限.(1) 设N n ≤,求球放入不同盒子中的概率;(2) 求某指定的盒子为空盒的概率的概率;(3) 求某指定的盒子有k 个球的概率的概率解: (1)设A 表示事件“球放入不同盒子中”,则(2) 设B 表示事件“某指定的盒子为空盒”,则(3) 设C 表示事件“某指定的盒子有k 个球”,则以上结果可变形为由变形后的结果会想到什么概率模型?在盒子模型中,我们还会关注于各个盒子的球的数目或球的分布状况.我们看下面问题:将6个球随机地放入5个盒子中,5个盒子分别编号1,2,3,4,5.则1号,2号,3号,4号,5号盒子中分别有2个球,2球,1个球,1个球,和0个球的球的概率为 思考:6个球的分布状况是2,2,1,1,0(即有2个盒子各放2个球,3个盒子各放1个球,1个盒子没球)的概率是多少?教材的例三、补充问题:重复组合问题及其应用从n 个不同元素中每次取一个,放回后取下一个,如此连续取r 次所得的组合称为重复组合(不考虑次序).那么重复组合数是多少呢?易见,这个问题等价于将r 个不可分辨的球放入n 个盒子(盒子是可分辨的)中,可区分的放球结果有多少种?为求解此问题,我们先求每个盒子至少有1个球的不同放法的总数(此时要求)n r ≥.设想将r 个球排成一行,相邻两球之间各有一个空格,共有1-r 个空格,在这1-r 个空格中任取1-n 个空格上插入“|”,每种插法一一对应于每个盒子都有球的一种放法,于是可得每个盒子都有球的放法共有11--n r C 。

相关主题