当前位置:文档之家› 概率论中几种具有可加性的分布及其关系

概率论中几种具有可加性的分布及其关系

目录摘要 (1)关键词 (1)Abstract (1)Keywords (1)引言 (1)1几种常见的具有可加性的分布 (1)二项分布 (2)泊松分布(Possion分布) (3)正态分布 (4)伽玛分布 (6)柯西分布 (7)卡方分布 (7)2具有可加性的概率分布间的关系 (8)二项分布的泊松近似 (8)二项分布的正态近似 (9)正态分布与泊松分布间的关系 (10)正态分布与柯西分布、卡方分布及卡方分布与伽玛分布的关系 (11)3小结 (12)参考文献 (12)致谢 (13)概率论中几种具有可加性的分布及其关系摘要概率论与数理统计中概率分布的可加性是一个十分重要的内容.所谓分布的可加性指的是同一类分布的独立随机变量和的分布仍属于此类分布.结合其特点,这里给出了概率论中几种具有可加性的分布:二项分布,泊松分布,正态分布,柯西分布,卡方分布以及伽玛分布.文章讨论了各类分布的性质及其可加性的证明,这里给出了证明分布可加性的两种方法,即利用卷积公式和随机变量的特征函数.除此之外,文章就可加性分布之间的各种关系,如二项分布的泊松近似,棣莫佛-拉普拉斯中心极限定理等,进行了不同层次的讨论.关键词概率分布可加性相互独立特征函数SeveralKindsofProbabilityDstributionanditsRelationshipwithAdditive'scentrallimittheorem,andsoon,hascarriedonthedifferentlevelsofdiscussion.KeyWords probabilitydistributionadditivitypropertymutualindependencecharacteristicfunction引言概率论与数理统计是研究大量随机现象的统计规律性的学科,在概率论与数理统计中,有时候我们需要求一些随机变量的和的分布,在这些情形中,有一种求和类型比较特殊,即有限个相互独立且同分布的随机变量的和的分布类型不变,这一求和过程称为概率分布的“可加性”.概率分布中随机变量的可加性是一个相当重要的概念,本文给出了概率论中常见的六种具有可加性的分布,包括二项分布,泊松分布,正态分布,伽玛分布,柯西分布和卡方分布.文章最后讨论了几项分布之间的关系,如二项分布的泊松近似,正态近似等等.1几种常见的具有可加性的分布在讨论概率分布的可加性之前,我们先来看一下卷积公式和随机变量的特征函数,首先来看卷积公式[1]:①离散场合的卷积公式设离散型随机变量ξζ,彼此独立,且它们的分布列分别是n k a k P k ,1,0,)(⋅⋅⋅===ζ和.,,1,0,)(n k b k P k ⋅⋅⋅===ξ则ξζϑ+=的概率分布列可表示为②连续场合的卷积公式设连续型随机变量ξζ,彼此独立,且它们的密度函数分别是)(),(y f x f ξζ,则它们的和ξζϑ+=的密度函数如下 其证明如下:ξζϑ+=的分布函数是dxdy y f x f z f z F zy x )()()()(ξζϑξζ⎰⎰≤+=≤+=其中)(x F ζ为ζ的分布函数,对上式两端进行求导,则可得到ξζϑ+=的密度函数:.)()()(dx x z f x f f f z f -⋅=⋅=⎰+∞∞-ξζξζϑ即证.在概率分布可加性的证明中,除了卷积公式,我们常用的证明方法还有利用随机变量的特征函数.下面我们来讨论一下这几种具有可加性的分布及其可加性证明的过程中卷积公式和特征函数的应用. 二项分布二项分布),(p n B 的概念如果记ζ为n 次伯努利试验中成功(记为事件A )的次数,则ζ的可能取值为0,1,2,……,n.记p 为事件A 发生的概率,则,)(p A p =(p A ),1p -=记为.q 即.1p q -=因n 次伯努利试验的基本结果可以记作=(w 1,w 2,…n ),w i 或为A 或为A ,这样的w 共有2n 个,这2n 个样本点w 组成了样本空间Ω.下求ζ的分布列,即求事件{ζk =}的概率.若某个样本点=(w 1,w 2,…n )∈{k =ζ},意味着w 1,w 2,…n 中有k 个A ,k n -个A ,由独立性即可得:P (ζ).)1(k n k p p --=而事件{ζ=k }中这样的w 共有⎪⎭⎫⎝⎛n k 个,所以ζ的分布列为)(k P =ζ=⎪⎭⎫ ⎝⎛n k p k(1-p )k n -,.,1,0n k ⋅⋅⋅⋅⋅⋅=此分布即称为二项分布,记作),(~p n B ζ.且我们易验证其和恒为.1.也就是kn k nk n k p p -=-⎪⎭⎫ ⎝⎛∑)1(0=[]n p p )1(-+1=. n=1时,二项分布),(p n B 称为两点分布,有时也称之为10-分布. 二项分布的图像具有以下特点:①二项分布的图像形状取决于n 和p 的大小,随着p 的增加,分布图高峰逐渐右移. ②当5.0=p 时,图像是对称的. 二项分布的可加性定理设),,(~),,(~p m B p n B ξζ而且ξζ,相互独立,记,ξζϑ+=则有).,(~p m n B +ϑ证明因,ξζϑ+=所以易知ϑ可以取m n +⋅⋅⋅2,1,0等1++m n 个值.根据卷积公式)1(,事件{}k =ϑ的概率可以表示为 又因.0⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+-=∑m n k m i k ki n i 所以也就是说,).,(~p m n B +ϑ即证! 泊松分布(Possion 分布)与二项分布一样,泊松分布也是一种离散分布,许多随机现象,特别是社会现象与物理学中的一些随机现象都服从于泊松分布.泊松分布可作为描述大量试验中稀有事件出现次数的概率分布的数学模型.泊松分布的概率分布列泊松分布的概率分布如下所示:2,1,0,!)(===-k e k k P k λλζ…,其中λ大于0,记作)(~λζP .对于泊松分布而言,它的参数λ即是期望又是它的方差:λλλλλλλλλλ==-==-+∞=---+∞=∑∑e e k e e k k E k k k k 110)!1(!)(.又因, =[]λλ-+∞=-+-∑e k k kk )!1(1)1(1=∑∑+∞=--+∞=---+-11222)!1()!2(k k k k k e k eλλλλλλ=λλ+2故ζ的方差为22))(()()(ζζζE E Var -==λλλλ=-+22定理设随机变量)(~),(~2211λζλζP P ,且21,ζζ相互独立,则).(~2121λλζζ++P证明此处⋅⋅⋅=====--,2,1,0,!)(,!)(212211k e k k P e k k P k k λλλζλζ根据卷积公式)1(,有所以).(~)(2121λλζζ++P 即证!同样我们可以利用特征函数对其进行证明,此处不再赘述. 正态分布正态分布的定义[6]定义对于已经给定的两个常数μ和σ>0,定义函数222/)(,21)(σμσμπσ--=x e x p ),(+∞-∞∈x )1(它含有两个参数μ和σ.显然的,)(,x p σμ取正值.我们称密度函数为)(,x p σμ的分布为正态分布,记作),(2σμN ,它的分布函数记为dt ex F xt ⎰∞---=222)(,21)(σμσμπσ),(+∞-∞∈x正态分布的密度函数的图像是一条钟形曲线,中间高两边低,而且关于μ=x 对称,在此处)(,x p σμ取最大值.21πσ我们称μ为该正态分布的中心,在μ=x 附近取值的可能性比较大,在σμ±=x 处有拐点.若将μ固定,改变σ的取值,则σ越大,曲线峰顶越低,图像较为平坦;σ越小,曲线封顶越高,图像较为陡峭.因此正态密度函数的尺度由σ确定,故称σ为尺度参数.同样的,将σ固定,而去改变μ的值,会发现图像沿x 轴平移而并不改变形状,也就说明该函数的位置由μ决定,故称其为位置参数.当1,0==σμ时的正态分布称为标准正态分布,记作)1,0(N .它的密度函数记为)(u ϕ,分布函数记为)(u Φ.则有 一般正态分布的标准化 对于正态分布族标准正态分布)1,0(N 只是其中一个成员.其实在应用中很少有随机变量恰好服从标准正态分布,可是一般正态分布均可以利用线性变换转变成标准正态分布.所以一切与正态变量有关的事件的概率均可通过标准正态分布分布求取.定理如果随机变量),(~σμN Y ,则)1,0(~/)(N Y X σμ-=,其中X 为标准正态变量.证明记Y 与X 的分布函数分别为)(y F Y 和)(x F X ,易知因为正态分布函数严格递增而且处处可导,所以如果记Y 和X 的密度函数分别是)(y p Y 和)(x p X ,会有由此即得,).1,0(~N Y X σμ-=即证. 对于标准正态随机变量),1,0(~N X X 的数学期望为 因被积函数2/2)(x xe x h -=为奇函数,故上述积分值为0,也就是说.0)(=X E而对于一般正态变量),(~2σμN Y ,如果满足X Y σμ+=,由数学期望的线性性质则可得到.0)(μσμ=⨯+=Y E所以我们可以知道正态分布),(2σμN 的数学期望即为其参数μ. 因为且X Y σμ+=,由方差的性质也就是说,正态分布的方差即是其另一个参数.2σ 正态分布的可加性定理设随机变量而且X 和Y 彼此独立,且),,(~),,(~222211σμσμN Y N X 则有).,(~222121σσμμ+++N Y X证明知Y X ,服从于正态分布,且它们的密度函数分别是 又因Y X ,彼此独立,所以这正是数学期望为,21μμ+方差为2221σσ+的正态分布的特征函数,即证!我们同样可以使用连续场合的卷积公式进行证明,详见文献[5],此处不再赘述. 伽玛分布在讨论伽玛分布之前,我们先来看一下伽玛函数:我们称为伽玛函数,α为其参数.它的性质如下:①;)21(,1)1(π=Γ=Γ②).()1(αααΓ=+Γα取自然数n 的时候,有 伽玛分布的定义定义如果随机变量X 的密度函数为就称作X 服从伽玛分布,记为),,(~λαGa X 且λα,的值均大于0.α为伽玛分布的形状参数,λ为其尺度参数.当10<<α时,)(x p 为严格单调递减的函数,在0=x 处取得奇异点;当1=α时,)(x p 亦严格单调减,且0=x 时有;)0(λ=p 当21≤<α时,)(x p 为单峰函数,先上凸然后下凸;当2>α时,先下凸再上凸,最后下凸.而且随着α的增大,)(x p 逐渐接近于正态分布的密度函数. 伽玛分布的可加性定理设随机变量),,(~),,(~21λαλαGa Y Ga X 且X 和Y 彼此独立,则).,(~21λαα++Ga Y X证明知,)1()(,)1()(21ααλϕλϕ---=-=itt it t Y X且X 与Y 彼此独立,所以此即为)(21αα+Ga 的特征函数,根据惟一性定理则可知).,(~21λαα++Ga Y X 结论得证!如正态分布,对于伽玛分布,我们同样可以利用连续场合的卷积公式对其可加性进行证明,详见文献[5]; 柯西分布[4]柯西分布的密度函数柯西分布是几个常见的连续分布之一.它的密度函数为0,1==μλ时的柯西分布密度函数称为标准柯西分布密度函数,即 为方便起见,往后我们分别记这两类密度函数为),(μλp 和).1,0(p 对于柯西分布的数学期望和方差,因所以dx x p x ),,(μλ⎰+∞∞-不收敛,故柯西分布的数学期望与方差均不存在.柯西分布的可加性定理设随机变量),,(~),,(~2211μλμλp Y p X 且Y X ,彼此独立,则有).,(~2121μμλλ+++p Y X证明因Y X ,均服从于柯西分布,且Y X ,的特征函数分别是 又因Y X ,彼此独立,所以这恰好就是参数为2121,μμλλ++的柯西分布的特征函数,所以).,(~2121μμλλ+++p Y X 即证! 卡方分布(2χ分布)2χ分布)的定义及密度函数定义[7]设n X X X ⋅⋅⋅,,21独立同分布与标准正态分布分布),1,0(N 则称222212nX X X +⋅⋅⋅++=χ所服从的分布为自由度为n 的卡方分布,记为).(~22n χχ 卡方分布的密度函数为卡方分布可加性卡方分布密度函数的图像是一个只取非负值的偏态图像.它的图像随着自由度的增加而逐渐趋于对称,当自由度∞→n 时,其图像趋于正态分布的图像.这也从另一个侧面告诉我们,卡方分布是由其自由度决定的,不同的自由度对应了不同的卡方分布.由,我们可以知道卡方分布即伽玛分布的一个特例,所以由伽玛分布的可加性我们易知卡方分布亦满足可加性定理,即定理设),(~),(~22221n m χχχχ且2221,χχ彼此独立,则有 证明由卡方分布的定义,设且,,,2,1),1,0(~n m i N X i +⋅⋅⋅=j i X X ,彼此独立.则有,从从卡方分布的定义,因此).(~22221n m ++χχχ即证! 2具有可加性的概率分布间的关系二项分布的泊松近似[4]当n 的取值很大时,二项分布),(p n B 的计算是令人头疼的.这里介绍了泊松分布的一个十分有用的特性,我们可利用泊松分布作为二项分布的一种特殊近似,即二项分布的泊松近似.下面我们来看泊松定理,当n 取值较大,而p 取值偏小的情况下使用泊松定理,可大大减小二项分布的计算量.定理[8](Possion 定理)在n 重伯努利试验中,记事件A 在每次试验中发生的概率为,n p 它与试验发生的次数n 有关,若当0>n 时,有,λ→n np 即,lim λ=+∞→n n np 则对任意给定的k (k 为非负整数),有证明设,n n np =λ则有,np nn λ=所以 由已知有,,lim λλ=+∞→n n 则对于给定的k 值,有;lim k kn n λλ=+∞→且+∞→n lim 1)11()21)(11(=--⋅⋅⋅--n k n n ; 所以有.!)1(lim λλ--+∞→=-⎪⎭⎫ ⎝⎛e k p p kk n n kn n k n 即证! 因Possion 定理的条件之一为,lim λ=+∞→n n np 所以在二项分布的计算中,若n 值很大,p 的值却很小,且λ=np 的大小适中时(一般认为当,1.0,100≤≥p n 且10≤=np λ时),二项分布),(p n B 可以使用参数为λ的泊松分布来做近似,即有此即为二项分布),(p n B 的泊松近似,而且n 的值应尽可能的大,这样计算结果才能更精确.二项分布),(p n B 的泊松近似经常被用于稀有事件(即每次试验中事件发生的概率很小)的研究中,大量实例表明,一般情况下概率1.0<p 时,泊松近似非常好用,甚至n 的取值不必很大. 二项分布的正态近似定理[7](棣莫佛-拉普拉斯(De Laplace Moivre -)极限定理)设随机变量),(~p n B X (⋅⋅⋅=<<,2,1,0,10n p ),则对任意的实数x ,有证明因随机变量X 服从二项分布),(p n B ,所以X 可看做是n 个相互独立的且服从于同一参数p 的两点分布的随机变量n X X X ,,,21⋅⋅⋅的和,即,1∑==ni i X X 而且根据Levy Lindeberg -中心极限定理,有).(21)1(lim 2/12x dt e x p np np X P x t n i i n Φ==⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤--⎰∑∞--=+∞→π定理得证! De Laplace Moivre -中心极限定理说明,n 相当大时,服从二项分布),(p n B 的随机变量X 的概率的计算服从正态分布))1(,(p np np N -的随机变量的计算.也就是说,二项分布可以用正态分布来近似计算.比如k n kn k p p k X P --⎪⎭⎫ ⎝⎛==)1()(,在n 比较大的时候的计算量时十分大的.根据De Laplace Moivre -中心极限定理,因)1(np np npX --近似服从于标准正态分布,或者说是X 近似服从于))1(,(p np np N -分布,也就是说 对于,)1()(k n kb k a n k p p b X a P -≤≤-⎪⎭⎫ ⎝⎛=≤≤∑有我们只需查一下标准正态分布表,就可以求出我们需要的相当精确的值.但是,当p 较大或者较小时近似效果可能差一些,利用公式时p 的值最好满足9.01.0≤≤p .另外,因二项分布是离散分布,正态分布是连续分布,所以在我们实际的应用中,为减小误差, 常常使用 来替换)(*式.正态分布与泊松分布之间的关系[9]由上面的定理和定理我们可以知道,二项分布),(p n B 可以用泊松分布来做近似,同样也可以用正态分布来近似.所以,从某个方面来说,泊松分布与正态分布也具有某种近似的关系,首先我们来看特征函数的连续性定理.定理分布函数列{})(x F n 弱收敛于分布函数)(x F 的充分必要条件是它的相应的特征函数列{})(t n ϕ收敛于)(x F 的特征函数).(t ϕ定理设随机变量),(~λλP X 则有.21lim 22dt ex X P xt ⎰∞--∞→=⎪⎭⎫⎝⎛<-πλλλλ证明知λX 服从泊松分布,则λX 的特征函数为.)()1(-=itee t λλϕ所以λλμλλ-=X 的特征函数是.)(1t i e tiet λλλλψ-⎪⎪⎪⎭⎫ ⎝⎛-=对于任何一个,t 我们有.,1!212∞→⎪⎭⎫⎝⎛+-+=λλολλλt ite ti所以有因此对于任意的点列,∞→n λ有.)(lim 22t et n n -∞→=λλψ又知22t e-是标准正态分布)1,0(N 的特征函数,因此由连续性定理可以得到,由n λ的任意性,所以有dt ex X P xt ⎰∞--∞→=⎪⎭⎫⎝⎛<-2221lim πλλλλ成立.我们来看泊松分布的正态逼近. 定理对于任意的,21a a <有,21!lim2122/⎰∑-<<-+∞→=a a x k k dx e k e βαλλπλ其中.,21λλβλλα-=-=a a 其证明见文献[8]. 由前可知,),(p n B 的正态近似与泊松近似的条件是不同的,当p 的取值特别小时,哪怕n 的值不是太大,用泊松分布来近似二项分布也是可以的.但在这种情况下,用正态近似却是不合理的.我们可以想象,若p 值很小,但n 的值也不是太大,则np =λ的值肯定不会很大,而由定理,我们可知,此时正态分布就不可能很好的进行泊松近似. 正态分布与柯西分布、卡方分布及卡方分布与伽玛分布之间的关系 首先来看正态分布与柯西分布的关系.定理设).1,0(~),1,0(~N Y N X 且X 与Y 独立同分布,记Y X Z /=,则)1,0(~N Z .证明易知Z 的取值范围是),(+∞-∞,所以对于),(+∞-∞∈z ,我们利用商的公式,可以得到这正是1,0==μλ时的柯西分布的密度函数,所以结论得证!正态分布与卡方分布的关系如下:定理若随机变量),1,0(~N X 则).1(~22χX定理证明见文献[10].这说明了标准正态分布与自由度为1的卡方分布之间的关系.若().,2,1,1,0~n i N X i ⋅⋅⋅=且i X 彼此独立,记222212n X X X +⋅⋅⋅++=χ,根据卡方分布的定义,我们知2χ服从自由度为n 的卡方分布.对于伽玛分布,当其参数21,2==λαn 时即为自由度为n 的卡方分布,记为3小结文章第一部分我们讨论了六种具有可加性的分布以及它们的简单性质,上述分布的可加性均可利用卷积公式或者特征函数进行证明.正态分布是概率论中最重要的分布,一般地,如果某个数量指标受到大量随机因素影响,而每一因素起的作用很小,则这个数量指标就近似服从正态分布.在第二部分里研究了二项分布、正态分布与泊松分布的关系,从此处我们可以知道二项分布不仅可以用泊松分布近似,同样也可由正态分布来近似. 参考文献[1]罗建华.卷积公式的应用注记[J].中南林业科技大学学报,2007年,第27卷,第1期:152页.[2]李贤平,沈崇生,陈子毅.概率论与数理统计[M].上海:复旦大学出版社,:221-231.[3]唐玲,徐怀.复合泊松分布和泊松过程的可加性[J].安徽建筑工业学院学报,:83页.[4]郭彦.对柯西分布性质的进一步讨论[J].淮阴工学院学报,:12页.[5]茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].北京:高等教育出版社,:155-160;[6]王梓坤.概率论基础及应用[M].北京:北京师范大学出版社,:61-64.[7]宋立新.概率论与数理统计[M].北京:人民大学出版社,:176-177.[8]于洋.浅析二项分布、泊松分布和正态分布之间的关系[J].《企业科技与发展》,2008年第20期:120页.[9]魏宗舒等.概率论与数理统计教程[M].北京:高等教育出版社,:208-211.[10]孟凡华.浅谈几种概率分布之间的相互关系[J].信阳农专学报,1992年第3卷第2期:63-65.[11]王淑云.特征函数及其应用[J].邯郸学院学报,2008年第18卷第3期:52-56.。

相关主题