概率论中几种收敛及其联系 西北师范大学数学与应用数学专业 甘肃兰州 730070摘要:概率极限理论是概率论的重要组成部分,内容十分丰富,本文仅介绍依概率收敛,平均收敛,依分布收敛,a.s.收敛,完全性收敛以及事件序列的无穷次发生之间的联系.关键词:示性函数 概率 随机变量 收敛 分布函数Abstract : The probability limit theory is an important part of the probability theory, is rich in content, this article describes only the convergence in probability, the averageconvergence, converge in distribution, as convergence, complete convergence, as well as the infinite sequence of events occurred betweenKey words : indicator function probability random variable convergence distribution function首先,为了研究这几种收敛性,我们需要估计概率。
所以首先需要建立必要的概率不等式。
我们以I(A)表示事件A 的示性函数,即有⎩⎨⎧∉∈=.,0;,1)(A A A I ωω那么,显然当B A ⊂时,有).()(B I A I ≤,并且有).()(A EI A P =定理 1 (Chebyshev 不等式)设)(x g 是定义在 [)∞,0 上的非降的非负值函数,如果对随机变量η,有∞<)(ηEg ,那么对任何使得0)(>a g 的0>a ,我们都有.)()()(a g Eg a P ηη≤≥证明:首先,由)(x g 的非降性知 ()()()().a g g a ≥⊂≥ηη 因此()()()()()()()()().a g g I a g g a g g I a I ≥≤≥≤≥ηηηη其中)(A I 是事件A 的示性函数;其中的第二个不等号是由于在事件()()()a g g ≥η上面有()()1≥a g g η由上述不等式立得()()()()()()()()()()()().a g Eg a g g I a g g E a g g EI a EI a P ηηηηηη≤⎭⎬⎫⎩⎨⎧≥≤≥≤≥=≥Chebyshev 不等式在以后的证明中有非常重要的作用,所以我们在这里先将其提出. 下面让我们先从较简单的依概率收敛谈起.定义 1 已知随机变量序列{n ξ,N n ∈}与随机变量ξ.如果对0>∀ε,都有.0)|(|lim =≥-∞→εξξn n P那么我们就称随机变量序列{N n n ∈,ξ}依概率收敛到随机变量ξ,记为ξξ−→−Pn其实,依概率收敛的本质是n ξ对ξ的绝对偏差不小于任一给定量的可能性将随着n 增大而减小.或者说,绝对偏差小于任一给定量的可能性将随着增大而接近1,即上式等价于1)(lim =<-∞→εξξn n P .特别当ξ为退化分布时,即()1==c P ξ,则称序列{}n ξ依概率收敛于c ,即c Pn −→−ξ.下面, 我们来引入随机变量序列的另外一种收敛:平均收敛.定义 2 如果{}0;,>n n ξξ是r L 中的随机变量, 其中,0>r {}∞<=rr E L ξξ,并且0→-ξξn E , ()∞→n .则称随机变量序列{}N n n ∈,ξ依r 阶平均收敛到随机变量,ξ记作ξξ−→−rLn 当1=r 时简称为依平均收敛,并记为.ξξ−→−Ln在依概率收敛和平均收敛之间存在如下关系:定理 2 r 阶平均收敛蕴含依概率收敛. 证明:因为0lim =-∞→rn n E ξξ,故对,,0N ∃>∀ε当N n >时,有εξξrrn a E <- .又由Chebyshev 不等式知对任何0>a ,有()rrn n aE a P ξξξξ-≤≥-,故()εξξ<≥-a P n ,因此()0lim =≥-∞→a P n n ξξ.但是,反之不真.反例如下:例1 设概率空间为区间上的几何型概率空间,即有 ()1,0=Ω , () 1.0B F = , L P =. 令()0=ωξ, ()1,0∈∀ω, 而易知,对任何0>ε,当∞→n 时,都有 ()()020→=>≤>-nP P n n ξεξξ,所以ξξ−→−Pn ;但是1≡=-n n E E ξξξ, 所以n ξ不依平均收敛到ξ.在概率极限理论中,研究随机变量序列收敛性的同时当然也要研究相应的分布函数序列的收敛性,下面就让我们来谈一谈依分布收敛.定义3 设{}N n x F n ∈),(是一列定义在R 上的有界非降的左连续函数,如果存在一个定义在上的有界非降的左连续函数).(x F 使得),(),()(lim F C x x F x F n n ∈∀=∞→则称{})(x F n 弱收敛到)(x F 记为),()(x F x F n −→−ω并称)(x F 是{})(x F n 的弱极限。
大家注意我们在这里没有使用“分布函数”这个名词。
是因为:分布函数列的弱极限不一定是分布函数。
反例如下:例2 设⎪⎪⎩⎪⎪⎨⎧>≤<-+-≤=.,1;,2;,0)(n x n x n n nx n x x F n,.21)(;=∈∀x F N n显然{})(x F n 是分布函数序列,并且),()(x F x F n −→−ω但是()x F 却不是分布函数. 通过上述两点讨论,我们明确了依分布收敛的含义,从而可以给出如下定义: 定义4 如果{}N n x F n ∈),(是一列分布函数,并且存在分布函数)(x F ,使得)()(x F x F wn −→−,那么我们就称{})(x F n 依分布收敛到)(x F ,记为)()(x F x F d n −→−。
如果{}N n x F n ∈),(是随机变量序列{}N n n ∈,ξ的分布函数序列,而()x F 是随机变量ξ的分布函数,则当)(x F F dn −→−时,称依分布收敛ξ,并记为.ξξ−→−d n应当注意,依分布收敛只是随即变量的分布函数列之间的收敛关系,它们不能反映随即变量自身间的极限关系,此外,我们还有以下结论: 定理3 依概率收敛蕴涵依分布收敛.证明:设n ξ与ξ的分布函数分别为()x F n 和()x F .易知,对任何x y <,有()()()()()y x x x y x y y n n n n -≥-⊂<⊂≥<<<=<ξξξξξξξξ,,,所以()()()y x P x F y F n n -≥-+≤ξξ,从而可由ξξ−→−Pn 推知 ()()x F y F n n i n f lim ∞→≤.同理,对任何x z >,有()()z F x F n n ≤∞→s u p lim .如果()F C x ∈,联立上述二式,并且令x y ↑,x z ↓,那么就有 ()()()()x F x F x F x F n n n n ≤≤≤∞→∞→s u p lim inf lim .所以())(lim x F x F n n =∞←, ()F C x ∈∀,即ξξ−→−dn . 但是,反过来,我们却有:依分布收敛不蕴涵依概率收敛. 反例如下:例3 设()P F ,,Ω为古典型概率空间,其中{}21,ωω=Ω,()⎩⎨⎧===,,1,,021ωωωωωξn ;N n ∈∀ ()⎩⎨⎧===.,0,,121ωωωωωξ 那么n ξ和ξ都服从参数为21的Bernoulli 分布,所以()()x F x F n =,当然有()()x F x F dn −→−,亦即ξξ−→−dn .但是我们有()()1≡-ωξξw n , Ω∈∀ω, N n ∈∀,亦即对任何10<<ε,都有()1≡≥-εξξn P , N n ∈∀,所以ξn不依概率收敛于ξ.但当我们以表示退化于的随机变量时,在依分布收敛与依概率收敛之间却有如下特殊的关系:定理4 c d n −→−ξ等价于c pn −→−ξ.证明:由定理3知c p n −→−ξ蕴含c d n −→−ξ,所以只需证明反过来的蕴含关系.注意退化于德随机变量的分布函数为它只有一个不连续点c x =,所以当c d n −→−ξ时,有()⎩⎨⎧><=∞→.,1;,0lim c x c x x F n n故而对任何0>ε当∞→n 时,有()()()()()001→+-++-=-≤++≥=≥-εεεξεξεξc F c F c P c P c P n n n n n ,即有c pn −→−ξ. 接下来,让我们再介绍概率极限理论中一种重要的收敛,就是几乎必然收敛. 定义5 设随机变量ξ和随机变量序列{}N n n ∈,ξ定义在同一个概率空间()P F ,,Ω上,如果{},1)()(lim |==∞→ωξωξωn P(1)就说{}n ξ a.s.收敛到ξ,记为ξξ→n a.s.由于对固定的ω来说,{})(ωξn 就是数列,因此所谓)()(lim ωξωξ=∞→n n ,就是对任何0>ε,都存在N k ∈,使得只要k n ≥,就有()εωξωξ<-)(n 。
因此,我们可以用事件的语言把(1)表示为(),1)()()(0101=⎪⎪⎭⎫⎝⎛<-=⎪⎪⎭⎫ ⎝⎛<->∞=∞=>∞=∞= εεεωξωξωεξξk k n n k k n n P P(2)(2)中的 0>ε不是可列交,但是可以将其改写为如下的等价形式:.1)1(10=⎪⎪⎭⎫⎝⎛<-∞=∞=∞= m k kn n m P ξξ (3)运用对偶原理,可知(3)等价于.0)1(10=⎪⎪⎭⎫ ⎝⎛≥-∞=∞=∞= m k kn n m P ξξ (4)显然,(4)成立,当且仅当,0)1(1=⎪⎪⎭⎫ ⎝⎛≥-∞=∞= k k n n m P ξξ .N m ∈∀ (5)而(5)成立,当且仅当 ,0)(1=⎪⎪⎭⎫⎝⎛≥-∞=∞= k k n n P εξξ .0>∀ε(6)注意到∞=≥-kn n)(εξξ, N k ∈是下降的事件序列,所以由概率的上连续性知,(6)等价于0)(lim =⎪⎪⎭⎫⎝⎛≥-∞=∞→ k n n n P εξξ, .0>∀ε (7)总结上述讨论,我们得到:定理5 如果随机变量和随机变量序列定义在同一个概率空间上,则得充分必要条件是(7)成立.由定理5可以立即得到:定理6 如果ξξ→n a.s.,则必有ξξ−→−pn . 证明:由于ξξ→n a.s.故由(7)得,对0>∀a ,对0>∀ε,存在K ,当Kk >时,有()εξξ<⎪⎪⎭⎫ ⎝⎛≥-∞= k n n a P ,又因为()() ∞=≥-⊂≥-kn nn a a ξξξξ,故()()εξξξξ<⎪⎪⎭⎫⎝⎛≥-≤≥-∞= k n n na P a P ,因此,由依概率收敛的定义知ξξ−→−pn . 对于r L 收敛与a.s.收敛,我们有:定理 7 r L 收敛与a.s.收敛互不蕴涵.我们来看例中的随机变量序列{}N n n ∈,ξ与0≡ξ,不难证明有()ξωξ≡=∞→0lim n n ,Ω∈∀ω,因此ξξ→n a.s.,但是我们已经证明n ξ不依平均收敛于ξ,故a.s.收敛不蕴含r L 收敛. 反过来的例子如下:例4 仍将()p F ,,Ω取为区间()1,0上的几何概型空间,定义0≡ξ,令⎪⎪⎭⎫⎝⎛-+<<-=m mm m nn n I 22122ωξ, 122+<≤m m n , N m ∈∀ . 不难看出,对任何0>r ,都有0→=-rnrn E E ξξξ,故ξξ−→−rLn .但是,只要ω不是有理数,那么都有无限多个n 使得()1=ωξn ,故n ξ不a.s.收敛于ξ. 另外,由a.s.收敛我们还可引入另一种收敛,即完全收敛. 定义 6 设是{}n ξ随机变量序列,ξ是随机变量.如果对任一0>ε,有()∑∞=∞<≥-1n nP εξξ,那么就称随机变量序列{}n ξ完全收敛于随即变量ξ.显然完全收敛蕴涵a.s.收敛.因为事件序列的无穷多次发生和随机变量的 a.s.收敛之间有着密切的关系,所以接下来我们介绍无穷次发生的概念以及它与a.s.收敛的关系.定义7 设{}N n A n ∈,是概率空间()P F ,,Ω中的一列事件,如果存在无穷多个n ,使得n A ∈ω,我们就称事件序列{}n A 无穷多次发生,记作{}..,o i A n .上述定义中的..o i 是英语词汇infinitely often 的缩写.关于事件序列的无穷多次发生,我们有:定理8 如果{}N n A n ∈,是概率空间()P F ,,Ω中的一列事件,则{}...,1 ∞=∞==k k n n n A o i A证明:易知,{}⇔∈..,o i A n ω存在无穷多个n ,使得⇔∈n A ω对任何N k ∈,存在N n ≥,使得 ∞=∞=∈⇔∈1k kn n n A A ωω.运用上述概念与前面的讨论,我们可得:定理9 设{}N n n ∈,ξ为一列随机变量,ξ为随机变量.则n ξ a.s.收敛于ξ的充分必要条件是对0>∀ε,有()0..,=≥-o i P n εξξ.证明:因为ξξ→n a.s.⇔0)(lim =⎪⎪⎭⎫⎝⎛≥-∞=∞← k n n n P εξξ,.0>∀ε⇔,0)(1=⎪⎪⎭⎫ ⎝⎛≥-∞=∞= k k n n P εξξ .0>∀ε(因 ∞=≥-kn n )(εξξ,N k ∈是下降的事件序列,所以由概率的上连续性可知)⇔ ()0..,=≥-o i P n εξξ,0>∀ε.综上所述,我们可知随机变量序列中以上几种收敛之间有着如下关系: 1. r L 收敛与a.s.收敛互不蕴涵;2. r L 收敛与 a.s.收敛都蕴涵依概率收敛;但依概率收敛不蕴涵r L 收敛和 a.s.收敛;3. 依概率收敛蕴涵依分布收敛;但依分布收敛不蕴涵依概率收敛;4. 对于退化的随机变量,有C C d n p n −→−⇔−→−ξξ; 5. 完全收敛蕴涵a.s.收敛;但a.s.收敛不蕴涵完全收敛;6. 对于事件序列的无穷次发生和收敛,有ξξ→n a.s.⇔()0..,=≥-o i P n εξξ,0>∀ε.参考文献:[1] 林正炎,陆传荣等.概率极限理论基础.北京:高等教育出版社,1999 [2] 林正炎,白志东等.概率不等式.北京:科学出版社,2006[3] [苏]B.B.佩特罗夫著,苏淳译.独立随机变量之和的极限定理.安徽:中国科学技术大学出版社,1987[4] 胡迪鹤.分析概率论.北京:科学出版社,1997。