当前位置:文档之家› 概率论中的大数定律及中心极限定理

概率论中的大数定律及中心极限定理

概率论中的大数定律及中心极限定理唐南南摘要 概率论是从数量上研究随机现象的规律的学科,概率论的特点是先提出数学模型,然后去研究它的性质,特点和规律。

它在自然科学,技术科学和社会科学等科学中有广泛的应用。

而大数定律和中心极限定理的内容是概率论中极限理论极为重要的一部分内容。

在这篇文章中,我们从贝努力试验中的频率出发,讨论了独立随机变量和分布的极限问题。

在一定条件下,这些分布弱收敛于退化分布,这就是大数定律。

在另一些条件下,这些分布弱收敛于N(0,1)分布,这一类收敛于N(0,1)分布的定理统称为中心极限定理.大数定律说明了随机现象都具有稳定性而中心极限定理是研究相互独立随机变量序列{}i x 的部分和∑==ni in xS 1的分布,在适当条件下向正态分布收放的问题。

在这篇文章里,我们只介绍了一些定理的提出,内容以证明以及在其他学科上的应用,而大数定律和中心极限定理还有许多更深入,更广泛的内容,限于篇幅这里就不再介绍了。

掌握定理的结论是重要的,这些结论一方面使频率稳定于概率,n 次观察的算术平均值稳定于数学期望都有了明确的含义和理论依据;另一方面,又将给数理统计中大样本的统计推断等提供理论依据。

关键词 大数定律 中心极限定理 随机现象 随机变量引言大数定律和中心极限定理是概率论中重要的一部分内容,但对读者来说,多数人对于这部分内容感到很难掌握,这篇文章就是对这部分内容进行浅入的分析,但对其内容进行详细的说明,而且进行了归纳性的总结,指出了各定律之间的联系及其差别,希望通过本篇文章内容的介绍,能使读者对于这部分知识有一个清晰的印象,能整体地把握这部分内容。

一 、大数定律(一)、问题的提法(大数定律的提法)重复实验中事件的频率的稳定性,是大量随机现象的统计规律性的典型表现。

人们在实践中认识到频率具有稳定性,进而由频率的稳定性预见概率的存在;由频率的性质推断概率的性质,并在实际应用中(当n充分大时)用频率的值来估计概率的值。

这些都是概率的公理化定义的实际背景。

概率的概念以及在此基础上建立的理论应该与实际相符合。

因此,我们需要对频率的稳定性这一实际作理论的说明。

其实,在大量的随机现象中,不但事件的频率具有稳定性,而且大量随机现象的平均结果一般也具有这稳定性:单个现象的行为对大量随机现象共同产生的总平均效果几乎不发生影响,这就是说,尽管单个随机现象的具体实现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消,补偿和拉平,致使总的平均结果趋于稳定。

例如,在分析天平上称量一质量为u 的物品,以21,ξξ……,n ξ表示n 次重复测量的结果。

经验告诉我们,当n 充分大时,它们的算术平均值()∑==ni i n n 11ξξ对u 的偏差却很小,而且一般n 越大,这种偏差越小。

如果把一连串的观察结果21,ξξ……,n ξ看成随机变量,则上述直观现实表明,当n 充分大时,在一顶的收敛意义下,有u n ni i →∑=11ξ,它就是大量随机现象的平均结果稳定性的数学表达式。

频率的稳定性也可以表达成u n ni i →∑=11ξ这种形式。

为此令⎩⎨⎧=次试验中不出现若在第次试验中出现若在第i i i ,0,1ξ i=1,2……,n 。

那么,()∑==ni i n A u 1ξ是n 次试验中A 出现的频数。

频率的稳定性指的是随着n 无限增大,频率()A P n 趋于稳定概率()A P 附近,即在一定的收敛意义下())(1)(1A P n n A u A P n i i n n →==∑=ξ。

概率论中,一切关于大量随机现象的平均结果稳定性的定理,统称为大数定律,按收敛性的含义不同,大数定律有弱大数定律和强大数定律之分。

(二)、大数定律的内容及证明1、 在证大数定理时,我们经常用到著名的切比雪夫不定式,首先我们来讲这个不定式]2[。

设随机变量X 有期望()x E 和方差()x D ,则对于任意 ε>0,有(){}()2εεx D x E x P ≤≥-或(){}()21εεx D x E x P -≥<-证明:(1):x 是离散型随机变量的情形。

(){}(){}()[]()()[]()22222εεεεεεx D x E X PX E X x x P x E x P k x E x kk kx E x k k =-≤-≤==≥-∑∑∑≥-≥- ({}K K P X x P ==)(2)x 是连续随机变量的情形。

设x 的密度函数是()x P ,则有(){}()εε≥-⎰=≥-x E x x E x P ()dx x P 积分区域如图:P(x)E(x)-ε E(x) E(x)+ε 由于()(),,)(,εεε-≤-≥-≥-x E x x E x x E x 所以 即()().,εε-≤+≥x E x x E x 于是有(){}()()()()[]()()[]()()222221εεεεεεx D dx x P x E x dxx P x E x dx x P x E x P x E x x E x =-≤-⎰≤⎰=≥-⎰∞+∞-≥-≥-切比雪夫不定式给出了在随机变量x 的分布未知的情况下,对事件X(){}ε<-x E x(或事件(){}ε≥-x E x 的概率的一种估计方法。

例如在式子(){}()21εεx D x E x P -≥<-中令σσε43、=,并令()u x E =,则有{}8889.03≥<-σu x P (8889.0989122≈=-σσ){}9375.04≥<-σu x P式子(){}()2εεx D x E x P ≤≥-给出了离差不小于ε的概率的上界,而式子(){}()21εεx D x E x P -≥<-给出了离差不小于ε的概率的下界,而且二个式子对任何具有方差的随机变量都成立。

从第二个式子中又可以看到,()x D 越小,概率(){}ε<-x E x P 就越大,说明x 取值集中于其期望周围的程度越高;()x D 越大,概率(){}ε<-x E x P 就越小,说明x 取值集中于平均值附近的程度越低,这就使我们方差定义的含义有了进一步的理解。

例1. 对小麦品种做发芽试验,种子发芽的概率未知,问要用多少颗小麦做试验才能认为发芽的概率与P 相差不超过1/10的概率达到95%? 解:用S n 表示试验的n 颗种子中发芽的颗数,则发芽的频率是nS n,我们要确定n ,使得n 满足%95101≥⎭⎬⎫⎩⎨⎧<-P nS P n 或%510≤⎭⎬⎫⎩⎨⎧≥-n nP S P n 。

因为S n 服从二项分布,所以,E(Sn)=nP, D(S n )=nP(1-P). 又因为P(1-P)=-P 2+P=-(P-21)2+41故p(1-p)≤41n n p np n nP S P n 2510)1(102≤⎪⎭⎫⎝⎛-≤⎭⎬⎫⎩⎨⎧≥-说明所选的n 要满足≤n255%,即n ≥500 2、现在再讲述一种常见的大数定律的数学定义 假设1ξ,2ξ…,n ξ,…是随机变量的序列,令n ξ=nnξξξ+++ 21, 如果存在这样的一种常数序列α1,α2,…,αn…,对任意的ε>ο,恒有∞→n lim {},1=<-εξnn a p 则称序列{}n ξ(接算术平均值)服从大数定律。

必须指出,更加一般地描述大数定律的形式是:对于随机变量序列{}n ξ,令=n ζf n (ξ1,ξ2,…ξn ),这里ζn 是{}i ξ( ,2,1=i )的对称的函数。

如果存在常数列序列α1,α2,…,αn …,对任意的ε>ο,成立∞→n lim {},1=<-εζn n a p ,则称这种随机变量的序列按函数f n 服从大数定律。

3、下面具体介绍几个大数定律的内容及证明。

(1)切比雪夫大数定律。

①、定义 设X 1,X 2,,…,X n ,…是一个随机变量序列,若存在常数a ,使得对任意0>ε,都有∞→n lim{},1=<-εa X p n 则称随机变量序列{}n X 依概率收敛于a ,记作a X pn −→−。

②、定义 设X 1,X 2,,…,X n ,…是一个随机变量序列,数学期望()(),......2,1=i x E 存在,使得对于任意0>ε,都有∞→n l i m (),11111=⎭⎬⎫⎩⎨⎧<-∑∑==εn i i n i i X E n X n p ,则称随机变量序列{}n X 服从大数定律。

{}n X 服从大数定律,实质是说01111−→−-∑∑==Pn i i n i i X n X n 。

③、定理 若独立随机变量序列X 1,X 2,…,X n ,…,各有数学期望()i i u X E =,方差()()无关的常数是与i c i c X D i ......,2,1==<,则对于任意0>ε,有∞→n lim 11111=⎭⎬⎫⎩⎨⎧<-∑∑==εni i n i i u n X n p 。

④、证明:令∑==ni i n X n X 11,由于X i 相互独立,所以()∑==n i i n u n X E 11()∑==⋅≤=ni i nn cnc nnX D 122211σ由式子(){}()21εεx D x E X P -≥<-可以得到 (){}()2211εεεn c X D X E X P nn n -≥-≥<-当n ∞→时,取极限使得∞→n lim(){},1≥<-εn n X E X p 但由于概率不可能大于1,所以∞→n lim (){},1=<-εn n X E X p ⑤结论:这个定理表明,在定理成立的条件下,当n 充分大时,n 个独立随机变量X 1,X 2,,…,X n ,的算术平均数这一随机变量n X 的分布,对于它的数学期望()∑=ni i X E n 11的附近,而当n 充分大时,与其期望之差依概率收敛到0。

此处所谓大数的“大”是指定理中极限等式右端的“1”。

⑥推论:若X 1,X 2,,…,X n ,,…是独立在同分布的随机变量序列,且E (X i )=u ,D (X i )=2σ(i=1,2,……),则对于任意的0>ε,都有∞→n lim 111=⎭⎬⎫⎩⎨⎧<-∑=εu X n p n i i 这一推论使我们关于算术平均值的法则有了理论依据,经过算术平均后得到的随机变量∑==n i i n X n X 11,其分布随着n 的增大越来越紧密地聚集在它的期望附近。

切比雪夫定理为我们提供了关于用抽样算术平均数估计总体平均数(期望)的理论依据。

假如在相同的条件下进行n 次重复抽样,得到n 个不同的值X 1,X 2,,…,X n ,我们可把这些结果看成独立同分布的随机变量X 1,X 2,,…,X n 的试验数值,且E (X i )=u ,D (X i )=2σ。

相关主题