中心极限定理的内涵和应用在概率论与数理统计中,中心极限定理是非常重要的一节内容,而且是概率论与数理统计之间承前启后的一个重要纽带。
中心极限定理是概率论中讨论随机变量和的分布以正态分布为极限的一组定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从于正态分布的条件。
故为了深化同学们的理解并掌握其重要性,本组组员共同努力,课外深入学习,详细地介绍了中心极限定理的内涵及其在生活实践中的应用。
一、独立同分布下的中心极限定理及其应用在对中心极限定理的研究中,我们不妨由浅入深地来学习,为此我们先来研究一下在独立同分布条件下的中心极限定理,即如下的定理1:定理l (林德伯格-勒维中心极限定理)设{}n X 是独立同分布的随机变量序列,且0)(,)(2>==σμi i X Var X E 存在,若记nn X Y n i i n σμ-=∑=1 则对任意实数y ,有 {}⎰∞--∞→=Φ=≤y t n n t y y Y P .d e π21)(lim 22(1) 证明:为证明(1)式,只须证}{n Y 的分布函数列弱收敛于标准正态分布。
由定理可知:只须证}{n Y 的特征函数列收敛于标准正态分布的特征函数。
为此,设μ-n X 的特征函数为)(t ϕ,则n Y 的特征函数为nY n t t n ⎥⎦⎤⎢⎣⎡=)()(σϕϕ 又因为E(μ-n X )=0,Var(μ-n X )=2σ,所以有()0ϕ'=0,2)0(σϕ-=''。
于是,特征函数)(t ϕ有展开式)(211)(2)0()0()0()(22222t o t t o t t +-=+''+'+=σϕϕϕϕ 从而有=⎥⎦⎤⎢⎣⎡+-=+∞→+∞→n n Y n n t o nt t n )(21lim )(lim 22ϕ22t e - 而22t e -正是N(0,1)分布的特征函数,定理得证。
这个中心极限定理是由林德贝格和勒维分别独立的在1920年获得的,定理告诉我们,对于独立同分布的随机变量序列,其共同分布可以是离散分布,也可以是连续分布,可以是正态分布,也可以是非正态分布,只要其共同分布的方差存在,且不为零,就可以使用该定理的结论。
定理1的结论告诉我们:只有当n 充分大时,n Y 才近似服从标准正态分布)1,0(N ,而当n 较小时,此种近似不能保证。
也就是说,在n 充分大时,可用)1,0(N 近似计算与n Y 有关事件的概率,而n 较小时,此种计算的近似程度是得不到保障的。
当)1,0(~N Y n 时,则有),(~),,(~221n N X n n N X n i i σμσμ∑=经过多方面的理论研究,我们可知定理1主要适用于以下两个方面;应用一:求随机变量之和n S 落在某区间的概率(例如例2.)。
应用二:已知随机变量之和n S 取值的概率,求随机变量的个数n 。
在日常生活中,我们会发现其实有很多的例子均可用林德伯格-勒维中心极限定理来解决。
在此我们从中选择了几个典型而又带有新意的例子,仅供大家参考。
例1.用中心极限定理说明在正常的射击条件下,炮弹的射程服从或近似服从正态分布。
[1]解:设a 为理论射程,ξ为实际射程,则η=ξ-a 为实际射程对理论射程的偏差,显然ξ=η+a ,故只需证η~N(μ,2σ)。
由于在实际射击中,有很多不可控制的随机因素在不断变化,所以造成了实际射程对理论射程的偏差,若设1ξ:射击时炮身振动引起的偏差,2ξ:炮弹外形差异引起的偏差,3ξ:炮弹内火药的成分引起的偏差,4ξ:射击时气流的差异引起的偏差……,n ξ:……,显然有η=∑=n i i 1ξ∵影响实际射程的因素是大量的,∴这里的n 一定很大,又∵炮身的振动、炮弹的外形、火药的成分、气流的变化…….这些因素之间没有什么关系(或有微弱关系)。
∴由它们引起的1ξ,2ξ,……n ξ可看做是相互独立的。
而正常的射击条件也就是对射程有显著影响的因素已被控制,所以1ξ,2ξ,……n ξ所起的作用可看做是同样微小。
∴由中心极限定理可知η~N(μ,2σ)。
∵η可正,可负且相会均等 ∴p=0 ∴η~N(0,2σ)。
则),(~2σηξa N a +=从这个例子来看,虽然看上去有点复杂,但是我们还是很清晰地可以看到如果一个随机变量能表示成大量独立随机变量的和,并且其中每一个随机变量所起的作用都很微小,则这个随机变量服从或近似服从正态分布,这给我们的计算带来很大方便。
现在的旅游、汽车等行业越来越受欢迎,为了体现中心极限定理的重要性,我们不妨从现实生活中的热门行业说起,看看它到底起到怎样的重要性。
例2.某汽车销售点每天出售的汽车服从参数为λ=2的泊松分布,若一年365天都经营汽车销售,且每天出售的汽车数是相互独立的,求一年中售出700辆以上汽车的概率。
[1]解:设i ξ为第i 天出售的汽车的数量,则36521......ξξξξ+++=为一年的总销量,由2)()(==i i Var E ξξ,知=)(ξE 365×2=730利用中心极限定理得P(ξ>700)=1-P(ξ≤700)≈1—)730730700(-Φ=1-Φ(一1.11)=0.8665从此例可以看出,中心极限定理揭示了离散型随机变量与连续型随机变量的内在关系,即离散型随机变量的极限分布是正态分布。
事实上,在现实生活中的很多方面,我们都能清晰地看到中心极限定理的存在。
那么在理论中,我们也可用它来解决一些比较抽象的问题,比如下面的极限求解问题。
例3.利用中心极限定理证明:21!lim 0=∑=-∞→n k k n n k n e [1] 证明:设{k ξ}独立同分布且k ξ~P(1),k=1,2…….则a=()k E ξ=l ,2σ=()k Var ξ=1∵由泊松分布的可加性知∑=nk k 1ξ~P(n) ∴n n k k n k n i i n k k e k n k P n P -====∑∑∑∑=⎪⎭⎫ ⎝⎛==⎪⎭⎫ ⎝⎛≤0011!ξξ又∵由中心极限定理知:()⎥⎦⎤⎢⎣⎡≤-=⎪⎭⎫ ⎝⎛≤-=⎪⎭⎫ ⎝⎛≤∑∑∑===010111k n k n k k n k k P n P n P ξξξ ()()00111Φ→⎥⎦⎤⎢⎣⎡≤-=∑=n k k n P ξ ()∞→=n 21 ∴21!lim 0=∑=-∞→n k k n n k n e如果在林德伯格-勒维中心极限定理中,n X 服从二项分布,就可以得到以下的定理:定理2(棣莫弗-拉普拉斯中心极限定理)设n 重伯努利试验中,事件A 在每次试验中出现的概率为p (0<p<1),记n S 为n 次试验中事件A 出现的次数,且记npq npS Y n n -=*,则对任意实数y ,有dt e y y Y P yt n n ⎰∞--∞→==≤2*221)()(lim πφ该定理是林德伯格-莱维中心极限定理的特殊情况,是最早的中心极限定理。
大约在1733年,棣莫弗对p=21证明了上述定理,后来拉普拉斯把它推广至p 是任意一个小于l 的正数上去。
它表明,n 充分大时,npq npS Y n n -=*分布近似服从与标准正态分布,常称为“二项分布收敛于正态分布”,正态分布是二项分布的极限分布,当n 充分大时,我们可以利用该定理的结论来计算二项分布的概率。
由于此定理有更广泛的实际应用,我们将在下面的部分具体地分析棣莫弗-拉普拉斯中心极限定理在实际生活中的应用。
二、独立不同分布下的中心极限定理及其应用前面我们已经在独立同分布的条件下,解决了随机变量和的极限分布问题。
在实际问题中说诸i X 具有独立性是常见的,但是很难说诸i X 是“同分布”的随机变量。
比如在我们的生活中所遇到的某些加工过程中的测量误差n Y ,由于其是由大量的“微小的”相互独立的随机因素i X 叠加而成的,即∑==ni i n X Y 1,诸iX 间具有独立性,但不一定同分布。
在此,我们还要深入地研究在独立不同分布的前提下,各随机变量和的极限分布问题,目的是给出极限分布为正态分布的条件。
为使极限分布是正态分布,必须对∑==ni i n X Y 1的各项有一定的要求。
譬如若允许从第二项开始都等于0,则极限分布显然由1X 的分布完全确定,这时就很难得到什么有意思的结果。
这就告诉我们,要使中心极限定理成立,在和的各项中不应有起突出作用的项,或者说,要求各项在概率意义下“均匀地小”。
下面我们来分析如何用数学式子来明确表达这个要求。
设}{X n 是一个相互独立的随机变量序列,它们具有有限的数学期望和方差: i i X E μ=)(,2)(i i X Var σ=,.,2,1⋅⋅⋅=i要讨论随机变量的和∑==ni i n X Y 1,我们先将其标准化,即将它减去均值、除以标准差,由于,)(21n n Y E μμμ+⋅⋅⋅++=)(n Y σ=)(n Y Var =22221n σσσ+⋅⋅⋅++,且记)(n Y σ=n B ,则n Y 的标准化为∑=*-=+⋅⋅⋅++-=n i n i i n n n nB X B Y Y 121)(μμμμ。
如果要求中各项ni i B X μ-“均匀地小”,即对任意的,0>τ要求事件}{}{n i i n ii ni B X B X A τμτμ>-=>-=发生的可能性小,或直接要求其概率趋于0.为达到这个目的,我们要求0)max (lim1=>-≤≤∞→n i i ni n B X P τμ。
因为 ∑==≤≤>-≤>-=>-ni n i i ni n i i n i i n i B X P B X P B X P 111)())(()max (τμτμτμ , 若设诸i X 为连续随机变量,其密度函数为)(x p i ,则上式右边=∑⎰∑⎰=>-=>--≤n i B x i i n n i B x i n i n i dx x p x B dx x p 12221)()(1)(τμτμμτ因此,只要对任意的,0>τ有0)()(1lim 1222=-∑⎰=>-∞→n i B x i i n n n i dx x p x B τμμτ, )2(就可保证*n Y 中各加项“均匀地小”。
上述条件(2)称为林德伯格条件[2]。
林德伯格证明了满足(2)条件的和*n Y 的极限分布是正态分布,这就是下面给出林德伯格中心极限定理。
定理3(林德伯格中心极限定理) 设独立的随机变量序列设}{X n 满足(2)林德伯格条件,则对任意的x ,有dt e x X B P xt n i i i n n ⎰∑∞--=∞→=≤-21221))(1(lim πμ.假如独立随机变量序列}{X n 具有同分布和方差有限的条件,则必定满足以上(2)林德伯格条件,也就是说定理l 是定理3的特例。