当前位置:文档之家› (完整版)大数定律和中心极限定理

(完整版)大数定律和中心极限定理

第五章 大数定律和中心极限定理一、内容提要(一)切贝谢夫不等式 1. 切贝谢夫不等式的内容设随机变量X 具有有限的数学期望E (X )和方差D (X ),则对任何正数ε,下列不等式成立。

(){}()(){}().1,22εεεεX D X E X P X D X E X P -≤-≤≥-2. 切贝谢夫不等式的意义(1)只要知道随机变量X 的数学期望和方差(不须知道分布律),利用切贝谢夫不等式,就能够对事件(){}ε≥-X E X 的概率做出估计,这是它的最大优点,今后在理论推导及实际应用中都常用到切贝谢夫不等式。

(2)不足之处为要计算(){}ε≥-X E X P 的值时,切贝谢夫不等式就无能为力,只有知道分布密度或分布函数才能解决。

另外,利用本不等式估值时精确性也不够。

(3)当X 的方差D (X )越小时,(){}ε≥-X E X P 的值也越小,表明X 与E (X )有较大“偏差”的可能性也较小,显示出D (X )确是刻画X 与E (X )偏差程度的一个量。

(二)依概率收敛如果对于任何ε>0,事件{}ε a X n -的概率当n →∞时,趋于1,即{}1lim =-∞→ε a X P n n ,则称随机变量序列X 1,X 2,…,X n ,…当n →∞时依概率收敛于α。

(三)大数定律 1. 大数定律的内容(1)大数定律的一般提法若X 1,X 2,…,X n ,…是随机变量序列,如果存在一个常数序列α1,…,αn ,…,对任意ε>0,恒有11lim 1=⎭⎬⎫⎩⎨⎧-∑=∞→ε n i n i n a X n P , 则称序列{X n }服从大数定律(或大数法则)。

(2)切贝谢夫大数定律设随机变量X 1,X 2,…,X n ,…相互独立,分别有数学期望E(X i )和方差D(X i ),且它们的方差有公共上界C ,即()().,,,2,1, n i C X D i =≤则对于任意的ε>0,恒有()111lim 11=⎭⎬⎫⎩⎨⎧-∑∑==∞→ε n i ni i i n X E n X n P 。

(3)辛钦大数定律设X 1,X 2,…,X n ,…是一列独立同分布的随机变量,且数学期望存在:() ,2,1,==i a X E i则对于任意的ε>0,有11lim 1=⎭⎬⎫⎩⎨⎧-∑=∞→ε n i i n a X n P 。

(4)贝努里大数定律设n A 是n 次独立试验中事件A 发生的次数,p 是事件A 在每次试验中发生的概率,则对于任意的ε>0,恒有1lim =⎭⎬⎫⎩⎨⎧-∞→ε p n n P A n 。

2. 大数定律的意义(1)大数定律从理论上证明了“频率的稳定性”,对概率论的建立起了奠基作用。

(2)切贝谢夫大数定律说明经验平均值接近于理论平均值;辛钦大数定律说明随机变量的平均值接近于数学期望,这是测量中取平均值的理论依据;贝努里大数定律说明了频率具有稳定性,即频率收敛于概率,这是用频率f n (A )来估计概率p 的理论依据。

(3)把独立随机变量和的平均作为大数定律的研究对象在理论上的应用上都是重要的。

(四)中心极限定理 1. 中心极限定理的内容(1)独立同分布中心极限定理设随机变量X 1,X 2,…,X n ,…相互独立,服从同一分布,且具有有限的数学期望和方差:E (X K )=μ,D (X K )=σ2≠0,(K =1,2,…,n ,…),则随机变量σμn n XY nK Kn ∑=-=1的分布函数F n (x ),对于任意的x ,满足()⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=∑=∞→x n n X P x F n K K n n σμ1lim lim (2)德莫佛一拉普拉斯中心极限定理设随机变量() ,2,1=n n η具有参数为n ,p )10(<<p 的二项分布,则对于任意区间],(b a ,恒有()⎰-∞→=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--b a dt tn n e b p np np a P 22211lim πη 。

2. 中心极限定理的意义(1)中心极限定理从理论上证明了“许多类型”的随机变量,它们的极限分布服从正态分布,这既肯定了正态分布在概率论中处于主导地位,又给概率计算提供了强有力有手段。

(2)中心极限定理是把独立随机变量的和作为研究对象。

(3)应用中心极限定理前的准备步骤(a )把问题归结为独立随机变量的和∑==nK KXX 1。

(b )把和“中心化”:().11∑∑==-nK K nK KX E X(c )把和再“标准化”:()().111∑∑∑===-nK KnK K nK K X D X E X对于独立同分布中心极限定理标准化后是,1σμn n XnK K∑=-对于德莫佛一拉普拉斯中心极限定理标准化后是().1p np npn --η(4)由独立同分布中心极限定理知:若X 1,X 2,…,X n ,…独立同分布,则n →∞时,随机变量X= X 1+X 2,+…+X n =∑=ni i X 1渐近地服从正态分布N (E (X ),D (X ))=N (n μ,n σ2),或()()σμn n X X D X E X -=-渐近地服从标准正态分布N (0,1)。

由德莫佛一拉普拉斯中心极限定理知,若随机变量X ~B (n ,p ),则当n 充分大时,npqnp X -就近似服从标准正态分布N (0,1)。

记为()1,0~.N npqnp X da - 从而得当n 较大时,二项分布的近似计算公式{}.⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫⎝⎛-Φ=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-≤--=≤npq np a npq np b npq np b npq np X npq np a P b X a P二、要 求1. 掌握切贝谢夫不等式,会用切贝谢夫不等式估计(){}ε X E X P -、(){}.ε≥-X E X P2. 了解大数定理的内容和意义。

3. 掌握中心极限定理的内容,会做一些简单应用题。

三、例题分析例1 在每次试验中,事件A 发生的概率为0.5,利用切贝谢夫不等式估计在1000次独立试验中,事件A 发生的次数在400~600之间的概率。

分析 利用切贝谢夫不等式估计某事件的概率,需作如下准备:(1)恰当地选择随机变量X ;(2)求出E (X ),D (X );(3)依题意确定ε。

在此基础上可利用切贝谢夫不等式进行估计。

解 设X 表示在1000次独立试验中,事件A 发生的次数,则X ~B (1000,0.5),且E (X )=np =500,D (X )=npq =250.于是{}{}{},100100100500100600400 -=--=X P X P X P在切贝谢夫不等式中,取ε=100,则有{}(){}().403910000250110011006004002=-=-≥-=X D X E X P X P 即在1000次独立试验中,事件A 发生的次数在400~600之间的概率在4039以上。

例2 利用切贝谢夫不等式估计随机变量与其数学期望差的绝对值大于三倍均方差的概率。

分析 依题意,要估计()(){}X D X E X P 3≥-只需在切贝谢夫不等式中取()X D 3=ε即可。

解 设随机变量X 的期望为E (X ),方差为D (X ),在切贝谢夫不等式中,取()X D 3=ε,则有()(){}()()9193=≤≥-X D X D X D X E X P 。

评注 由例1、例2可以看出:利用切贝谢夫不等式可以对随机变量的分布做出估计,即对于任意的ε,可以估计出(){}(){}εε≥--X E X P X E X P , 。

当然这种估计还是非常粗略的,如X ~N (μ,σ2),则{}%3.03 σμ≥-X P 。

而利用切贝谢夫不等式进行估计,则{}913≤≥-σμX P 。

切贝谢夫不等式更重要的价值在于对理论研究的贡献,大数定律的理论证明是其中之一。

例3 设X 为连续型随机变量,p (x )为分布密度,如果E |X |K (K 为正整数)存在,则对于任意的ε>0,有{}KKXE X P εε≤≥证明{}()()()().11KKKKx KKKx x XE dx x p x dx x p xdx x p xdx x p X P εεεεεεεε=≤=⎪⎪⎭⎫⎝⎛≤=≥⎰⎰⎰⎰∞+∞-≥≥≥说明 切贝谢夫不等式的证明方法是很有特色的,同样在本题的证明过程中两次加强了不等式,其一是利用在积分区间1≥≥KK x,x εε上。

其二是利用被积函数非负扩大积分区间(由部分区间扩大到整个数轴上)。

例4 计算机进行加法计算时,把每个加数取为最接近它的整数来计算。

设所有的“加数”取整数的误差是相互独立的随机变量且都在[-0.5,0.5]上均匀分布。

若将1200个数相加,求误差总和的绝对值小于15的概率。

分析 以随机变量X 表示误差总和,X K 表示各个加数取整数的误差(K =1,2,…,1200),则∑==12001K K X X 。

由于X 1,X 2,…X 1200相互独立且服从同一分布,由中心极限定理得X 近似地服从正态分布,从而可计算出{}15 X P 。

解 以随机变量X 表示误差总和,X K (K =1,2,…,1200)表示各个加数取整的误差,则.12001∑==K K X X由题意知X 1,X 2,…X 1200相互独立都在[-0.5,0.5]上服从均匀分布,因此()()()()()()()().100,0,1200,2,1,121125.05.0,025.05.0120011200112001120012==⎪⎭⎫ ⎝⎛===⎪⎭⎫ ⎝⎛===+==+-=∑∑∑∑====K K K K K K K K K K X D X D X D X D X E X E K X D X E由中心极限定理知()()101000XX X D X E X =-=-近似地服从标准正态分布。

所以 {}{}151515 X P X P -=()().8664.05.15.11015101015=-Φ-Φ≈⎭⎬⎫⎩⎨⎧-= X P 例5 现存有一批种子,其中良种占61,今取6000粒种子,试以0.99的概率推断,在这6000粒种子中良种所占的比例与61的差是多少?相应的良种在哪个范围? 分析 以随机变量X 表示在6000粒种子中良种的个数,则⎪⎭⎫ ⎝⎛61,6000~B X 。

由于n =6000较大,由德莫佛一拉普拉斯定理知6510001000⨯-=-X npqnp X 近似地服从N (0,1)。

依题意,就是要确定ε>0,使.99.0616000=⎭⎬⎫⎩⎨⎧-ε X P解 以随机变量X 表示6000粒种子中的良种粒数,则⎪⎭⎫ ⎝⎛61,6000~B X 。

相关主题