当前位置:文档之家› 实验十三 二项分布的计算与中心极限定.

实验十三 二项分布的计算与中心极限定.

实验十三二项分布的计算与中心极限定[实验目的]1.研究用Poisson逼近与正态逼近进行二项分布近似计算的条件2.检验中心极限定理§1 引言二项分布在概率论中占有很重要的地位。

N次Bernoulli实验中正好出现K次成功的概率有下式给出b k;n,p C n k p k1p n k,k=0,1,2,……..n.二项分布的值有现成的表可查,这种表对不同的n及p给出了b(k;n.p)的数值。

在实际应用中。

通常可用二项的Poisson逼近与正态逼近来进行二项分布的近似计算。

在本实验中,,我们来具体地研究在什么条件下,可用Poisson逼近与正态逼近来进行二项分布的近似计算。

在概率论中,中心极限定理是一个很重要的内容,在本实验中,我们用随即模拟的方法来检验一个重要的中心极限定理——Liderberg-Levi中心极限定理。

§2 实验内容与练习1.1二项分布的Poisson逼近用Mathematica软件可以比较方便地求出二项分布的数值。

例如n=20;p=0,1;Table[Binomial[n,k]*p^k*(1-p)(n-k),{k,0,20}]给出了b(k;20,0.1)(k=0,1,2,…..,20)的值。

联系 1 用Mathematica软件给出了b(k;20,0.1),b(k;20,0.3)与 b (k;20,0.5)(k=0,1,2,…..,20)的值。

我们可用Mathematica软件画出上述数据的散点图,下面的语句给出了b(k;20.0.1)的(连线)散点图(图13。

1):LISTpOLT[table[Binomi al[20,k]*0.1^k*0.9^(20-k),{k,0,20}],PlotJoined->True]图13.1 b(k;20,0.1)b k;n,p C n k p k1p n k (k=1,1,2,……,20)的散点图练习2绘出b(l;20,0.3)与b(k;20,0.5)(k=0,1,2,…,20)的散点图根据下面的定理,二项分布可用Poisson分布来进行近似计算。

定理13。

1 在Bernoulli实验中,以P n 代表事件A在试验中出现的概率,它与试验总数有关.如果np n→→λ,则当n→∞时,b k;n,pkke。

由定理13,1在n很大,p很小,而λ=np大小适中时,有b k;n.pc kn p k1p n kkke练习 3 用Poisson逼近给出b(k;100,0.01)(k=0,1,2,….,100)与b(k;1000,0.001)(k=0,1,2,…,1000)的近似值,并与它们的精确值比较,表13,1二项分布的Poisson逼近表13。

1给出了b(k;100.0.01)(k=0,1,2,…10)(表中即位b1(k)与b(k;1000,0.001)(k=0,1,2,,,,..10)(记为b2(k)的Poisson逼近的近似值记为p9k)与它们的精确值的比较,其中r1(k)=/b1(k)-p9k)/,r2(k)=/b2(k)-p(k)/从表13。

1可以看出,用Poisson分布来计算b(k;1000,0.001)比b(k;100,0.01)的效果好得多,我们可以画出它们的散点图(图13。

2)来观察近似计算的效果,下面的程序给出了b(k;20,0.1)的Clear n,k,l,p,b;b k_.n_.p_:Binomial n,k p^k l p^n p;l 2.0;n20;p l n;t1Table k,N b k,n,p,k,0,20;g1ListPlot t1,PlotJoined True,PlotStyle GrayLevel0.2,Thicknes0.001,PlotRange0.20,0,0.3pas k_,n_,p_:l^k k Exp1;t2Table k,N pas k,n,p,k,0,20;g2listPlot t2,PlotJoined true,PlotStyle GrayLevel0.1,Dashing0.002,Thickness0.01,PlotRange0,20,0,0.3;Show g1,g2;近似计算的精确值的比较图13。

2b(k;20,0.1)的Poisson近似计算的精确值的比较练习4绘出b(k;100,0.01)与b(k;1000,0.001)的近似计算与精确计算的散点图。

那么n,p,λ。

到底取何值时,我们可以用Poisson分布来近似计算二项分布的值呢?我们可以用误差来作为衡量标准评价缉私的效果若n与p给定,则b(k;n,p)与其Piosson逼近的误差是的k函数;根据上式可以定义二项分布的Poisson逼近的误差定义13。

2若n,p给定,我们定义二项分布b(k;n,p)(k=0,1,……p)的Poisson逼近的误差为;差通过简单的程序运算我们可以求得;p100,0.01=1.85*10-3 p1000,0.001=1.84*10-4练习5通过编程求出在n=10,100,1000与10000,λ=0.1,1与10时,二项分布的Poisson 逼近的误差,填入表13,2;你能从中发现什么规律那?在一定条件下我们可以认为,若绝对误差p<=10-3,则可以接受近似计算结果在λ=1时,若n=100,p=0.01,则p100,0.01=1.85 10-3>10-3,不能接受计算结果,即此时不能用Poisson逼近来缉私计算二项分布的值,若n=1000,p=0.001,则p1000,0.001=1.84 10-4<10-3,此时可用Poisson逼近来缉私计算二项分布的值,对λ=1,我们可以用编程求出n=2,3,…..1000的对应的Poisson二项分布的逼近的误差,图13。

3就是误差的散点图。

在λ=1时,要使绝对误差p>=10-3,必须n>=185练习6在λ=0.1,0.5,2.0,5.0,10.0时,n取何值,可使绝对误差p<=10-3?图13。

3Poisson逼近的误差(λ=1)练习7 若误差标准该为p<=10-4或其它的数据,研究上面对应的问题,练习8 对于n,p,λ到底取何值时,可以用Poisson分布来近似计算二项分布的值,你有什么结论?2.2 二项分布的正态逼近2.1节中讨论了用Poisson逼近来近似计算二项分布的问题。

在实际应用中,我们还可以用正态逼近来近似计算二项分布。

计算的根据是局部极限定理,在n-> 时,有C n k p k q k 1npqexp12k npnpq21.图13.4b(k;20,0.1)的正态逼近近似计算与精确的比较图13。

4是b(k;20,0.1)的正态逼近的近似值与精确的比较的散点图。

图 13。

5用另一种方式更直观地显示出逼近的效果。

图13。

5中,阶梯函数给出概率C n k p k q n-k,而曲线则给出对应的正态分布密度函数。

其Mathematica程序如下:n20;p0.1;q1p;tab Table Binomial n,k p^k1p^n k,k,0.20;f k_:Graphics GrayLevel0.5,Rectangle k0.5,0,k0.5,tab k1;g1Table f k,k,0,20;h x_:1Sqrt2Pi n p qExp x p Sqrt n p q^2 2.0;g2Plot h x,x, 2.0,15,PlotRange2,15,0,0.3;Show g1,g2,PlotRange2,15,0,0.3,Axes True由于n的取值比较小,我们可以看出,近似的效果不是很好。

练习9用正态逼近给出b(k;100,0.01)(k=0,1,2,…,100)与b(k;1000,0.001)(k=0,1,2,…,1000)的近似值,与它们的精确值作比较。

做出近似计算与精确计算的散点图。

练习10做出b(k;100,0.01)与b(k;1000,0.001)的阶梯函数与对应的正态分布密度函=数曲线,观察其效果。

若n与p给定,我们也可以定义二项分布b(k;n,p) (k=0,1,2,…,n)的正态逼近的误差为:N n,,p=maxN n,p(k)=max|C n k p k q n-k-(1/npq) (1/2)exp(-(1/2)[(k-np)/npq]^2)是、式中q=1-p.练习11 若分别取0.1,0.5,1.0,2.0,5.0,10.0,n取何值时,可使绝对误差N<=10^-3?练习12 n ,p取何值时,可以用正态逼近来近似计算二项分布的值。

练习13 比较二项分布的Poisson逼近与正态逼近的优劣。

2.3 中心极限定理的验证1.正态分布的假设检验在实际应用中,有许多随机数据都可以看作来自于正态分布。

那么,如何检验一批数据是否来自于正态分布呢?按照国家标准,我们采用D检验来判断随机数据的正态性。

下面通过一个例子介绍D检验的过程。

例下面是某种刀具生产的合格零件个数(已用Mathematica语句的形式给出),判断它们是否满足正态分布:t={459,362,624,509,584,433,748,815,505,612,452,434,982,640,742,565,706,593,680,926,653,164487,734,608,428,1153,593,844,527,552,513,781,474,388,824,538,862,659,775,859,755,649,697,515,628,954,771,609,402,960,885,610,292,837,473,677,358,638,699,634,555,570,84,416,606,1062,484,120,447,654,564,339,280,246,687,539,790,581,62,724,531,512,577,496,468,499,544,645,764,558,378,765,666,763,217,715,310,851,}解(1)将100个数据按非减次序排列:X(1)<=X( 2)〈=…<=X( 100)(2)计算统计量(其中n=100,X是数据样本的均值):(3)计算统计量; Y=02998598.0)28209479.0(Dn(4)给定检验水平α =0.05,查表得临界值Zα/2,; =-2.54及Z1-α/2 =1.31.(5)若 Zα/2<Y<Z1-α/2.,则接受正态分布假设,否则拒绝正态分布假设。

经计算得Y=-1.2933,显然-2 .54<-1.2933<1.31,接受正态分布假设.D检验的Mathematica程序如下:F[ata1]:=Module[{z1=-0.54,z2=1.31,dada=Sort[dada1]},N=Length[dada];Mean=Sum[dada[[k]],{k,1,n}]/n;D1=Sum[(k-(n+1)/2)*dada[[k]],{k,1,n}];D2=(Sqrt[n])^Sqrt[Sum[(dada[[k]]-mean)^2,{k,1,n}]];D=d1/d1;Y=Sqrt[n]*(d-0.28209479)/0.02998598;Result=If[z1<y<z2,1,0];Return[result]];F[t]运行该程序(运行程序前已将题给数据t输入),得f[t]的结果为1,表示通过正态检验。

相关主题