当前位置:文档之家› 二项分布中方差的计算

二项分布中方差的计算

二项分布中方差的计算假设ξ~B (n ,p ), 即kn k k n q p C k P -==}{ξ考虑E [ξ(ξ-1)]=Eξ2-Eξ 而∑∑∑∑=----=-=-=--=-----⋅-⋅=--=-=-nk kn k k n nk k n k nk kn k nk kn kk nq p C p n n q p k n k n n n q p k n k n k k qp C k k E 22222220)1()]!2(2[)!2()!2()1()!(!!)1()1()]1([ξξ令2-=k i 上式=222220222)1()1(np p n p n n q p Cpn n n i i n i in -=-=-∑-=---即2222np p n E E -=-ξξ,再将E ξ=np 代入上式,得)1(222222p np p n np np p n E -+=+-=ξ 最后得npq np p np p n E E D =--+=-=22222)()1()(ξξξ 例1的分布图例2的分布图4.2 超几何分布 例1的图形:例2的图形:定义4.2 设N 个元素分为两类, 有N 1个属于第一类, N 2个属于第二类(N 1+N 2=N ). 从中不重复抽样取n 个, 令ξ表示这n 个中第一类元素的个数, 则ξ的分布称为超几何分布,),....,1,0()(21n m CC C m P nNm n N m N ===-ξ规定: 如n <r , 那末0=rn C由概率分布的性质可知1)(0==∑=n m m P ξ, 即1021=∑=-nm nNm n N m N C C C可得组合的性质n N N nk k n N k N C C C21210+=-=∑ 计算ξ的数学期望和方差有两种方法第一种, 按定义∑∑∑∑===-=-++-+--⋅+----=+--⋅-⋅=====nm n Nnm n N nm n Nm n Nm N n m m n N m n N m N m N C N m n N m n N m N m N m C CC C mm mP E 1221111221100)!11()!11(!)!11()!1()!1()!()!(!)!(!!1)(21ξξ令k =m -1, 则上式=np N N n n N n N n N n N N C C N C C C N n N n Nn k kn N k N nN=⋅=---⋅-==---=---∑111111111)!()!1()!1()!(!!21其中NN p 1=为只抽一次抽到元素N 1的概率 因此放回抽样(二项分布)与不放回抽样(超几何分布)的数学期望是一样的.∑∑∑∑∑=-----=-=-=-=-=⋅+-----=⋅--=-==-=-n m m n N m N nN nm mn N n N nm mn N n N nm nNm n N m N n m C C C N N C m N m N C N N C m N m N C C C C m m m P m m E 2)2()2(2211211112112212221)1()!22()!2()!2()1()!()!2(!1)1()()1()]1([ξξξ令k =m -2,上式=221120)2(211)1()1(21---=---⋅-=-∑n N nN n k kn N k N n N C C N N C C C N N)1()1()1()!()!2()!2()!(!!)1(1111---=---⋅--=N N n n N N n N n N n N n N N N因此NnN N N n n N N E E E 1112)1()1()1()]1([+---=+-=ξξξξ11)1())(()1()]()([)1(][)1(][)1()]1()1()1)(1[()1()1()1()1()1()1()1()1()(21211211121211211211121112212111221211122--=--⋅⋅⋅=---=----==-++--==-+--++--=----+--==----+--==-+---=-=N n N npqN n N N N N N n N N n N N N nN N N N N n N N N nN N N nN N nN N N nN N N nN N nN N N N nN N N nN N nN N N N nN N N N n N nN N N N N n N N nN N n n N N N N n N nN N N n n N N E E D ξξξ 其中q =1-p另有一种办法计算ξ的数学期望,假设ξi 是第i 次抽到第一类元素的个数,因为只是1次,当然不是1就是0,因此服从0-1分布,且有),...,2,1(,)0(,)1(21n i q NNP p N N P i i =======ξξ,则),...,2,1(1n i p NN E i ===ξ因此np NN n nE E E E E E i nn =⋅==+++=+++=12121)(ξξξξξξξξ整个方法同二项分布时的相应方法一样,只是各ξi 间并非相互独立,但和的期望等于期望的和这条性质并不要求和中各项的随机变量相互独立。

当N 非常大时,远大于抽样数n 时,记作N >>n 超几何分布可以用二项分布来近似。

为说明这一点,首先给出一个近似式如下:当N >>n 时,有!n N C nn N≈这是因为)11()21)(11(!!)1()2)(1(Nn N N n N n n N N N N C n n N ----=+---=当N 很大时,后面每个括号的值近似为1,因此上面近似式成立,N 越大越准确,当N 趋于无穷时,约等于可以变为等于。

而当超几何分布中总元素的个数N 非常大时,N >>n , 在保持N 1/N 不变的情况下N 1和N 2也会很大,也有N 1>>m , N 2>>n -m , 因此有m n m m n mn m nmn m nNm n N m N qp C N N N N m n m n n Nm n N m N C C C m P ----=⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛-=-⋅≈==2121)!(!!!)!(!)(21ξ 当N 趋于无穷时,近似式就成为准确式。

4.3 普哇松分布普哇松分布的来源是这样, 有时候要在一个单位长的时间段内进行大量的二项分布试验, 但希望在这个单位长的时间段内事件A 发生的平均数量为指定值λ, 因此将单位长度的时间段平均划分为n 段, 在每一段做一次独立试验, 使事件A 发生的概率为p , 而因为单位时间长度内, 即n 次试验中A 平均要发生给定值λ次, 而二项分布的均值已知为np , 也就是满足λ=np ,或者说在给定试验次数n 和均值λ的情况下,p =λ/n那么, 当n 很大时, p 必然很小, 这时候的二项分布就很接近普哇松分布, 当n 趋向于无穷大时, 必有p 趋向于无穷小, 即在每个"无穷小"的时间段内都做一次独立试验, 事件A 发生的概率也是"无穷小", 但积累起来, 单位时间内A 发生的平均数量还是λ. 在推导时, 要用到近似公式x x eλλ)1(-≈-当x 趋向于无穷小时等式严格成立. 当给定λ=np , 且n 很大, p =λ/n 很小时k n k kn q p C k P -==)(ξ假设k <<n 因此!k n C k k n≈则λλλλλλλξ-∞→---→⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-=-=≈=ek n n k p k np q p k n k P n knkkn kk n k k !11!)1(!)(!)(因此我们有定义4.3 如果随机变量ξ的概率密度函数是,...)1,0(!)()(====-m e m m P m P mλλλξ其中λ>0, 则称ξ服从普哇松(Poisson )分布.利用级数∑+∞==0!k kxk x e可得1!)(0===-∞=-∞=∑∑λλλλλe e e m m P m mm数学期望与方差的计算∑∑∞=--∞=--⋅==11)!1(!m m m me m em mE λλλλλξ令1-=m k 则λλλξλ==-∞=∑e k E k k!当用普阿松分布来近似二项分布时,np =λ,其数学期望与二项分布的数学期望是一致的。

因为[]∑∑∞=--∞=--⋅=-=-=-22202)!2(!)1()1(m m m me m em m m E E E λλλλλξξξξ令k=m-2,则22!)]1([λλλξξλ==-∑∞=-k ke k Eλλξλξ+=+=222E E最后得λλλλξξξ=-+=-=2222)(E E D因此,普阿松分布的期望和方差都是λ,标准差为λ,这给统计带来方便。

因为,通常情况下是知道一随机变量服从普阿松分布,但是未知参数是λ,此参数正好是数学期望,因此就统计一段时间,看单位时间内某事件出现的次数的平均值,即事件发生总数除以时间。

得到的统计值λ就是单位时间内发生次数ξ服从的普阿松分布的参数。

当用普阿松分布近似表示二项分布时,因为λ=np 且n 一定要很大,即p 一定非常小,则二项分布的方差npq=np(1-p)≈np=λ, 还是一致的。

相关主题