当前位置:
文档之家› 第3章 几种常见的概率分布律
第3章 几种常见的概率分布律
k 0
m
3. P(x m) Pn (k m)
C
k n
p k q nk
(3-2)
kn0
4. P(x m) Pn (k m)
Cnk p k q nk
(3-3)
k m
m2
5. P(m1 x m2 ) pn (m1 k m2 )
C
x 中细菌数服从波松分布。以=0.500代替 (3-10)
式中的λ,得 P(x k ) 0.5k e 0.5 (k=0, 1, 2, …) k!
计算结果如表3-3所示。
表3-3 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布 是相当吻合的 , 进一步说明用波松分布描述单 位容积(或面积)中细菌数的分布是适宜的。
k n
p k q nk
k m1
(m1<m2) (3-4)
二项分布由n和p两个参数决定: 1. 当p值较小且n不大时,分布是偏倚的。但随
着n的增大 ,分布逐渐趋于对称; 2. 当 p 值 趋于 0.5 时 ,分布趋于对称; 3. 对于固定的n及p,当k增加时,Pn(k)先随之
增加并达到其极大值,以后又下降。
如【例3.6】中已判断畸形仔猪数服从波松 分布,并已算出样本平均数=0.51。将0.51代替 公式(3-10)中的λ得:
P( x k ) 0.51k e 0.51 (k=0, 1, 2, …)
k!
因为e-0.51=1.6653,所以畸形仔猪数各项的概 率为:
P(x=0)=0.510/(0!×1.6653)=0.6005 P(x=1)=0.511/(1!×1.6653)=0.3063 P(x=2)=0.512/(2!×1.6653)=0.0781
四、二项分布的平均数与标准差
统计学证明,服从二项分布B(n,p)的随机变
量之平均数μ、标准差σ与参数n、p有如下关系:
当试验结果以事件A发生次数k表示时
μ=np
(3-5)
σ= npq
(3-6)
【例3.4】求【例3.3】平均死亡猪数及死 亡数的标准差。
以p=0.2,n=5代入 (3-5)和(3-6) 式得: 平均死亡猪数 μ=5×0.20=1.0(头) 标准差 σ= np=q 5 0.2 0.8
P(x=3)=0.513/(3!×1.6653)=0.0133
P(x=4)=0.514/(4!×1.6653)=0.0017
4
P(x 4) 1 p(x k) 1 0.9999 0.0001
k 0
把上面各项概率乘以总观察窝数(n=200)即 得各项按波松分布的理论窝数。 波松分布与相 应的频率分布列于表3-2中。
=0.894(头)
3.2 波松分布
波松分布是一种可以用来描述和分析随机地发生 在单位空间或时间里的稀有事件的概率分布。要观察 到这类事件,样本含量 n 必须很大 。
在生物、医学研究中,服从波松分布的随机变量 是常见的。如,一定畜群中某种患病率很低的非传染 性疾病患病数或死亡数,畜群中遗传的畸形怪胎数, 每升饮水中大肠杆菌数,计数器小方格中血球数,单 位空间中某些野生动物或昆虫数等,都是服从波松分 布的。
此外 ,在n较大,np、nq 较接近时 ,二项分布
接近于正态分布;当n→∞时,二项分布的极限分 布是正态分布。
三、二项分布的概率计算及应用条件
【例3.1】 纯种白猪与纯种黑猪杂交,根据孟德尔遗 传理论 , 子二代中白猪与黑猪的比率为3∶1。求窝产 仔10头,有7头白猪的概率。
根据题意,n=10,p=3/4=0.75,q=1/4=0.25。设 10头仔猪中白色的为x头,则x为服从二项分布B(10, 0.75)的随机变量。于是窝产10头仔猪中有7头是白色的 概率为:
其中p>0,q>0,p+q=1,则称随机变量x服
从参数为n和p的二项分布 (binomial distribution),
记为 x~B(n, p)。
二项分布具有概率分布的一切性质,即:
1. P(x=k)= Pn(k) (k=0,1,…,n)
2. 二项分布的概率之和等于1,即
n
Cnk p k q nk (q p)n 1
P(x
7)
C170 0.75 7 0.253
10! 0.757 7!3!
0.2Байду номын сангаас3
0.2503
【例3.2】 设在家畜中感染某种疾病的概率为20%,现有两 种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能, 问:应该如何评价这两种疫苗?
一、正态分布的定义及其特征
(一) 正态分布的定义 若连续型随机变量x的概率分布密度
函数为
(x)2
f (x)
1
e 2 2
2
(3-6)
其中μ为平均数,σ2为方差,则称随机变量x服从正态分布 (normal distribution), 记为x~N(μ,σ2)。相应的概率分布函数 为
F (x) 1
第三章 几种常见的概率分布律
3.1 二项分布 3.2 泊松分布 3.3 另外几种离散型概率分布 3.4 正态分布 3.5另外几种连续型概率分布 3.6 中心极限定理
3.1 二项分布
一、贝努利试验及其概率公式 将某随机试验重复进行n次,若各次试验结果互 不影响,即每次试验结果出现的概率都不依赖于其它 各次试验的结果,则称这n次试验是独立的。
样本均数和方差S2计算结果如下:
x fk
n
=(120×0+62×1+15×2+2×3+1×4)/200=0.51
fk2 ( fk)2
S2
n
n 1
(120 02 6212 15 22 232 1 42 102 2) / 200
200 1
0.52
【例3.3】 仔猪黄痢病在常规治疗下死亡率为20 %,求5 头病猪治疗后死亡头数各可能值相应的概 率。
设5头病猪中死亡头数为x,则x服从二项分布 B(5, 0.2),其所有可能取值为0,1,…,5,按(3-1) 式计算概率,用分布列表示如下:
0 1 23 4 5
0.3277 0.4096 0.2048 0.0512 0.0064 0.0003
对于n次独立的试验,如果每次试验结果出现且
只出现对立事件A与 A 之一,在每次试验中出现A的 概率是常数p(0<p<1) ,因而出现对立事件 A 的概率是
1-p=q,则称这一串重复的独立试验为n重贝努利试验, 简称贝努利试验(Bernoulli trials)。
在生物学研究中,我们经常碰到的一类离散 型随机变量,如孵n枚种蛋的出雏数、n头病畜 治疗后的治愈数、n 尾鱼苗的成活数等,可用 贝努利试验来概括。
x =0.51,S2=0.52,这两个数是相当接近的,
因此可以认为畸形仔猪数服从波松分布。
λ是波松分布所依赖的唯一参数。λ值愈小分布 愈偏倚,随着λ的增大 ,分 布趋于对称(如下图所 示)。当λ= 20时分布接近于正态分布;当λ=50时, 可以认 为波松分布呈正态分布。 所以在实际工作中, 当λ≥20时就可以用正态分布来近似地处理波松分布 的问题。
2
( x )2
e x
2 2
dx
(3-7)
分布密度曲线如图所示。
(二) 正态分布的特征
平均数:
nK
N
方差:
2 nK(N K )( N n)
N 2 (N 1)
2. 负二项分布
负二项分布所要求的条件与二项分布是一样 的。不同的是负二项分布需要求出在第x次试 验时,发生第k次事件A的概率。或者说,在 x次试验中,共发生k次事件A,而且事件A的 第k次试验恰恰是在第x次试验发生的。
注意,二项分布的应用条件也是波松分布 的应用条件。
对于波松分布,当λ→∞时 ,波松分布以正 态分布为极限。在实际计算中, 当 λ≥20 (也 有人认为λ≥6)时,用波松分布中的λ代替正态分 布中的μ及σ2 ,即可由后者对前者进行近似计算。
3.3另外几种离散型概率分布
1、超几何分布 2、负二项分布
假设疫苗A完全无效,那么注射后的家畜感染的概率仍为20 %,则15 头家畜中染病头数x=0的概率为
p(x 0) C105 0.2000.8015 0.0352
同理,如果疫苗B完全无效,则15头家畜中最多有1头感染的 概率为:
p(x 1) C105 0.200.815 C115 0.210.814 0.1671
1ml水中的细菌数 0 1 2 >=3 合计
次数f
243 120 31 6 400
试分析饮用水中细菌数的分布是否服从波松 分布。若服从,按波松分布计算每毫升水中细菌 数的概率及理论次数并将頻率分布与波松分布作 直观比较。
x 经计算得每毫升水中平均细菌数 =0.500,
方差S2=0.496。两者很接近,故可认为每毫升水
波松分布重要的特征:
平均数和方差相等,都等于常数λ,即
μ=σ2=λ 【例3.5】 调查某种猪场闭锁育种群仔猪畸 形数,共记录200窝, 畸形仔猪数的分布情况 如表3-1所示。试判断畸形仔猪数是否服从波 松分布。
表3-1 畸形仔猪数统计分布
每窝畸形数k 0 1 2 3 >=4 合计
窝数f
120 62 15 2 1 200
p(
x)
C k 1 x 1
k
(1
)
xk
,
x k, k 1,...
3.4 正态分布
正态分布是一种很重要的连续型随机变量 的概率分布。生物现象中有许多变量是服从或 近似服从正态分布的。许多统计分析方法都是 以正态分布为基础的。此外,还有不少随机变 量的概率分布在一定条件下以正态分布为其极 限分布。因此在统计学中,正态分布无论在理 论研究上还是实际应用中 , 均占有重要的地 位。