当前位置：文档之家› 二项分布与泊松分布

二项分布与泊松分布

µ Ê Æ Â
100 50 0 0 2 4
µ Ê Æ Â
6 8 10 Æ Ë ä û
100 50 0
n=20
0
3
6
9
12
Æ Ë ä û
n=30
二项分布总体不同样本例数时的抽样分布
二、二项分布的应用
(一 )、总体率的估计
有点值估计和区间估计。 1 查表法：当n较小，如n≤50时，特别是 p 很接近于0或1时，可由附表6百分率的置信区间表直接查出。P709 or p817 例：某地对13名输卵管结扎的育龄妇女经壶腹部吻合术后，观察其受孕情况，发现有6人受孕，据此估计该吻合术妇女的受孕的95%可信区间此例：n=13，x=6 查表得95%CI为：19%～75%。
（五）群检验
1-Qm=X/n 从而Q=√P=1-Q第四节泊松分布(Poisson distribution)
一、Poisson分布 (一)泊松分布的概念
泊松分布（旧译普哇松分布）是离散型随机变量的另一重要分布，最早由S.D.Poisson于1837年提出。定义：若离散型随机变量x的取值为非负整数，且相应的概率函数为： X x 0,1,2,......
0.000006 0.000138 0.001447 0.009002 0.036757 0.102919 0.200121 0.266828 0.233474 0.121061 0.028248
如果甲乙两药疗效无差别，按甲药的治愈率(70%)用乙药治疗10人应治愈7人，实际治愈9人，相差2人。双侧检验，计算相差±2人及2人以上的总概率，即 x≥9和x≤5的概率之和： ΣP=0.000006+0.000138+0.001447+0.009002+0.036757 +0.102919+0.121061+0.028248=0.299577 或：ΣP=1-(0.200121+0.266828+0.233474)=0.299577
第一节二项分布和总体率的估计
二项分布(binomial distribution) 就是对这种只具有两种互斥结果的离散型随机变量的规律性进行描述的一种概率分布。由于这一种分布规律是由瑞士学者贝努里(Bernoulli)首先发现的，又称贝努里分布。
二项分布有两个基本假设： 1.各事件是相互独立的，即任一事件的发生与否，不影响其它事件的发生概率； 2.各个随机事件只能产生相互排斥的两种结果。
二项分布展开计算表
发病人数 x 展开式 Cxn π x(1-π)n-x
C04 (0.1858)0(0.8142)4 C14 (0.1858)1(0.8142)3
概率 P
理论户数 T=P×288
实际户数 A
0 1 2 3 4
C24 (0.1858)2(0.8142)2
C34 (0.1858)3(0.8142)1 C44 (0.1858)4(0.8142)0
1 直接法例某医院用甲药治疗某病，其治愈率为70%，今用乙药治疗该病10人，治愈9人，问甲乙两药疗效有无差别？已知： π =0.7，1- π =0.3，假设两药疗效无差别，则治愈与非治愈的概率应符合二项分布，即：
[ (1 )] [0.7 0.3]
n
10
[0.7 0.3]10
115.52 39.54 6.02 0.35
1634.58
4162.83 109.41 120.56 7.02
12.91
36.04 2.77 20.03 20.06
χ2=91. 81，按ν=组数-2=5-2=3查χ2界值表得： χ20.01(3)=11.345，
故P<0.01，说明该疾病的家庭分布不符合二项分布，可以认为该病有家族集聚性。
0 1 2 3 C10 (0.7) 0 (0.3)10 C10 (0.7)1 (0.3) 9 C10 (0.7) 2 (0.3) 8 C10 (0.7) 3 (0.3) 7 4 5 6 7 C10 (0.7) 4 (0.3) 6 C10 (0.7) 5 (0.3) 5 C10 (0.7) 6 (0.3) 4 C10 (0.7) 7 (0.3) 3 8 9 10 C10 (0.7) 8 (0.3) 2 C10 (0.7) 9 (0.3)1 C10 (0.7)10 (0.3) 0
此例：n=50，x=10 查表得95%CI为：10%～34%。
二项分布的应用
2 正态近似法：应用条件：np及n(1−p)均≥5
p±uαsp
例：在某地随机抽取329人，做HBsAg检验，得阳性率为8.81%，求阳性率95%置信区间。已知：p=8.81%，n=329，故：
sp p (1 p ) / n 0.0881(1 0.0881) / 329 0.0156 1.56%
P( x) C (1 )
x n x
x n
n x
, ( x 1,2,3...... ) n
n! 式中： C 称二项系数。 x!(n x)!
（二）二项分布的应用条件
1. 各观察单位只能具有互相对立的一种结果，属于二项分类资料； 2. 已知发生某一结果的概率为π，其对立结果的概率则为1-π 。实际工作中要求π是从大量观察中获得的比较稳定的数值； 3. n个观察单位的观察结果互相独立，即每个观察单位的观察结果不会影响到其它观察单位的结果。
95%CI：8.81±1.96×1.56；即5.75%～11.87%。
二项分布
下表是用P±Uasp时要求的P值与N的大小参考数字。
P
0.5 0.4 0.3 0.2 0.1 0.05 n 30 50 80 200 600 1400 nP 15 20 24 40 60 70
二项分布的应用
(二 )差异的显著性检验
二项分布的标准差：
n (1 )
标准差表示x取值的离散度或变异的大小。
如n=5，π=5/6，1-π=1-5/6，则：
n (1 ) 5 5 6 1 6 0.8333
（三）二项分布的性质
二项分布的标准误
若以比值或百分数表示，则标准误为 : (1 ) p

450 400 350 300
350 300 250
µ Ê Æ Â
200 150 100 50 0 0 1 2 3 4 5 Æ Ë ä û
µ Ê Æ Â
250
200 150 100 50 0 0 1 2 3 4 5 6 7 8 Æ Ë ä û
n=5
250 200 150
n=10
250 200 150
3.研究疾病的家族聚集性
例某单位发生乙肝暴发流行，经调查4口之家共288 户，其中无病例的167户，发生1例的51户，2例的 50户，3例的17户，全家发病的3户，问乙肝的发病是否具有家族集聚性？ π=214/1152=0.1858，1-π=0.8142 计算发病数x=0，1，2，3，4时的理论概率和理论户数。列表，比较实际户数与理论户数差别有无显著性意义。
n
σp被称为率的标准误（standard error of rate），用来反映随机抽样获得的样本率p与总体π之间的抽样误差大小。
（三）二项分布的性质
二项分布的标准误
若以比值或百分数表示，则标准误为 :
p

(1 )
n
实际工作中常用p作为π 的估计值，得：
sp
p(1 p) n
(五）群检验
用于混合样本分析：常见于阳性率很低或检出率低的分析样本根据二项分布的原理：1份混合样本中含有k份阳性的概率为 P（k）=
c (1 p)
k n
n k
p
k
当k=0时P（0）是说混合样品中没有1阳性样品的原始概率，反映的是混合样品阴性的概率
p(0) c (1 p) p (1 p)
（三）二项分布的性质
2.二项分布的累计概率
常用的有左侧累计和右侧累计2种方法。从阳性率为π 的总体中随机抽取n个个体，则 (1)最多有k例阳性的概率
P(x≤k)=P(0) + P(1) +……+ P(k)
(2)最少有k例阳性的概率
P(x≥k)=P(k) + P(k+1) +……+ P(n) =1- P(x≤k-1)
抓中三个黑球的概率： P(3)=0.5×0.5×0.5=0.125
抓中两黑一白的概率：定理：几个相互独立事件同时发生 P(2)=3×0.125=0.375 的概率等于各独立事件的概率之积。定理：在几个互不相容的事件中，任一事件发生的概率等于这几个事件的概率之和。
P( x) C (1 )
k n n 0
n
(1 p) n p(0)
（五）群检验
当收集的样本数量很大时，全部检验费时费力可以用群检验的方法进行解决，若每个标本的阳性概率为π，则其阴性概率为Q=1-π Qm便是某个群m个标本均
为阴性的概率，一个群为阴性的群的概率，而1-Qm就为一个群阳性的概率。假设受检的n个群中有X个阳性群，用x/n作为阳性群概率的估计值
P=0.299577>0.05，差异无统计学意义，尚不能认为乙药疗效优于甲药。本例如采用单侧检验，即要求判断乙药疗效优于甲药？此时只需计算相差2人及以上的总概率： ΣP=P(9)+P(10)=0.121061+0.028248=0.149309 P>0.05,差异无统计学意义，尚不能认为乙药疗效优于甲药。
x n x
n x
, ( x 1,2,3...... ) n

e商务文档

二项分布与泊松分布

相关文档推荐：