二项分布与泊松分布
µ Ê Æ Â
100 50 0 0 2 4
µ Ê Æ Â
6 8 10 Æ Ë ä û
100 50 0
n=20
0
3
6
9
12
Æ Ë ä û
n=30
二项分布总体不同样本例数时的抽样分布
二、二项分布的应用
(一 )、总体率的估计
有点值估计和区间估计。 1 查表法 : 当n较小,如n≤50时,特别是 p 很接近于0或1时,可由附表6百分率的置 信区间表直接查出。P709 or p817 例:某地对13名输卵管结扎的育龄妇女经 壶腹部吻合术后,观察其受孕情况,发现 有6人受孕,据此估计该吻合术妇女的受 孕的95%可信区间 此例:n=13,x=6 查表得95%CI为:19%~75%。
(五) 群检验
1-Qm=X/n 从而Q=√P=1-Q第四节 泊松分布(Poisson distribution)
一、Poisson分布 (一)泊松分布的概念
泊松分布(旧译普哇松分布 )是离散型随机变量的另 一重要分布,最早由S.D.Poisson于1837年提出。 定义:若离散型随机变量x的取值为非负整数,且相 应的概率函数为: X x 0,1,2,......
0.000006 0.000138 0.001447 0.009002 0.036757 0.102919 0.200121 0.266828 0.233474 0.121061 0.028248
如果甲乙两药疗效无差别,按甲药的治愈率(70%)用 乙药治疗10人应治愈7人,实际治愈9人,相差2人。 双侧检验,计算相差±2人及2人以上的总概率,即 x≥9和x≤5的概率之和: ΣP=0.000006+0.000138+0.001447+0.009002+0.036757 +0.102919+0.121061+0.028248=0.299577 或:ΣP=1-(0.200121+0.266828+0.233474)=0.299577
第一节 二项分布和总体率的估计
二项分布(binomial distribution) 就是对这种只具有两种互斥结果的离散型 随机变量的规律性进行描述的一种概率分 布。由于这一种分布规律是由瑞士学者贝 努里(Bernoulli)首先发现的,又称贝努里 分布。
二项分布有两个基本假设: 1.各事件是相互独立的,即任一事件 的发生与否,不影响其它事件的发生 概率; 2.各个随机事件只能产生相互排斥的 两种结果。
二项分布展开计算表
发病人数 x 展开式 Cxn π x(1-π)n-x
C04 (0.1858)0(0.8142)4 C14 (0.1858)1(0.8142)3
概率 P
理论户数 T=P×288
实际户数 A
0 1 2 3 4
C24 (0.1858)2(0.8142)2
C34 (0.1858)3(0.8142)1 C44 (0.1858)4(0.8142)0
1 直接法 例 某医院用甲药治疗某病,其治愈率为70%, 今用乙药治疗该病10人,治愈9人,问甲乙两药 疗效有无差别? 已知: π =0.7,1- π =0.3,假设两药疗效无差别, 则治愈与非治愈的概率应符合二项分布,即:
[ (1 )] [0.7 0.3]
n
10
[0.7 0.3]10
115.52 39.54 6.02 0.35
1634.58
4162.83 109.41 120.56 7.02
12.91
36.04 2.77 20.03 20.06
χ2=91. 81,按ν=组数-2=5-2=3查χ2界值表得: χ20.01(3)=11.345,
故P<0.01,说明该疾病的家庭分布不符合二项分布,可以认 为该病有家族集聚性。
0 1 2 3 C10 (0.7) 0 (0.3)10 C10 (0.7)1 (0.3) 9 C10 (0.7) 2 (0.3) 8 C10 (0.7) 3 (0.3) 7 4 5 6 7 C10 (0.7) 4 (0.3) 6 C10 (0.7) 5 (0.3) 5 C10 (0.7) 6 (0.3) 4 C10 (0.7) 7 (0.3) 3 8 9 10 C10 (0.7) 8 (0.3) 2 C10 (0.7) 9 (0.3)1 C10 (0.7)10 (0.3) 0
此例:n=50,x=10 查表得95%CI为:10%~34%。
二项分布的应用
2 正态近似法:应用条件:np及n(1−p)均≥5
p±uαsp
例:在某地随机抽取329人,做HBsAg检验,得阳性 率为8.81%,求阳性率95%置信区间。 已知:p=8.81%,n=329,故:
sp p (1 p ) / n 0.0881(1 0.0881) / 329 0.0156 1.56%
P( x) C (1 )
x n x
x n
n x
, ( x 1,2,3...... ) n
n! 式中: C 称二项系数。 x!(n x)!
(二)二项分布的应用条件
1. 各观察单位只能具有互相对立的一种结 果,属于二项分类资料; 2. 已知发生某一结果的概率为π,其对立结 果的概率则为1-π 。实际工作中要求π是从 大量观察中获得的比较稳定的数值; 3. n个观察单位的观察结果互相独立,即每 个观察单位的观察结果不会影响到其它观 察单位的结果。
95%CI:8.81±1.96×1.56;即5.75%~11.87%。
二项分布
下表是用P±Uasp时要求的P值 与N的大小参考数字。
P
0.5 0.4 0.3 0.2 0.1 0.05 n 30 50 80 200 600 1400 nP 15 20 24 40 60 70
二项分布的应用
(二 )差异的显著性检验
二项分布的标准差:
n (1 )
标准差表示x取值的离散度或变异的大小。
如n=5,π=5/6,1-π=1-5/6,则:
n (1 ) 5 5 6 1 6 0.8333
(三)二项分布的性质
二项分布的标准误
若以比值或百分数表示,则标准误为 : (1 ) p
450 400 350 300
350 300 250
µ Ê Æ Â
200 150 100 50 0 0 1 2 3 4 5 Æ Ë ä û
µ Ê Æ Â
250
200 150 100 50 0 0 1 2 3 4 5 6 7 8 Æ Ë ä û
n=5
250 200 150
n=10
250 200 150
3.研究疾病的家族聚集性
例 某单位发生乙肝暴发流行,经调查4口之家共288 户,其中无病例的167户,发生1例的51户,2例的 50户,3例的17户,全家发病的3户,问乙肝的发 病是否具有家族集聚性? π=214/1152=0.1858,1-π=0.8142 计算发病数x=0,1,2,3,4时的理论概率 和理论户数。列表,比较实际户数与理论户数差 别有无显著性意义。
n
σp被称为率的标准误(standard error of rate), 用来反映随机抽样获得的样本率p与总体π之间 的抽样误差大小。
(三)二项分布的性质
二项分布的标准误
若以比值或百分数表示,则标准误为 :
p
(1 )
n
实际工作中常用p作为π 的估计值,得:
sp
p(1 p) n
(五)群检验
用于混合样本分析:常见于阳性率很低或 检出率低的分析样本 根据二项分布的原理:1份混合样本中含 有k份阳性的概率为 P(k)=
c (1 p)
k n
n k
p
k
当k=0时P(0)是说混合样品中没有1阳 性样品的原始概率,反映的是混合样品 阴性的概率
p(0) c (1 p) p (1 p)
(三)二项分布的性质
2.二项分布的累计概率
常用的有左侧累计和右侧累计2种方法。 从阳性率为π 的总体中随机抽取n个个体,则 (1)最多有k例阳性的概率
P(x≤k)=P(0) + P(1) +……+ P(k)
(2)最少有k例阳性的概率
P(x≥k)=P(k) + P(k+1) +……+ P(n) =1- P(x≤k-1)
抓中三个黑球的概率: P(3)=0.5×0.5×0.5=0.125
抓中两黑一白的概率: 定理:几个相互独立事件同时发生 P(2)=3×0.125=0.375 的概率等于各独立事件的概率之积。 定理:在几个互不相容的事件中, 任一事件发生的概率等于这几个事 件的概率之和。
P( x) C (1 )
k n n 0
n
(1 p) n p(0)
(五) 群检验
当收集的样本数量很大时,全部检验费 时费力可以用群检验的方法进行解决, 若每个标本的阳性概率为π,则其阴性 概率为Q=1-π Qm便是某个群m个标本均
为阴性的概率,一个群为阴性的群的概率, 而1-Qm就为一个群阳性的概率。假设受检 的n个群中有X个阳性群,用x/n作为阳性 群概率的估计值
P=0.299577>0.05,差异无统计学意义,尚 不能认为乙药疗效优于甲药。 本例如采用单侧检验,即要求判断乙药疗效 优于甲药?此时只需计算相差2人及以上的 总概率: ΣP=P(9)+P(10)=0.121061+0.028248=0.149309 P>0.05,差异无统计学意义,尚不能认为乙药 疗效优于甲药。
x n x
n x
, ( x 1,2,3...... ) n