二项分布
p1 − p 2 u= = s p1 − p2 p1 − p 2 1 1 pc (1 − pc ) + n1 n2
二项分布的应用:率的假设检验
肺吸虫感染率:男生23(80),女生13(85),二 者是否有差别?
H0:π1 = π2; H1: π1 ≠ π2;
α=0.05 n1=80,n1p1=23,n2=85,n2p2=13,pc=(23+13)/(80+85)=0.2182
② 最多1人有效的概率为:
P(X≤1)
1 = P (0) + P (1) = 0.15 5 + C 5 × (0.15) 5−1 × 0.85 = 0.002227501
2.3 二项分布性质
在n足够大时,样本率近似服从正态分布; 样本率p的均数等于π; 样本率p的标准差(率的标准误)
sp =
π (1 − π )
( 0.2 +0.8 )3 = (0.2)3+3×(0.2)2×(0.8)+3×(0.2)×(0.8)2+(0.8)3 三生 二生一死 一生二死 三死
1 [(1−π) +π]n = (1−π)n +Cn (1−π)n−1π1 +Cn2 (1−π)n−2π 2 +⋯+ X n Cn (1−π)n−X π X +⋯+Cn−1(1−π)1π n−1 +π n
二项分布及其应用
Binomial Distribution and It’s Applications
Department of Epidemiology and Biostatistics School of Public Health, Nanjing Medical University
主要内容
u= 23 13 − 80 85 1 1 Байду номын сангаас.2182 × (1 − 0.2182) × + 80 85 = 0.06434
查u界值表,p>0.05,不拒绝H0,尚不能认为男女肺吸虫 感染率不同
5. 二项分布的应用条件
每一次试验必然出现两种互相对立的 结果之一; 每种结果都有相同的可能性出现,即 某事件出现的概率不变; n次试验的条件完全相同,n个观察对 象同质且必须互相独立。
2.1 二项分布的性质:均数和标准差
若X~B(n,π),则
µ X = nπ
2 X
σ = nπ (1 − π ) σ X = nπ (1 − π )
若均数与标准差不用绝对数而用率表示时
µp =π
σp = π (1 − π )
n
sp =
p(1 − p) n
2.2 二项分布的性质 :累积概率
累计概率(cumulative probability) 从阳性率为π的总体中随机抽取n个个体,则 最多有k例阳性的概率:
P ( X ≤ k ) = ∑ P ( X ) = P ( 0) + P (1) + ... + P ( k )
0 k
最少有k例阳性的概率:
P( X ≥ k ) = ∑ P( X ) = 1 − P( X ≤ k − 1)
k
n
X=0,1,2,…,k,…,n。
递推公式
n − X π P ( X + 1) = ⋅ P(X ) X +1 1−π
设小白鼠接受某种毒物一定剂量时,其死亡率为 π=80%,则对于每只小白鼠而言,其死亡概率为 π=0.8,生存概率为1-π=0.2。若每组各用三只小 白鼠(分别计为甲、乙、丙),对每只鼠独立做实 验,故各鼠的实验结果(生存或死亡)是互不影响 的。观察每组小白鼠存亡情况,如果计算生与死 的顺序,则共有8种排列方式;如果只计生存与死 亡的数目,则只有4种组合方式。
0.2
0.1
0.0 4 8 12 16 0 2 4 0 2 4 6 X 4 8 12 16
二项分布的图形
当π=0.5时,分布对称;当π ≠0.5,分布呈 偏态;当π<0.5时分布呈正偏态;当π>0.5 时分布呈负偏态;特别是当n值不是很大时, π偏离0.5愈远,分布愈偏。 随着n的增大,二项分布逐渐逼近正态分布。 如π =0.30,n=5和n=10时,图形呈偏态, 当n=30时,图形已接近正态分布。一般地 说,如果nπ或n(1-π)大于5时,常可用正态 近似原理处理二项分布问题。
例 据以往经验,用某药治疗小儿上呼吸道 感染、支气管炎,有效率为85%,今有5个 患者用该药治疗,问:① 至少3人有效的概 率为多少?② 最多1人有效的概率为多少? 本例π =0.85,l-π =0.15,n =5, ① 至少3人有效的概率 P(X≥3)=P(3)+P(4)+P(5) =0.138178125+0.391504688+0.443705313 =0.973388126
4.2 二项分布的应用:率的假设检验 样本率与总体率的比较
直接计算概率法
样本含量较小时,或样本率较小时,如 np和n(1-p)均小于5
正态近似法
u=
p −π0
π 0 (1 − π 0 )
n
二项分布的应用:率的假设检验
新生儿染色体异常率0.01,随机抽取某地400名新 生儿中有1名异常,问该地异常率是否低于一般? H0: π=0.01; H1: π<0.01 α=0.05,单侧
三只小白鼠存亡的排列和组合方式及其概率的计算
所有可能结果 甲、乙、丙 生生生 生生死 生死生 死生生 生死死 死生死 死死生 死死死 0.2×0.2×0.2=0.008 0.2×0.2×0.8=0.032 0.2×0.8×0.2=0.032 0.8×0.2×0.2=0.032 0.2×0.8×0.8=0.128 0.8×0.2×0.8=0.128 0.8×0.8×0.2=0.128 0.8×0.8×0.8=0.512 1.000 3 0 0.512 1.000 2 1 0.384 1 2 0.096 每种结果的概率 死亡数 生存数 X 0 n−X 3 0.008 不同死亡数的概率
X Cn
n! = X ! (n − X )!
1. 二项分布的概率
从阳性率为π的总体中随机抽取含量为n的样 本,恰有X例阳性的概率为:
P( X )
X = Cn
(1 − π )
n− X
π
X
X=0,1,2,…,n 则称X服从参数为n和π的二项分布(Binomial Distribution),记为:X~B(n,π)。其中参数 n 由实验者确定,而π常常是未知的。
4.1 二项分布的应用:区间估计
精确概率法,查表法,适用于n≤50时; 正态近似法,适用于n较大,p和1-p均不太 小,如np和n(1-p)均大于5时。 此时总体率的1-α可信区间如下
( p −u
α /2 p
s , p + uα / 2 s p )
二项分布的应用:区间估计
总体率的可信区间是不对称的,除非π= 0.5; 随着样本含量n的增加,不对称性逐渐改善; 随着样本含量n的增加,可信区间的宽度逐 渐变小; 对于相同的样本含量, π越接近0.5,区间 越宽, π越接近0或1,区间越窄。
n
3. 二项分布的图形
正态分布或其它连续性分布中,常用分布 曲线下的面积表示某区间的概率; 在二项分布中,则用线段的长短表示取某 变量值时的概率; 以X为横坐标,以P(X)为纵坐标作图,即可 绘出二项分布的图形; 由图可见,给定n后,二项分布的形状取决 参数π的大小。
3. 二项分布的图形
0.4 P(X) 0.3 n =20 π =0.5 n =5 π =0.3 n =10 π =0.3 n =30 π =0.3
二项展开式
1 2 ( p + q)n = pn + Cn pn−1q1 + Cn pn−2q2 +⋯+ n CnX pn− X q X +⋯+ Cn −1 p1qn−1 + qn
C nX
n! = X ! ( n − X )!
在医学上一些事物,其结局只有两种互相对 立的结果。如: 在毒理试验中,动物的生存与死亡; 在动物诱癌试验中,动物的发癌与不发癌; 在流行病学观察中,接触某危险因素的个体 发病与不发病; 在临床治疗中,病人的治愈与未愈; 理化检验结果的阴性与阳性等等,均表现为 两种互相对立的结果,每个个体的观察结果 只能取其中之一。对这类事物常用二项分布 (binomial distribution)进行描述。
随机事件
随机试验的结果叫做随机事件
互不相容事件
在一次随机试验中,两个事件不可能同时 发生称互不相容事件。 P(A+B)=P(A)+P(B) 加法法则 A、B为互不相容事件 “A+B” 表示A发生/B发生 P(A+B)表示A发生/B发生的概率
独立事件
一个事件发生的概率不受另外一个事件发 生与否的影响。 P(A·B)=P(A)· P(B) 乘法法则 P(A·B)A发生并且B发生
预备知识 二项分布的概率 二项分布的性质 二项分布的图形 二项分布的应用 率的区间估计 两个样本率的比较 样本率与总体率的比较 二项分布的应用条件
预备知识
随机试验 随机事件 独立事件 乘法法则 互不相容事件 加法法则 二项展开式
随机试验
任何一个试验,满足: 可在相同条件下重复进行; 每次试验得到多个结果; 每次试验前不能肯定这次试验将得到什么 结果
P ( X ≤ 1) = P ( X = 0 ) + P ( X = 1) = 0.99
400
= 0.0905
400! + × 0.99399 × 0.01 1!× 399!
P>α,不拒绝H0,尚不能认为该地异常率低于一般。