当前位置:文档之家› 二项分布及其应用 (2)ppt课件

二项分布及其应用 (2)ppt课件

中减去查得的数值即为所求可信区间。
2、总体率的区间估计
三、二项分布的应用
(2)正态近似法
当样本含量足够大,且样本率p和 1-p均不太小,一般 np与 n(1-p)均大于5时,样本率的抽样分布近似正态分布,即
p
~
N
(
,
1
)
n
此时, 总体率的可信区间可按下式进行估计:
p u s p , p u s p
死 死 生 0.8 0.8 0.2 0.128
1
死 生 死 0.8 0.2 0.8 0.128
生 死 死 0.2 0.8 0.8 0.128
0
死 死 死 0.8 0.8 0.8 0.512
P(x) (5)
0.008
0.096
0.384 0.512 1.000
概率的乘法原理:几个相互独立的事件同时发生的概率等于各 事件发生概率的乘积。
B( , n )。
例 抛硬币(正/反),患者治疗后的结局(治愈/未愈),实验 动物染毒后结局(生存/死亡),……。
一、二项分布的概念及应用条件
2、应用条件:
① n次试验相互独立 ( n 个观察单位相互独立)。 ② 每次试验只有两种可能结果中的某一种(适用
于二分类资料)。
③ 每次试验发生某一种结果的概率 固定不变
n
304
(3) 确定P值 , 做出推断结论。查表得, P<0.0005, 按 = 0.05
水准拒绝H0, 接受H1, 认为老年胃溃疡患者较一般患者更易发 生胃出血。
☺小贴士:注意事项
以上各例均为单侧检验, 若需进行双侧检验, 则P值为从H0
规定的总体中抽到现有样本以及更极端(即概率小于等于现有 样本概率)情形的累计概率。
一、二项分布的概念及应用条件
1、概念:若试验 E 只有两种相互对立的结果(A及 A ),
并且 P(A) ,
, 把 E 独立地重复 n
次的试验称为 n 重贝努里试验(Bernoulli trial)。
n 重贝努里试验中事件A发生的次数 x 所服从的分布
即为二项分布(binomial distribution),记为 x ~
生 生 生 0.2×0.2×0.2=0.008
P (0)
C
0 3
(0.8)
0
(1
0.8)
30
0.008
生 生 死 0.2×0.2×0.8=0.032
2
1
生 死 生 0.2×0.8×0.2=0.032 P(1) C31 (0.8)1 (1 0.8)31 0.096
死 生 生 0.2×0.8×0.2=0.032
色体异常的概率,按二项分布的概率函数得
1
P( X 1) P( X ) (0.99)400
400! (0.99)4001 (0.01) 0.0905
0
1!(400 1)!
(3) 做出推断结论: P >0.05,按 =0.05检验水准不拒绝H0,尚 不能认为该地新生儿染色体异常率低于一般。
1、样本率与已知总体率的比较:
2
2
其中,
sp
p1 p
n
三、二项分布的应用
(二)假设检验
1、样本率与已知总体率的比较:
(1)直接计算概率法: 例1 根据以往长期的实践,证明某常用药的治 愈率为65%。现在某种新药的临床试验中,随机观 察了10名用该新药的患者,治愈8人。问该新药的 疗效是否比传统的常用药好?
(1)建立假设,确定检验水准。
H0成立时, 400名新生儿中染色体异常例数的概率分布
(1)建立检验假设,确定检验水准
H0: = 0,即该地新生儿染色体异常率不低于一般 H1: < 0,即该地新生儿染色体异常率低于一般 = 0.05
(2) 根据二项分布的分布规律,计算 P 值。
本例0=0.01,n=400,x=1,根据题意需求最多有1例染
2、总体率的区间估计 (1)查表法——样本量较小时(n50)
例3.6 某医院皮肤科医师用某种药物治疗20名 系统性红斑狼疮患者,其中8人近期有效,求该法近 期有效率的95%可信区间。
用n=20和x=8查附表7.2百分率的可信区间得该 法近期有效率的95%可信区间为19%64%。
由于附表7百分率的可信区间中值只列出了x n/2的部分,当x>n/2时,应以n -x查表,再从100
1、当 0.5 时,无论 n大小,其图形均呈对称分布;
2、当 0.5,且且nn小小时时 呈偏态分布;随n不断增大,逐
渐趋于对称分布;当 n 时,逼近正态分布。
实际工作中,只要n足够大,与1- 均不太小时(通常规定
n > 50 且 n 5 与 n1 5 时),可看作近似正
态分布,即
appro.
H0: = 0,即新药治愈率与传统药物相同 H1: > 0,即新药治愈率高于传统药物 = 0.05 (2)根据二项分布的分布规律,计算 P 值。
H0成立时,随机抽查的10人中治愈人数x 的分布
PX 8 p(8) p(9) p(10)
C180 8 (1 )2 C190 9 (1 )1 C1100 10 (1 )0
p
1
n
(理论值)
sp p(1 p) n (实际值)
(二)二项分布的累计概率
从阳性率为
的总体中随机抽取n个观察单位,则
(1)最多有k例阳性的概率为
P(X k) P(0) P(1) P(k)
(2)最少有k例阳性的概率为
P(X k) P(k) P(k 1) P(n) 1 P(X k 1)
当H0成立时, 100例患者中治愈人数的概率分布
(1)建立检验假设,确定检验水准
H0: = 0,即该种中西医结合疗法疗效与常规疗法相同 H1: > 0,即该种中西医结合疗法疗效好于常规疗法 = 0.05
(2) 计算检验统计量 。
本例, 0 =0.65,n=100, x=80 。
u
X n0
n0 10
H0成立时, 304例老年胃溃疡患者中胃出血发生人数的分布
(1)建立检验假设,确定检验水准
H0: = 0,即老年胃溃疡患者胃出血发生率与一般患者相同 H1: > 0,即老年胃溃疡患者胃出血发生率高于一般患者 = 0.05
(2) 计算检验统计量 。
u p 0 0.3158 0.20 5.05 0 (1 0 ) 0.20 (1 0.20)
(三)二项分布的图形
p n=5, =0.5
n=10, =0.5
xx
n=20, =0.5
n=30, =0.5
n=5, =0.3 n=20, =0.3
ቤተ መጻሕፍቲ ባይዱ
n=10, =0.3 n=50, =0.3
=0.2, n=5 ==00.2.2, ,nn==2200
=0.2, n=10 =0.2, n=50
(四)二项分布的特点
[(1 ) ]n Cn0 (1 )n 0 Cn1 (1 ) n1 1
Cnx (1 )nx x Cnn (1 )0 n
1
p(x) Cnx x 1 nx
p(0) p(1) p(n) 1
例. 求前例中三只小白鼠死亡2只的概率。
p(x 2) C32 21 32 30.82 0.21 0.384
若H0成立, 由400名新生儿中染色体异常的人数服从B(0.01,400),
现有样本为x=1: p(x
1)
C
1 400
0.01 0.99 399
0.07253
比现有样本更极端(即p0.07253)的情形包括x=0,x=7,x=8,…,
x=400。故
P p(x 1) p(x 7)
1 p(2) p(3) p(4) p(5) p(6) 0.2001
x ~ N n , n 1 或
p
appro.
~
N
,
1
n
二项分布的正态近似示意图
❖二项分布的累计概率:
15
20
25
30
35
40
45
50
55
60
65
k1
k2
三、二项分布的应用
(一)估计总体率的可信区间
1、率的抽样误差
p
1
n
p1 p
sp
n
2、总体率的区间估计
(理论值) (估计值)
三、二项分布的应用
二项分布及其应用
内容提纲
二项分布的概念及应用条件 二项分布的性质 二项分布的特点 二项分布的应用
一、二项分布的概念及应用条件
举例:设小白鼠接受一定剂量的某种 毒物染毒后死亡率为80%。若每组各 用3只小白鼠(甲、乙、丙)接受该 种毒物染毒,观察各组小白鼠的存亡 情况。
死亡数 x
(1) 0
该例题中各种组合的概率恰好等于该二项式展开式的各项,所以将 n次这种只具有两种互相对立结果中一种的随机实验成功次数的概 率分布称为二项分布。
该例题中各种组合的概率恰好等于该二项式展开式 的各项,所以将n次这种只具有两种互相对立结果 中一种的随机实验成功次数的概率分布称为二项分 布。
[(1 ) ]n (1 )n Cn1(1 )n1 1 Cn2 (1 )n2 2 CnX (1 )nX X Cnn1(1 ) n1 n [(1 0.8) 0.8]3 (1 0.8)3 C31(1 0.8)31(0.8)1 C32 (1 0.8)32 (0.8)2 (0.8)3
1
2
3 合计
表 1 3 只小白鼠染毒后的死亡只数的概率分布
生存数
排列方式
n-x
甲乙 丙
各种排列的概率
(2)
(3)
(4)
3
生 生 生 0.2 0.2 0.2 0.008
相关主题