二项分布及其应用ppt课件
(3) 确定P值,做出推断结论。
查表得, 0.0005<P<0.001, 按 = 0.05 水准拒绝H0,接受H1,
认为中西医结合疗法的疗效好于常规疗法。
.
例4 经长期临床观察, 发现胃溃疡患者发生胃出血症状 的占20%。现某医院观察了304例65岁以上的老年胃 溃疡患者,有96例发生胃出血症状,占31.58%。问老 年胃溃疡患者是否较一般患者更易发生胃出血?
(2) 根据二项分布的分布规律,计算 P 值。
本例0=0.01,n=400,x=1,根据题意需求最多有1例染
色体异常的概率,按二项分布的概率函数得
1
P( X 1) P( X ) (0.99)400
400! (0.99)4001 (0.01) 0.0905
0
1!(400 1)!
(3) 做出推断结论: P >0.05,按 =0.05检验水准不拒绝H0,尚 不能认为该地新生儿染色体异常率低于一般。
xx
n=20, =0.5
n=30, =0.5
.
n=5, =0.3
n=10, =0.3
n=20, =0.3
n=50, =0.3
.
=0.2, n=5
=0.2, n=10
==00.2.2, ,nn==2200
=0.2, n=50
.
(四)二项分布的特点
1、当 0.5时,无论 n大小,其图形均呈对称分布;
当H0成立时, 100例患者中治愈人数的概率分布
.
(1)建立检验假设,确定检验水准
H0: = 0,即该种中西医结合疗法疗效与常规疗法相同 H1: > 0,即该种中西医结合疗法疗效好于常规疗法 = 0.05
(2) 计算检验统计量 。
本例, 0 =0.65,n=100, x=80 。
un X 0 1 n 001 8 0 0 1 0.0 6 0 0 5 .0 0 6 .35 53.14
二项分布及其应用
.
内容提纲
二项分布的概念及应用条件 二项分布的性质 二项分布的特点 二项分布的应用
.
一、二项分布的概念及应用条件
举例:设小白鼠接受一定剂量的某种 毒物染毒后死亡率为80%。若每组各 用3只小白鼠(甲、乙、丙)接受该 种毒物染毒,观察各组小白鼠的存亡 情况。
.
死亡数 x
.
❖二项分布的累计概率:
15
20
25
30
35
40
45
50
55
60
65
k1
k2
.
三、二项分布的应用
(一)估计总体率的可信区间
1、率的抽样误差
p
1
n
p1 p
sp
n
2、总体率的区间估计
.
(理论值) (估计值)
三、二项分布的应用
2、总体率的区间估计 (1)查表法——样本量较小时(n50) 例3.6 某医院皮肤科医师用某种药物治疗20名
(1) 0
1
2
3 合计
表 1 3 只小白鼠染毒后的死亡只数的概率分布
生存数
排列方式
n-x
甲乙 丙
各种排列的概率
(2)
(3)
(4)
3
生 生 生 0.2 0.2 0.2 0.008
死 生 生 0.8 0.2 0.2 0.032
2
生 死 生 0.2 0.8 0.2 0.032
生 生 死 0.2 0.2 0.8 0.032
.
2、总体率的区间估计
三、二项分布的应用
(2)正态近似法 当样本含量足够大,且样本率p和 1-p均不太小,一般 np与 n(1-p)均大于5时,样本率的抽样分布近似正态分布,即
p~N(,1)
n
此时, 总体率的可信区间可按下式进行估计:
p u s p , p u s p
2
2
其中,
sp
p1 p
n
304
(3) 确定P值 , 做出推断结论。查表得, P<0.0005, 按 = 0.05
水准拒绝H0, 接受H1, 认为老年胃溃疡患者较一般患者更易发 生胃出血。
.
☺小贴士:注意事项
以上各例均为单侧检验, 若需进行双侧检验, 则P值为从H0
规定的总体中抽到现有样本以及更极端(即概率小于等于现有 样本概率)情形的累计概率。
该例题中各种组合的概率恰好等于该二项式展开式的各项,所以将
n次这种只具有两种互相对立结果中一种的随机实验成功次数的概
率分布称为二项分布。
.
该例题中各种组合的概率恰好等于该二项式展开式 的各项,所以将n次这种只具有两种互相对立结果 中一种的随机实验成功次数的概率分布称为二项分 布。
[1 ( )]n (1 )n C n 1 (1 )n 11 C n 2(1 )n 22 C n X (1 )n XX C n n 1 (1 )n 1n
.
例2 据以往经验,新生儿染色体异常率一般为1%, 某医生观察了当地400名新生儿,发现有1例染色体 异常,问该地新生儿染色体异常率是否低于一般?
H0成立时, 400名新生儿中染色体异常例数的概率分布
.
(1)建立检验假设,确定检验水准
H0: = 0,即该地新生儿染色体异常率不低于一般 H1: < 0,即该地新生儿染色体异常率低于一般 = 0.05
次的试验称为 n 重贝努里试验(Bernoulli trial)。 n 重贝努里试验中事件A发生的次数 x 所服从的分布 即为二项分布(binomial distribution),记为 x ~
B( , n )。
例 抛硬币(正/反),患者治疗后的结局(治愈/未愈),实验 动物染毒后结局(生存/死亡),……。
.
例. 求前例中三只小白鼠死亡2只的概率。
p ( x 2 ) C 3 22 1 3 2 3 0 .8 2 0 .2 1 0 .384
.
一、二项分布的概两种相互对立的结果(A及 A ),
并且 P(A) ,PA1, 把 E 独立地重复 n
.
一、二项分布的概念及应用条件
2、应用条件:
① n次试验相互独立 ( n 个观察单位相互独立)。 ② 每次试验只有两种可能结果中的某一种(适用
于二分类资料)。
③ 每次试验发生某一种结果的概率 固定不变
(要求各观察单位同质)。
.
二、二项分布的性质
(一)均数和标准差
设从概率为的总体中随机抽取样本量为n的样本,每个
.
1、样本率与已知总体率的比较:
(2) 正态近似法: 当 n0 和 n(1-0) 均大于5时,
近似
X ~ Nn 0 , n 0 1 0
p
近似
~
N
0
,
0
1
n
0
可用正态近似法, 按下式计算检验统计量u值。
u X n 0
n 0 1 0
或
u p0 0(10)/n
.
例3 据报道,某常规疗法对某种疾病的治愈率为65%。现某 医生用中西医结合疗法治疗了100例该病患者,治愈了80人。 问该中西医结合疗法的疗效是否比常规疗法好?
.
若H0成立, 由400名新生儿中染色体异常的人数服从B(0.01,400),
现有样本为x=1: p( x
1)
C
1 400
0.01 0.99 399
0.07253
比现有样本更极端(即p0.07253)的情形包括x=0,x=7,x=8,…,
x=400。故 P p (x 1 )p (x7 )
1 p (2 )p (3 )p (4 )p (5 )p (6 )0 .2001
系统性红斑狼疮患者,其中8人近期有效,求该法 近期有效率的95%可信区间。
用n=20和x=8查附表7.2百分率的可信区间得该 法近期有效率的95%可信区间为19%64%。
由于附表7百分率的可信区间中值只列出了x n/2的部分,当x>n/2时,应以n -x查表,再从100
中减去查得的数值即为所求可信区间。
2、当 0.5,且且nn小小时时 呈偏态分布;随n不断增大,逐
渐趋于对称分布;当 n时,逼近正态分布。
实际工作中,只要n足够大,与1- 均不太小时(通常规
n定> 50 n5 n15
且
与
时),可看作近似正
ap 态分.p布r,o即
x~Nn,n1 或
pa~pp.rNo,1
n
.
二项分布的正态近似示意图
例2* 据以往经验,新生儿染色体异常率一般为1%。为了解某地 新生儿染色体异常率,某医生观察了当地400名新生儿,发现有1 例染色体异常,问该地新生儿染色体异常率是否与一般人群相同?
(1)建立检验假设,确定检验水准
H0: =0,即该地新生儿染色体异常率与一般人群相同 H1: 0,即该地新生儿染色体异常率与一般人群不同 = 0.05
概率的加法原理:几个互不相容的事件至少发生其一的概率等 于各事件发生概率的和。
.
3只小白鼠存亡的排列和组合方式及其概率的计算 0.8,n3
小白鼠存亡组合方 式
生存数 死亡数 (n-X) (X)
(1)
3
0
排列方式 每种排列的概率
每种组合的概率
甲乙丙
P(X ) CnX X (1 )nX
(2)
(3)
1
2
生 死
死 生
死 死
0.2×0.8×0.8=0.128 0.8×0.2×0.8=0.128
P(2) C32 (0.8)2 (1 0.8)32 0.384
死 死 生 0.8×0.8×0.2=0.128
0
3
死 死 死 0.8×0.8×0.8=0.512 P(3) C33 (0.8)3 (1 0.8)33 0.512