离散型分布
Li Junrong
stat9@
随机变量的类型
●定量资料看作是连续型变量●定性资料看作是离散型变量
①、组合(Combination ):从个n 元素中抽取k 个元素组成一组(不考虑其顺序)的组合方式个数记为
!!()!
n n k k n k ⎛⎫=
⎪-⎝⎭2
333!6C =
322!(32)!21⎛⎫=== ⎪-⨯⎝⎭
k n n C k ⎛⎫ ⎪⎝⎭
或(n!为的阶乘,n!=1*2*……*n,0!=1)
回忆:数学概念
2
222)(b
ab a b a ++=+3
2
2
3
3
33)(b
ab b a a b a +++=+
②、牛顿二项展开式:
()()()(
)()()011
22
1
2
11
10()...n
n n n n n n n n n n n n
n n k n k
k k
a b a b a b a b a b a b a b
-----=+=+++++=∑
二项分布Binomial distribution
Bernoulli试验
毒性试验:小白鼠死亡——生存
临床试验:病人治愈——未愈
临床化验:血清阳性——阴性
事件成功(A)——失败(非A)这类“成功─失败型”试验称为Bernoulli试验。
一、二项分布定义
●任意一次试验中,只有事件A发生和不发生两种对立结果。
●A发生的概率是π,不发生的概率为(1-π)。
●若在相同的条件下,进行n次重复试验,其结果是相互独立的。
用X表示这n次试验中事件A发生的次数,那么X服从二项分布,记做X~B(n,π) 。
条件
二、二项分布的概率
例题:假设小白鼠接受一定剂量的毒物时,其死亡概率是80%。
对每只小白鼠来说,其死亡事件A发生的概率是0.8,不发生的概率是0.2。
试验用3只小白鼠,请列举可能出现的试验结果及发生的概率。
在n 次独立重复试验中,事件A (死亡)发
生的次数X (0,1,2,…,n)的概率P(X):
X ~B(n,π):随机变量X 服从以n,π为参数的二项分布。
(
)()(1)
n X
n X
X
P X π
π-=-()!
()!!
n X X
n
n C
n X X ==
-概率函数
●
在n 次独立重复试验中,事件A (死亡)至少发生k 次的概率:
●
在n 次独立重复试验中,事件A (死亡)至多发生k 次的概率:
分布函数
n
X=k
P X k)=P(k)+P(k+1)+...+P(n)=P(X)
≥∑(k
X=0
P X k)=P(0)+P(1)+...+P(k)=P(X)
≤∑(
三、二项分布的均数与标准差 X ~B(n,π):
X 的均数μX =n π
X 的方差σX 2 = n π(1-π)
X 的标准差:(1)
x n σππ=-
四、二项分布的图形
●图形特点:两个轴意义,对称、偏态、与正态分布的关系
●决定图形的两个参数:n,
五、样本率的均数和标准差
●样本率的均数μp :●样本率的标准差σp:●样本率的标准差(估计值)Sp:
11()p x n n n
μμππ===1(1)p x n n ππσσ-==(1)p p p S n
-=(标准误)
二项分布的应用:统计推断
●总体率区间估计
●样本率与总体率的比较
●两样本率的比较
(一)、总体率区间估计
●
查表法(基于二项分布原理)
●正态近似法(基于二项分布正态近似原理)条件:n 较大、p 与(1-p)均不太小,如np 及n(1-p)均大于5时。
95%CI:
π的p
p 1.96S ±
(二)样本率与总体率的比较
1、直接概率法(基于二项分布原理)
2、正态近似法(基于二项分布正态近似原理)
条件:n较大、p与(1-p)均不太小,如np
及n(1-p)均大于5时。
●例题:P118 例6-4
●分析题意,选择合适的计算统计量的方法。
假设检验过程
1.建立假设:
H0:π= 0.55
H1:π>0.55
2.确定显著性水平,α取0.05。
(单侧)
3.计算统计量:P(9)+P(10)直接得到P值。
4.比较P与α
5.做出推论
(三)两样本率的比较检验统计量u 的计算:
12
12p p p p u S --=注:可用卡方检验取代,了解即可。
不作要求:
家庭聚集性检验群检验
泊松分布Poisson distribution
问题的引出
●盒子中装有999个黑棋子和1个白棋子,在一次抽样中,抽中白棋子的概率为1/1000
●在100次抽样中,抽中0,1,2,…10个白棋子的概率分别是……
●放射性物质单位时间内的放射次数
●单位体积内粉尘的计数
●血细胞或微生物在显微镜下的计数
●单位面积内细菌计数
●人群中患病率很低的非传染性疾病的患病数
特点:罕见事件发生数的分布规律
Piosson 的概念●常用于描述单位时间、单位面积或单位空间中稀有事件发生数的随机分布规律。
●
若罕见事件A 的发生数为X(0,1,2,…),X 的发生概率P(X):则X 服从Piosson 分布,记为:X ~P ()。
Piosson 分布的总体均数为Piosson 分布的均数和方差相等。
=σ2 ()!
X e P X X λλ
-=σλ
=λ
λλ
Piosson分布的条件
●由于Piosson分布是二项分布的特例,所以,二项分布的三个条件也就是Piosson分布的适
用条件。
●另外,单位时间、面积或容积、人群中观察事件的分布应该均匀。
Piosson分布的特点
●Piosson分布的图形
●Piosson分布的可加性
●Piosson分布与正态分布及二项分布的关系。
泊松分布的图形
λ
λ
λλ
Piosson 分布的可加性
●
观察某一现象的发生数时,如果它呈Piosson 分布,那么把若干个小单位合并为一个大单位后,其总计数亦呈Piosson 分布。
●如果X 1~, X 2~,… X m ~,那么X=X 1+ X 2+… +X m ,则1()P λ2()P λ()m P λ12m λλλλ=+++ ()X P λ
Piosson 分布与
正态分布及二项分布的关系20λ≥二项分布
泊松分布正态分布
n 0,
n =ππλ→∞
→()n ,0.5n >5,n 1->5πππ↑→
Piosson分布的应用
●总体均数的区间估计
●样本均数与总体均数的比较
●两样本均数的比较
总体均数的区间估计
查表法(基于泊松分布原理)
正态近似法(基于泊松分布正态近似原理)条件:当X>20。
u a X X
样本均数与总体均数的比较
●直接概率法:例6-12 (P125)
●正态近似法:统计量u
例6-13 (P126)X
u
λ
λ
-=
两样本均数的比较
●两个样本观察单位相同时:计算统计量
●两个样本观察单位不同时:
12
12
X X u X X -=-1
212
122212
X X n n u X X n n -=+
例题:
●P127 例6-14
●P127 例6-15
负二项分布(略)
●常用于描述传染性疾病的分布●致病生物的分布
●毒理学中应用。