负二项分布(研究生)
K为聚集指数:其大小用来衡量分布的离散程度 即聚信趋向的程度。按公式(6-30)
2 2
k
2
1
k
福建医科大学流行病与统计教研室(胡志坚)
7
矩法
K的估计:
2 2
k
kˆ
2
kˆ
2
X
2 X
S2 X
计算
5张
福建医科大学流行病与统计教研室(胡志坚)
8
例---矩法
在研究某种毒物的致死作用时,对60 只小白鼠进行了显性致死试验,得到资 料见表.若服从负二项分布,试估计参 数μ和K.
lg
N f0
lg
60 30
0.301
K2取1.1
k2
lg1
X k2
1.1lg1
1.033 1.1
0.316
lg
N f0
lg
60 30
0.301
计算K
kˆ 1.1 0.90 1.1 0.301 0.316 0.924
0.299 0.316
福建医科大学流行病与统计教研室(胡志坚)
14
最大似然法
2.34
Yi=ln(Xi+0.5Kc)
对转换值进行t检验: t=0.827 ν=20-2=18
P>0.05 不拒绝H0,尚不能认为两组胚胎死亡
数有差别
上一张
福建医科大学流行病与统计教研室(胡志坚)
23
End of slides for Lectures
Autumn, 2004
福建医科大学流行病与统计教研室(胡志坚)
X
负二项分布均数和方差
k 1
2 k 1
2
福建医科大学流行病与统计教研室(胡志坚)
5
若令P=μ/k,q=1+P 则
P0 qk
X=0
PX k X 1p PX 1 X≥1
也可变为
Xq
kp
2 2
k
7张
福建医科大学流行病与统计教研室(胡志坚)
6
负二项分布的参数估计
负二项分布有两个参数即μ和k。
P1 k胚胎XXq死表1p6-观P3察X负雌二1项累分计布频的拟合理优论度概检率验结理果论
0.9711亡210.0数6141.064鼠P3数01f1
数AX 30
P(X) 频数T 0.494785 29.69
K 上一张 (T-f)2/T 0.00330
0.9711.0164 1 2.0624
P0
14
lg
N f0
k2
lg 1
X k2
lg
N f0
插入法计算公式
kˆ
k2
k1 lg1
k1 k2
X k1
k2
lg1
X k2
lg
N f0
k2
lg1
X k2
福建医科大学流行病与统计教研室(胡志坚)
12
表6-14 不同胚胎死亡数的雌鼠数分布情况 胚胎死亡数X 0 1 2 3 4 5 6 合计 观察雌鼠数f 30 14 8 4 2 0 2 60
福建医科大学流行病与统计教研室(胡志坚)
下一张
9
表6-14 不同胚胎死亡数的雌鼠数分布情况 胚胎死亡数X 0 1 2 3 4 5 6 合计
观察雌鼠数f 30 14 8 4 2 0 2 60
fX 30 0 141 ... 2 6 62
f X 2 30 02 14 12 ... 2 62 186
检验条件: (1) f0/N=30/60=0.5>1/3
(2) X 1.033 10
均数
X 0.17 f0 0.32 0.217 0.20 条件
N
福建医科大学流行病与统计教研室(胡志坚)
13
零频数法
先尝试K1=0.90
k1
lg1
X k1
0.90lg1
1.033 0.90
0.299
染性疾病的分布和致病生物的分布,在毒理学上
显性致死试验或致癌试验。
独立重复试验次数n不固定,n=X+k,k为大于0 的常数。
若要求X+K次试验,出现“阳性”的次数恰为X
次的概率分布为负二项分布: 1
1
1
k
福建医科大学流行病与统计教研室(胡志坚)
4
递推公式
P0 k
X=0
PX k X 11 PX 1 X≥1
X f X 62 1.033
S 2
N
60
fX2
fX 2 / N
N 1
186 622 / 60 2.067 60 1
题 公
kˆ 1.0332
1.032
零
2.067 1.033
福建医科大学流行病与统计教研室(胡志坚)
10
零频数法
利用样本计数X=0时,所对应的频数f0占观
察单位总数的比例即(f0/N)来估计K。
福建医科大学流行病与统计教研室(胡志坚)
19
假设检验过程
1.建立假设: H0 :不同胚胎死亡数的雌鼠分布服从负二项分布 H1 :不同胚胎死亡数的雌鼠分布不服从负二项分布
2.确定显著性水平, 取0.10。 3.计算统计量:ν=组数-3=4-3=1,χ2=0.08 4.确定P值:P>0.10 5.做出推论:按水准,不拒绝H0,即尚不能拒绝不同胚胎
Finally, in the NB distribution there are slightly larger probabilities for larger counts
.
福建医科大学流行病与统计教研室(胡志坚)
3
负二项分布的概念
常用于描述生物的群聚性,如钉螺在土壤的
分布、昆虫的空间分布等。医学上可用于描述传
k lg 1
X k
lg
N f0
条件;
(1)(f0/N)>1/3
表
(2)当 X 10 : X 0.17 f0 0.32 0.20 计算
N
福建医科大学流行病与统计教研室(胡志坚)
11
零频数法
找两个满足以下条件的K1和K2一个,利用
插入法计算K 。 k1 lg 1
X k1
插入法计算公式
kˆ
k2
k2 z2
k1 z1
z2
Z1与Z2在0的左右两侧相距越近,K估计越 精确,比两种方法精确
福建医科大学流行病与统计教研室(胡志坚)
16
最大似然法
先尝试K1=0.90
z1
m
AX
X 0 0.9
X
60 ln1 1.033 0.420 0.9
0
K2取1.0
z2
m
AX
X 01.0 X
16
80.2476667841
0.247667 14.86 0.04977 0.125822 7.55 0.02690
3
4
4 0.064235 3.85
4
2
2 0.032875 1.97 0.00127
5
08 2
0.016848 1.01 7.90
6
2
0 0.017770 1.07
合计
60
— 1.000000 60.0 0.08124
死亡数的雌鼠分布服从负二项分布
福建医科大学流行病与统计教研室(胡志坚)
20
2.两样本均数比较
先将观察数据进行转换
Yi=ln(Xi+0.5Kc)
按下式计算Kc
KC
X1 S12 X1 S12 X1 2
X2 S22 X2 S22 X2 2
福建医科大学流行病与统计教研室(胡志坚)
21
满足下面式子的z=0的K值:
m
z
AX
X 0 k X
N ln 1
X k
m=Xmax------样本计数X取得到最大值
在例中是最大死胎数为6
m
AX fi ----样本计数大于X的频数和 i X 1
福建医科大学流行病与统计教研室(胡志坚)
15
最大似然法
取两个K,使一个K对应的Z大于0,一个对应 的Z小于0
负二项分布(Negative Binomial Regression) 福建医科大学流行病与统计教研室
1
负二项分布(Negative Binomial Regression)
Introduction
Scott Long notes that the Poisson regression model rarely fits in practice since in most applications the variance of the count data is greater than the mean
0 0.1570
5
0 0.1570 5
0 0.1570
6
1 0.7747 6
0 0.1570
7
3 1.4279 7
0 0.1570
8
0 0.1570 8
1 0.7747
9
1 0.7747 9
0 0.1570
10 合计
1 0.7747 10 7 5.3117
0 0.1570 4 3.8021
福建医科大学流行病与统计教研室(胡志坚)
60 ln1 1.033 0.171 0 1.0
计算K
kˆ
k2
1.0 0.9 0.171 0.420
0.171
0.971
回 表
福建医科大学流行病与统计教研室(胡志坚)
17
负二项分布应用
1.似合优度检验
用上例计算: P=μ/k=1.033/0.971=1.064 q=1+P =1+1.064=2.064