第五章抽样估计3.pptx
9
2、泊松分布参数λ的区间估计
设总体服从参数λ的泊松分布, x1,x2,…xn是来自
总体的样本值 (xi 为第i次抽样事件发生的次数,注意
与二项分布中xi的区别)。
n
样本总计数--各次试验事件发生次数之和, 记作 X xi i 1 在小样本情况下,通常也是通过查表得到。 只要给出样本总计数X和α,就可从附表10中查出
n
(3)对给定置信水平1-α
pP
P(|
p(1 p)
|
u) 1
2
n
(4)变形,P(p u
2
p(1 p)
n
P pu
2
p(1 p) ) 1 n
所以总体率P的1-α置信区间为
( p u
2
p(1 p)
n
, p u
2
p(1 p) ) n
简记为
p u
2
p(1 p) n
14
例19 随机抽查了某校200名沙眼患者,经治疗有168名治愈, 求总体治愈率的0.95的置信区间. 解 样本治愈率p=168/200=0.84, α=0.05
X=x1+x2+x3=20, n=3, 1-α=0.99。 查附表10得,总体参数 3λ的0.99置信区间
(10.35,34.67) 则每毫升井水所含细菌数的0.99的置信区间 (3.45,11.56)。
11
二、大样本正态近似估计方法
(计数样本容量n>50)
1、二项分布参数P的区间估计
从总体中抽取容量为n的样本,可看做n重贝努利试 验,所以具有某种特征的的样本数X~B(n,P),且 E(X)=nP, V(X)=nP(1-P),则样本率
/
2
(n
1)
21.026
(n 1)S2 12 1.701
3.906
2 1
/
2
(n
1)
5.226
故σ2的0.9置信区间为(0.971,3.906).
6
§5.4 二项分布、泊松分布总体参数的区间估计
前面介绍的区间估计方法都是正态总体的情况, 解决的也是计量资料问题。
本节讨论总体服从二项分布和泊松分布的情况, 解决计数资料参数的区间估计问题。 一、小样本精确估计方法(n≤50) 二、大样本正态近似估计方法(n>50)
为计算方便,在大样本情况下(n足够大),常用样 本率p代替总体率P计算样本率p 的标准差,即
u p P ~ N (0,1) p(1 p) n
13
用求区间估计的一般步骤求出P的置信区间:
(1) 总体率P 以样本率p为点估计量。
(2) 取U(p, P) p P (~ N(0,1)) p(1 p)
总体参数nλ的1-α置信区间,将其上下限再除以n即得 参数λ的1-α置信区间。
10
例18 从一份充分混合的井水中随机抽取3 次水 样(每次1ml),经检查有20只细菌,求每毫升井 水所含细菌数的0.99的置信区间。
解 井水含细菌是稀有事件,则本题为泊松分布 均数λ的区间估计 。
设 xi(i=1,2,3)为第i次抽样所含细菌数,则
1
目标要求
1、了解正态总体方差的区间估计 2、熟悉大样本二项分布、泊松分
布总体参数的区间估计 3、了解小样本二项分布、泊松分布总
体参数的区间估计
2
三、正态总体方差的区间估计
标准型:若总体X~N(μ,σ2),且μ,σ2未知,
x1,x2,…xn是来自总体的样本值,求σ的置信
度1-α的置信区间。
解(1)选σ2 的点估计为S2
解 n=13,自由度df=12
当1-α=0.9时,α=0.1, 查附表6 得
2 1
0.1
/
2
(12)
2 0.95
(12)
5.226
2 0.1
/
2
(12)
2 0.05
(12)
21.026
5
又
S2
1 n1
n i1
(xi
x)2 .
1.701
所以 (n 1)S2 12 1.701 0.971
2
f(x)
(2)
取
T(
2 ,S2 )
(n
1)S 2
2
(~ 2 (n 1))
α/2
1-α
α/2
(3) 对给定置信水平1-α
2 1 / 2
2 /2
P(
2 1
/
2
(n
1)
(n 1)S2
2
2
/
2
(n
1))
1
3
(4) 变形,P( (n 1)S2 2 (n 1)S2 ) 1
2
/
2
(n
回顾:区间估计的一般步骤:
1. 寻找参数θ的一个好的点估计量T; 2. 2. 寻找θ和估计量T 的函数U(θ,T),且分布已知; 3. 3. 由P(a≤U(θ,T)≤b)=1-α查表得a, b ; 4. 4. 对“a ≤U(T,θ)≤b”作等价变形,得到
P{ˆ1 ˆ2 } 1
则 (ˆ1,就ˆ2 )是θ在1-α下的置信区间.
p X 也服从二项分布,且 E( p) P, V ( p) P(1 P)
n
n
这说明样本率p是总体率P的无偏估计量。
12
由中心极限定理,在大样本情况下(n足够大), 样本率p 近似服从正态分布N(P,P(1-P)/n).
则样本率p 的标准化随机变量
u p P ~ N (0,1) P(1 P) n
8
在小样本情况下,用公式直接计算很复 杂,通常通过查表得到。
只要给出n,k 和α(常用0.05及0.01),就可 从附表9中查出总体率P的1-α置信区间.
例17 设用某种药物治疗近视眼,随机抽取样20 例作为样本,结果12例有效,求总体有效率 的0.95的置信区间.
解 显然,是二项分布参数P的区间估计 n=20, k=12, 1-α=0.95 查附表9得0.95的置信区间(0.361,0.809)
7
一、小样本精确估计方法(n≤50)
1、二项分布参数P的区间估计 总体(概)率P:具有某种特征的个体数与总体数的比率, 如有效率、发病率。
总体率一般未知,需要根据样本值进行区间估计。 样本(概)率p: 具有某种特征的个体数占样本容量的比率。
重复抽取n个个体可看作n重贝努利试验,则具有某 种特征的个体数X~B(n,P) 。
1)
2 1
/
2
(n
1)
所以σ2 的1-α置信区间为
(n 1)S2 (n 1)S2
(
,
)
2
/
2
(n
1)
2 1
/
2
(n
1)
总体标准差σ的1-α置信区间为
n1
n1
(
2
/
2
(nБайду номын сангаас
1)
S,
2 1
/
2
(n
1)
S)
4
例14 从某地随机抽取13人,测得血磷值为 1.67,1.98,2.33,2.34,2.5,3.6,3.73,4.14,4.1 7,4.57,4.82,5.78,若血磷值近似服从正态分 布,求总体方差σ2的0.9置信区间.