当前位置:文档之家› 第八章(多阶段抽样)

第八章(多阶段抽样)


E1[
S22i ]
n
S12
1 f2 m
S22
抽样调查
原理与方法
所以S12 的无偏估计为
Sˆ12
s12
1
f2
m
s22
将(2)、(3)式结合,得到
(y)
1 f1 n
s12

f1(1 f nm
2
)
s22
(3)
抽样调查
原理与方法
类似的,可以构造三阶抽样 y 的估计方差
( y) 1 f1
抽样过程
前二阶采用PPS,最后一阶按等概率抽取最终单元,且各阶 段样本量对不同单元都等于常数,则所得样本是自加权的。 此时有:
Zi

Mi M0
, Zij

Kij Mi
, Zij

1 Kij
抽样调查
原理与方法
N
N Mi
M 0 Mi
Kij
Yˆ M0 n nmk
m
k
抽样调查
原理与方法
第八 章 多阶段抽样
抽样调查
原理与方法
第一节 概述
一.什么是多阶段抽样
分多个阶段抽到最终接受调查的样本。 初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (SSU)----Ultimate Sampling Unit
在 PPS 抽样中
Zi

Mi M0
,代入上式,得
YˆPPS

M0 n
n
yi
抽样调查
原理与方法
若进一步令mi=m,这时估计量是自加权的。
自加权含义:
各最终单元入选样本的概率相同, 如果一个估计量可以表达为样本观测值的常倍数, 则称这种估计量是自加权的。 对汉森—赫维茨估计量而言
YˆHH
原理与方法
二、Y 估计量的性质
ˆ
1n
1 nm
Y y n
yi nm
yij
E(y) Y
抽样调查
原理与方法
E(
y)

E1 E 2
(
1 n
n
yi )

E1[
1 n
n
E2 ( yi )]

E1[
1 n
n
Yi ] Y
抽样调查
原理与方法
估计量方差一般公式为:
V (ˆ) V1 E2(ˆ) E1 V2(ˆ)
mn
m
yij

1 n
n
yi
抽样调查
原理与方法
V(YˆPPS) 与V(y) 的无偏估计为:
(YˆPPS)

M02 n(n1)
n
(yi y)2
(y) 1 n(n 1)
n
(yi y)2
抽样调查
原理与方法
第四节 不等概抽样在 多阶段抽样中的应用
为简化,以三阶抽样为例,给出结论。
yij M 0 y
y 1 n nmk
m
k
yij
抽样调查
原理与方法
(Yˆ) M 02
n(n 1)
n
( yi y)2
yi
1 mk
m
k
yiju

1 n
n
Mi yi Zi
1 n
n
Mi Zi mi
mi
yij
抽样调查
原理与方法
所以,它成为自加权估计量的条件是
Mi nZimi

1 ,或n.Zimi
f0
Mi

f0
第二Байду номын сангаас段抽样比
f2i

mi Mi
f0 nZ i
f 0 为常数
抽样调查
原理与方法
在自加权条件下
YˆPPS M0y
y 1 n
V ( y)

S12

S
2 2
m
若以n个 yi 的均值 y 推断 Y ,其方差为
V(y)
S12

S
2 2
n nm
再考虑fpc,则(1)式成立。
抽样调查
原理与方法
V (y)的无偏估计为
v( y) 1 f1 n
s12

f1
(1 nm
f
2
)
s22
证明:
E(s22
)

S
2 2

s12
1 n 1
二、Y的估计
N
入选概率 Z i , Z i 1
估计过程 先估计Yi , 然后利用Yˆi 估计Y 汉森—赫维茨估计量
抽样调查
原理与方法
YˆHH
1 n
n
Yˆi Zi
E(YˆHH) Y
V(YˆHH)

1[ n
N
Zi
(Yi Zi
Y)2

N
V2(Yˆi ) Zi
V(YˆHH)的无偏估计量为:
n
s12
f1 (1 nm
f2
)
s22

f1 f2 (1 nmk
f3 ) s32
抽样调查
原理与方法
三、总体比例的估计
ai,第i 个初级单元中具有某特征的次级单元数。
1 n
1 nm
p n
pi nm
ai
V(P) 1 f1 n
1 N 1
N
(Pi

P)2

1 f2 nm
C2m)
(S2 Sm22 )(C1 C2m)
其中:
S
2

S
2 1

S
2 2
M
抽样调查
原理与方法
使上式达到极小的充要条件是
S S2 m
C1 C2m
从而mopt 满足
mopt

S2 S
C1 C2
抽样调查
原理与方法
由上式看出,m与
S
2 2
,C1成正比,与
S12
,C2
成反比。
求出m后,利用(4),(5)式,即可求出n.
于是有:
V ( y) 1 f1 n
S12

1 f2 mn
S22
(1)
抽样调查
原理与方法
假定n=1, 第二阶段抽取m个单位

yi
估计 Yi

误差大小取决于
S
2 2
和m,即
V2 ( yi )
S
2 2
m
其次,用 Yi 推断 Y 时,第二次推断误差大小取决于 S12 和n,
当n=1时,V1(Yi ) S12 ,这时
抽样调查
原理与方法
(YˆHH
)

1 n(n 1)
n
( Yˆi Zi
YˆHH )2
若二阶抽样采用 srs,即
Yˆi M i yi 是 Yi 的无偏估计
而:
V 2(Yˆi )

M i2V2 ( yi )

M
2 i
mi
(1
f
2i
)S
2 2i
抽样调查
原理与方法
于是有
YˆHH
1 n
n
M i yi Zi
V
(YˆHH
)

1 n
N
Z
i
(
Yi Zi
Y)2 1 n
M
2 i
(1
mi
Z
i
f
2i
) S
2 2i

(YˆHH
)

1 n(n 1)
n
( M i yi Zi
YˆHH )2
抽样调查
原理与方法
三、初级单元的 PPS 抽样
由前知: YˆHH
1 n
n
M i yi Zi
M N(M 1)
N
PiQi
抽样调查
原理与方法
v(p) 1 f1 n(n 1)
n
(
pi

p)2

f1(1 f2) n2(m1)
n
piqi
四、最优样本量 m 与 n 的确定 目标:
CT 给定条件下,如何确定m与n,从而使V(y) 最小。
抽样调查
原理与方法
二阶抽样费用函数
CT C0 C1n C2 nm
一、符号
Yij ,总体中第i 个初级单元中第j 个次级单元指标值
i =1,2,….N, j=1,2,….M
yij ,样本中第i 个初级单元中第j 个次级单元观测值 i =1,2,…n, j=1,2,….m
抽样调查
原理与方法
f1

n N
,
f2

m M
M
Yi Yij
m
yi yij
Yi

Yi M
抽样调查
原理与方法
yi

yi m
Y N Yi N
y n yi
n
抽样调查
原理与方法
S12

1 N1
N
(Yi
Y
)2
s12
1 n1
n
(yi
y
)2
S22
1 N(M1)
N
M
(Yij Yi)2
相关主题