当前位置:
文档之家› 抽样调查-第8章 多阶段抽样
抽样调查-第8章 多阶段抽样
表中红字为抽中的房号。 这时,初级单元有15个,每个初级单元拥有二级单元 12个。首先将单元从1到15编号,在15单元中随机抽取 5个单元,分别是1,6,9,12,13号;然后在被抽中的 单元中,进行第二次抽样,即分别在12户居民户中随机 抽取4户。
一、符号说明
初级单元和初级单元拥有的二级单元个数:N,M 第一阶段和第二阶段抽样的样本量:n ,m
用到下面的性质。
返回
性质1 对于两阶段抽样,有
E( ) E1E2 ( )
V ( ) V1[E2 ( )] E1[V2 ( )]
式中,E2,V2 为在固定初级单元时对第二阶抽样求均 值和方差; E1,V1 为对第一阶抽样求均值和方差。
性质1可以推广到多阶段抽样的情形,例如 对于三阶段抽样,有
§8.1 引 言
前面提到的整群抽样虽然 有很多优点,但是由于群内单 元通常具有相似性(表现为群 内相关系数大于零)。尤其是 当群比较大时,人们自然会想 到没有必要对群内所有单元都 进行调查,而只要对群内单元 进行再抽样,对被抽中的单元 进行调查,这就是常用的多阶 段抽样。
返回
一、多阶段抽样的定义
先在总体单元(初级单元)中抽出样本单 元,并不对这个样本单元中的所有下一级单元 (二级单元)都进行调查,而是在其中再抽出若 干个二级单元并进行调查。
返回
二、估计量及其性质
(一)总体均值的估计
性质2 对于初级单元大小相等的二阶抽样,如果两个阶
段都是简单随机抽样,且对每个初级单元,第二阶抽样
是相互独立进行的,则对总体均值 Y 的无偏估计为:
Y
y
1 n
n i1
yi
1n nm i1
m j 1
yij
其方差为:
V
(
y)
1 n
f1
返回
第一阶和第二阶的抽样比:
f1
n N
;
f2i
mi Mi
二级单元个数:
N
n
M 0 M i , m0 mi
i 1
i 1
N
指标总和: Y
Mi
Yij , y
n
mi
yij
i1 j1
i1 j1
Mi
mi
第i个初级单元指标总和: Yi Yij , yi yij
N n
n i1
M
2 i
(1
mi
f2i )s22i
式中,
Yu
1
n
Yi
n i1
返回
2.比率估计量
由于初级单元的大小
M
不同,往往
i
造成初级单元的观测值
Yi
差异很大,使得估计量方差
V (Y u )的第一项很大,从而估计量的方差也就变得很大。
这时,可以考虑将初级单元的大小 M i 作为辅助变量,
如果二阶抽样中每个阶段都采用简单随机抽样,并且 每个初级单元中二级单元的抽样是相互独立的,则对 总体总和的估计可以采用简单估计,也可以考虑采用 比率估计。
1.简单估计量 对总体总和的简单估计为:
Yu
N n
n i1
Mi
yi
N n
n
Yi
i1
根据性质1,不仅可以证明这个估计量是无偏的,并
n i1
m
( yij
j 1
yi )2
由
S
2 2
的表达式可知,若记
S 2 2i
1 M 1
M
(Yij
j 1
Y i )2
则有
S22
1 N
N
S2 2i j 1
即
S 22 是
S2 2i
的平均值。同理有
s 2 2i
1 m 1
m
( yij
j 1
yi )2
s22
1 n
n
s2 2i j 1
p)2
f1(1 f2 ) n2 (m 1)
n
i1
pi qi
式中, Qi 1 Pi ; qi 1 pi.
返回
【例8.2】 欲调查某个新小区居民家庭装潢聘请装潢
公司的比例。我们在15个单元中随机抽取了5个单元,在 这5个单元分别随机抽取了4户居民进行调查,对这20户 的调查结果如下表:
采用比率估计量对总体总和进行估计。
样本企业
第一日
第二日
第三日
1
57
59
64
2
38
41
50
3
51
60
63
4
48
53
49
5
62
55
54
要求根据这些数据推算不100家企业该指标的总量,并
给出估计的95%置信区间。
返回
解 将企业作为初级单元,将每一天看着二级单元。
调查月内拥有30天(即拥有30个二级单元)。 首先在初级单元中抽取一个n=5的简单随机样本再
N i1
(Y i
Y )2 ,
s12
1 n 1
n i1
( yi
y)2,
第i个初级单元二级单元间的方差:
S 2 2i
1 Mi
Mi
1
(Yij
j 1
Y i )2,
s2 2i
1 mi 1
mi
( yij
j 1
yi )2
返回
二、估计量及其性质
(一)对初级单元进行简单随机抽样
S12
1 f2 nm
S
2 2
V
(
y)的无偏估计为:v(
y)
1 n
f1
s12
1 f2 nm
s22
返回
【例8.1】欲调查4月份100家企业的某项指标,首先
从100家企业中抽取了一个有板有5家样本企业的简单随 机样本,调查人员对5家企业分别在调查月内随机抽取3 天作为调查日,要求样本企业只填写这3天的流水帐。 调查的结果如下。
对每个样本的二级单元分别独立抽取一个m=3的简单 随机样本
由题意,N=100,M=30,n=5, m=3
f1
n N
5 100
0.05,
f2
m M
3 30
0.10
首先计算样本初级单元的均值 yi 、方差 s22i:
返回
样本企业
yi
s2 2i
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
于是得到:
y
1 n
n
i1
yi
1 (60 5
43
58
50 57)
53.6
s12
1 n 1
n i1
( yi
y)2
49.3
s22
1 n
n i1
s2 2i
23.4
返回
v( y) 1 0.05 49.3 0.05(1 0.10) 23.4 9.4372
f2
4 12
因此,
p
1
nm
n i1
ai
1 (2 11 0 1) 54
0.25
其方差的估计为:
v(
p)
1 f1 n(n 1)
n
(
i1
pi
p)2
f1(1 f2 ) n2 (m 1)
n
i1
pi qi
0.00657
s( p) v( p) 0.081
P的置信区间为: 0.25 1.96 0.081
E( ) E1E2E3( )
V ( ) V1[E2E3( )] E1{V2[E3( )]} E1E2[V3( )]
返回
§8.2 初级单元大小相等的二阶抽样
第一阶段在总体N个初级单元中,以简单随机 抽样抽取n个初级单元,第二阶段在被抽中的初级 单元包含的M个二级单元中,以简单随机抽样抽取 m个二级单元,即最终接受调查的单元。
返回
§8.3 初级单元大小不等的二阶抽样
一般而言,初级单元的大小是不相等的,如果按初 级单元的大小分层后,层内初级单元的大小差别仍很大, 则需用本节介绍的方法来处理二阶抽样的问题。当初级 单元大小不等时,一般采用不等概抽样。
一、符号说明
总体中初级单元个数及第一阶抽取的样本量:N,n
第i个初级单元中二级单元数: M i 第i个初级单元中第二阶抽样的样本量:mi 第i个初级单元中第j个二级单元的观测值:Yij 样本中第i个初级单元中第j个二级单元的观测值:yij
返回
性质3 对于二阶抽样,如果两个阶段都是简单随机 抽样,则有 E( p) P
估计量 p 的方差为:
V
(
p)
1 n
f1
1
N
1
N i1
(
Pi
P)2
1 f2 nm
M N(M
N
1) i1
PiQi
V ( p) 的无偏估计为:
v(
p)
1 f1 n(n 1)
n
(