抽样调查-分层随机抽样课件
10 400
0.025
W3
N3 N
750 2850
0.26316,
f3
n3 N3
10 750
0.0133
W4
N4 N
1500 2850
0.52632,
f4
n4 N4
10 1500
0.0067
返回
各层样本均值及样本方差为:
1 n1
y1 n1 i1 y1i 39.5
s12
1 n1 1
n1 i 1
返回
单元权数:Wh
Nh N
总体均值:Y h
1 Nh
Nh
Yhi
i1
第L层总体方差:Sh2
N
1 h
1
Nh i1
(Yhi
Yh )2
返回
样本均值:
y h
1 nh
nh i1
yhi
抽样比:
fh
nh Nh
第L层样本方差:sh2
1 nh nh 1 i1 ( yhi
yh )2
返回
§3.2 简单估计量及其性质
性质三 对于分层随机抽样, V(pst) 的无偏估计为
v(
pst
)
L
Wh2v(
h1
ph
)
1 N2
L h1
N
2 h
(Nh nh ) Nh 1
phqh nh 1
L
Wh2 (1
h1
f
h
)
ph nh
qh 1
返回
【例3.2】 在例3.1的调查中,同时调查 了居民拥有家庭电脑的情况,获得如下数据 (单位:台),如表3.2。估计该地区居民拥 有家庭电脑的比例及估计的标准差。
h1
h1
性质二
对于分层随机抽样,
Y
的方差为:
V (Y )
L
Nh2V (Y h )
h1
=
L h1
N
h
2
1
fh nh
Sh2
返回
性质三 对于分层随机抽样,V (Y ) 的无偏估计为:
v(Y )
L
Nh2v(Y h )
h1
=
L h1
N
h
2
1
f nh
h
sh2
【例3.1】调查某地区的居民奶制品年消费支 出,以居民户为调查单元,根据经济及收入 水平将居民户划分为4层,每层按简单随机抽 样抽出10户,调查获得如下数据(单位:元) 估计该地区居民奶制品年消费总支出及估计 的标准差。
(i=1,2, …,N)
则对总体比例的估计类似对总体均值的估计,这时,
pst 与
y st
具有同样的性质。
返回
性质一 对于一般的分层随机抽样,如果 ph是Ph
的无偏估计(h=1,2, …,L),则 pst 是 P 的
无偏估计。pst 的方差为:
L
V ( pst ) Wh2V ( ph )
h1
性质二 对于分层随机抽样, pst是 P 的 无偏估计。
h1
h1
L
WhY h
h1
1 N
L
NhY h
h1
1 N
L
Yh
h1
Y N
Y
返回
性质二 对于分层简单随机抽样, yst 是 Y
的无偏估计, yst 的方差为:
V
( y st
)
L
Wh 2V
h1
(
yh
)
L
Wh2
h1
1 fh nh
Sh2
返回
性质二的证明:若各层独立进行简单随机抽样,
对每一层有
L
E( yh ) Y h , E( y st ) Y ,V ( y st ) Wh2V ( yh ) h1
另一种是对比率的分子、分母分别加权计算出分层 估计量,然后用对应的估计量来构造比估计,这样所得 的估计量称为联合比估计(combined ratioestimator).
返回
1.分别比率估计
总体均值 Y 总体总量Y 的分层比率估计为:
总体均值:
yRs
L
Wh
h1
y Rh
L
Wh
h1
yh xh
X
h
总体总量:
1.分层抽样的抽样效率较高,也就是说,分 层抽样的估计精度较高。
2.分层抽样不仅能对总体指标进行推算,而 且能对各层指标进行推算。
3.层内抽样方法可以不同,而且便于抽样工 作的组织。
返回
三、使用场合
在对分层进行具体划分时,通常考虑如下原则: 1.层内单元具有相同性质,通常按调查对象
的不同类型进行划分。 2.尽可能使层内单元的标志值相近,层间单
§3.1 引 言
一、定义 先将总体 N 个单元划分成 L 个互不重复的子
总体,每个子总体称为层,它们的大小分别为
N1, N2 ,, NL
L
(N Nh)
h1
然后,在每个层中独立地进行抽样, 称为分层抽样.
返回
二、作用
分层抽样在实际工作中应用的非常广泛, 主要是因为它具有其它抽样方法所没有的 特点:
1 N2
4 h1
Nh2v( ph )
1 28502
(2002
0.0169
4002
0.0173
7502
0.4
1500 2
0.0099)
0.005
返回
§3.3 比率估计量及其性质
将比率估计的思想和技术用于分层随机样本时,对 总体参数的估计有两种途径:
一种是对每层样本分别考虑比估计量,然后对各层 的比估计量进行加权平均,此时所得的估计量称为分别 估计(separate ratio estimator);
2Rh hS yhSxh )
V (Y Rs )
L h1
N
2 h
(1
nh
f
)
(
S
2 yh
Rh2
S
2 xh
2Rh hS yhSxh )
式中,
fh
nh Nh
;
S
2 yh
;
S
2 xh
;
h
分别为第 i层指标
Y,X的方差及相关系数.
分别比率估计量要求每一层的样本量 都比较大,否则,偏倚可能比较大.
返回
2.联合比率估计(combined ratio estimator)
证明:注意到
V ( ph )
Nh nh Nh 1
PhQh nh
及 Nh 1 Nh 因而 pst 的方差为:
返回
V
(
pst
)
L
Wh2V
h1
(
ph )
1 N2
L h1
N
2 h
(
N
h
nh
)
Nh 1
PhQh nh
L h1
1 N2
N
2 h
(Nh
Nh
nh )
PhQh nh
L
Wh2 (1
h1
f
h
)
PhQh nh
总体均值:
y Rc
y st x st
X
Rc
X
总体总量:
Y Rc
y st
X
Rc
X
x st
式中: yst 表示 Y
的无偏估计; 均方误差为:
xst 表示 X 的无偏估计.
MSE( y Rc ) V ( y Rc )
N
2 h
(1
N 2nh
f
)(
S
2 yh
R
2
S
2 xh
2RS yxh )
MSE(Y Rc ) V (Y Rc )
4 1500 50 35 15 0 20 30 25 10 30 25
返回
由上表,N=2850, nh 10, (h 1,2,3,4),
各层的层权及抽样比为:
W1
N1 N
200 2850
0.07018,
f1
n1 N1
10 200
0.05
W2
N2 N
400 2850
0.14035,
f2
n2 N2
估计。
Y
st
的方差为:
V( Y st
)=
L
Wh2V (Y h )
h1
值得注意的是:只要对各层估计是无偏的,则对
总体的估计也是无偏的。
因此,各层可以采用不同的抽样方法,只要相应 的估计量是无偏的,则对整体的推算也是无偏的。
返回
性质一的证明:由于对每一层有
E(Y h ) Y h
因此
L
L
E(Y st ) E( Wh Y h ) WhE(Y h )
Y N yst
2.估计量的性质
由于
Y
与
y st
只差一个常数,因此,Y 与 yst 具有
相同的性质。
返回
性质一 对于一般的分层随机抽样,如果 yst 是 Y
的无偏估计,
则
Y
是的无偏估计,Y 的方差为:
L
V (Y ) N 2V (Y st ) V (Y h )
h1
L
L
N 2 Wh2V (Y h ) Nh2V (Y h )
一、总体均值的估计
1.估计量的定义 总体均值 Y 的估计:
Y st =
L h1
Wh
Y h
1 N
L h1
Nh
Yh
如果得到的是分层随机样本,则总体均值 Y
的简单估计为:
y st
L
Wh yh
h1