当前位置：文档之家› 抽样调查-分层随机抽样课件

抽样调查-分层随机抽样课件

10 400
0.025
W3
N3 N
750 2850
0.26316,
f3
n3 N3
10 750
0.0133
W4
N4 N
1500 2850
0.52632,
f4
n4 N4
10 1500
0.0067
返回
各层样本均值及样本方差为:
1 n1
y1 n1 i1 y1i 39.5
s12
1 n1 1
n1 i 1
返回
单元权数：Wh
Nh N
总体均值：Y h
1 Nh
Nh
Yhi
i1
第L层总体方差：Sh2
N
1 h
1
Nh i1
(Yhi
Yh )2
返回
样本均值：
y h
1 nh
nh i1
yhi
抽样比：
fh
nh Nh
第L层样本方差：sh2
1 nh nh 1 i1 ( yhi
yh )2
返回
§3.2 简单估计量及其性质
性质三对于分层随机抽样, V（pst）的无偏估计为
v(
pst
)
L
Wh2v(
h1
ph
)
1 N2
L h1
N
2 h
(Nh nh ) Nh 1
phqh nh 1
L
Wh2 (1
h1
f
h
)
ph nh
qh 1
返回
【例3.2】在例3.1的调查中，同时调查了居民拥有家庭电脑的情况，获得如下数据（单位：台），如表3.2。估计该地区居民拥有家庭电脑的比例及估计的标准差。
h1
h1
性质二
对于分层随机抽样,
Y
的方差为:
V (Y )
L
Nh2V (Y h )
h1
=
L h1
N
h
2
1
fh nh
Sh2
返回
性质三对于分层随机抽样,V (Y ) 的无偏估计为:
v(Y )
L
Nh2v(Y h )
h1
=
L h1
N
h
2
1
f nh
h
sh2
【例3.1】调查某地区的居民奶制品年消费支出，以居民户为调查单元，根据经济及收入水平将居民户划分为4层，每层按简单随机抽样抽出10户，调查获得如下数据（单位：元）估计该地区居民奶制品年消费总支出及估计的标准差。
（i=1,2, …,N）
则对总体比例的估计类似对总体均值的估计，这时，
pst 与
y st
具有同样的性质。
返回
性质一对于一般的分层随机抽样,如果 ph是Ph
的无偏估计（h=1,2, …,L),则 pst 是 P 的
无偏估计。pst 的方差为：
L
V ( pst ) Wh2V ( ph )
h1
性质二对于分层随机抽样, pst是 P 的无偏估计。
h1
h1
L
WhY h
h1
1 N
L
NhY h
h1
1 N
L
Yh
h1
Y N
Y
返回
性质二对于分层简单随机抽样, yst 是 Y
的无偏估计， yst 的方差为：
V
( y st
)
L
Wh 2V
h1
(
yh
)
L
Wh2
h1
1 fh nh
Sh2
返回
性质二的证明:若各层独立进行简单随机抽样,
对每一层有
L
E( yh ) Y h , E( y st ) Y ,V ( y st ) Wh2V ( yh ) h1
另一种是对比率的分子、分母分别加权计算出分层估计量，然后用对应的估计量来构造比估计，这样所得的估计量称为联合比估计（combined ratioestimator).
返回
1.分别比率估计
总体均值 Y 总体总量Y 的分层比率估计为：
总体均值:
yRs
L
Wh
h1
y Rh
L
Wh
h1
yh xh
X
h
总体总量:
1.分层抽样的抽样效率较高，也就是说，分层抽样的估计精度较高。
2.分层抽样不仅能对总体指标进行推算，而且能对各层指标进行推算。
3.层内抽样方法可以不同，而且便于抽样工作的组织。
返回
三、使用场合
在对分层进行具体划分时，通常考虑如下原则： 1.层内单元具有相同性质，通常按调查对象
的不同类型进行划分。 2.尽可能使层内单元的标志值相近，层间单
§3.1 引言
一、定义先将总体 N 个单元划分成 L 个互不重复的子
总体，每个子总体称为层，它们的大小分别为
N1, N2 ,, NL
L
(N Nh)
h1
然后，在每个层中独立地进行抽样, 称为分层抽样.
返回
二、作用
分层抽样在实际工作中应用的非常广泛，主要是因为它具有其它抽样方法所没有的特点：
1 N2
4 h1
Nh2v( ph )
1 28502
(2002
0.0169
4002
0.0173
7502
0.4
1500 2
0.0099)
0.005
返回
§3.3 比率估计量及其性质
将比率估计的思想和技术用于分层随机样本时，对总体参数的估计有两种途径：
一种是对每层样本分别考虑比估计量，然后对各层的比估计量进行加权平均,此时所得的估计量称为分别估计（separate ratio estimator);
2Rh hS yhSxh )
V (Y Rs )
L h1
N
2 h
(1
nh
f
)
(
S
2 yh
Rh2
S
2 xh
2Rh hS yhSxh )
式中,
fh
nh Nh
;
S
2 yh
;
S
2 xh
;
h
分别为第 i层指标
Y,X的方差及相关系数.
分别比率估计量要求每一层的样本量都比较大,否则,偏倚可能比较大.
返回
2.联合比率估计(combined ratio estimator)
证明：注意到
V ( ph )
Nh nh Nh 1
PhQh nh
及 Nh 1 Nh 因而 pst 的方差为：
返回
V
(
pst
)
L
Wh2V
h1
(
ph )
1 N2
L h1
N
2 h
(
N
h
nh
)
Nh 1
PhQh nh
L h1
1 N2
N
2 h
(Nh
Nh
nh )
PhQh nh
L
Wh2 (1
h1
f
h
)
PhQh nh
总体均值：
y Rc
y st x st
X
Rc
X
总体总量：
Y Rc
y st
X
Rc
X
x st
式中: yst 表示 Y
的无偏估计; 均方误差为：
xst 表示 X 的无偏估计.
MSE( y Rc ) V ( y Rc )
N
2 h
(1
N 2nh
f
)(
S
2 yh
R
2
S
2 xh
2RS yxh )
MSE(Y Rc ) V (Y Rc )
4 1500 50 35 15 0 20 30 25 10 30 25
返回
由上表,N=2850, nh 10, (h 1,2,3,4),
各层的层权及抽样比为:
W1
N1 N
200 2850
0.07018,
f1
n1 N1
10 200
0.05
W2
N2 N
400 2850
0.14035,
f2
n2 N2
估计。
Y
st
的方差为：
V（ Y st
）=
L
Wh2V (Y h )
h1
值得注意的是：只要对各层估计是无偏的，则对
总体的估计也是无偏的。
因此，各层可以采用不同的抽样方法，只要相应的估计量是无偏的，则对整体的推算也是无偏的。
返回
性质一的证明:由于对每一层有
E(Y h ) Y h
因此
L
L
E(Y st ) E( Wh Y h ) WhE(Y h )
Y N yst
2.估计量的性质
由于
Y
与
y st
只差一个常数，因此，Y 与 yst 具有
相同的性质。
返回
性质一对于一般的分层随机抽样,如果 yst 是 Y
的无偏估计,
则
Y
是的无偏估计,Y 的方差为:
L
V (Y ) N 2V (Y st ) V (Y h )
h1
L
L
N 2 Wh2V (Y h ) Nh2V (Y h )
一、总体均值的估计
1.估计量的定义总体均值 Y 的估计:
Y st =
L h1
Wh
Y h
1 N
L h1
Nh
Yh
如果得到的是分层随机样本,则总体均值 Y
的简单估计为:
y st
L
Wh yh
h1

e商务文档

抽样调查-分层随机抽样课件

相关文档推荐：