当前位置:文档之家› 分层抽样

分层抽样



L
ˆ) Wh 2V (Y h
h 1
性质2 对于分层随机抽样, Yst 是 Y 的无偏估计, Yst 的方差为: L L 1 fh 2 2 V yst Wh V yh Wh2 Sh
h 1 h 1
nh
2 2 2 L L W S W S 1 1 2 ( )Wh2 S h h h h h Nh nh N h 1 nh h 1 h 1 L
L
h 1
y st . ˆ Rc x st
对于分层随机抽样的联合比估计,若总样本量
n
比较大,则有 E ( y RC ) Y
MSE ( y RC ) V ( y RC ) Wh2 (1 f h ) 2 2 ( S yh R 2 S xh 2 R h S yh S xh ) nh h 1
i 1
nh
第h层总体方差
2 1 S Yhi Yh N h 1 i 1 2 h
Nh
nh 1 2 第h层样本方差: s 2 yhi yh h nh 1 i 1
简单估计量
一、总体均值的估计
在分层抽样中,对总体均值 Y 的估计是通过对各层的 Y h 的估计,按层权 W 加权平均得到的。公式为:
L
ˆ ) MSE (YRS ) V (Y RS
L
2 Nh (1 f h ) 2 2 2 ( S yh Rh S xh 2 Rh h S yh S xh ) nh h 1
2 2 S yh , S xh , h , Rh 分别为第h层指标Y和X的方差、相关系数以
及比率估计量。

证明:当 nh
比较大时,有
E ( y Rh ) Yh
MSE ( y RS ) V ( y RS ) (1 f h ) 2 2 2 ( S yh Rh S xh 2 Rh h S yh S xh ) nh
所以 E ( y ) W E ( y ) W Y Y h h h RS Rh
y hi

层权: Wh N h
N

nh 第h层抽样比: f h Nh

第h层总体均值: Yh 1 Nh
Y
i 1
Nh
hi

第h层样本均值:
第h层总体总值: 第h层样本总值:
1 yh nh
y
i 1
Nh i 1
nh
hi

Yh N hYh Yhi

yh nh yh yhi
2 2 又因为 V ( gst ) E( g st ) [E( g st )]2 E( gst )
则有 而
V ( y RC ) V ( g st )
V ( g st ) Wh2
h 1 L
1 fh 2 S gh nh
S
2 gh
Nh 2 1 G G hi h N h 1 i 1 2
V yst Wh V Yh
h 1

证明:
L L L ˆ E Yst E ( WhYh ) Wh E (Yh ) WhYh Y h 1 h 1 h 1 L L L L ˆ 2 V (Yst ) V ( WhYh ) Wh V (Yh ) 2 WhW j cov(Yh , Y j ) h 1 h 1 h 1 j h
2 h
L
性质 9
对于分层随机抽样,V pst 的一个无偏估计
为:
N N h nh ph qh 1 v pst W v ph 2 N h 1 N h 1 nh 1 h 1
L 2 h L 2 h
ph qh W 1 f h nh 1 h 1
h
1 ˆ ˆ Yst WhYh N h 1
L
ˆ N Y hh
h 1
L
如果得到的是分层随机样本,则总体均值 计为:
Y 的简单估
1 L yst Wh yh N h yh N h 1 h 1
L
ˆ 是 Y h 的无偏 性质 l 对于一般的分层抽样,如果 Y h 估计(h=1,2,…,L),则 Yst 是 Y 的无偏估计。 Yst 的 L 方差为: ˆ 2
偏估计(h=1,2,…,L),则
pst 是P的无偏估计。
pst 的方差为:
V pst Wh2V ph
h 1 L
性质8 对于分层随机抽样,
pst是P的无偏估计,则
1 L 2 Nh nh PhQh V pst 2 N h N h1 N h 1 nh
当Nh 1 Nh时,pst的方差为
Ah 记 层 比 例 为 Ph , Qh 1 Ph , 层 样 本 比 Nh ah 例 ph , qh 1 ph ,其中 Ah 与 ah 是第h层总体及 nh
样本中具有所考虑特征的单元数,则总体比例P的
x
估计为:
pst
W
h 1
L
h
P h
性质7
对于一般的分层抽样,如果 ph 是 P 的无 h
2 N 1 h N h nh P 2 h Qh V pst Wh V ph 2 N h 1 N h 1 nh h 1 L L 2 N 1 h N h nh PhQh 2 Nh nh h 1 N L
PhQh W 1 f h nh h 1


L
性质 6
ˆ )的一个无偏估计为: 对于分层随机抽样, V (Y st
L
ˆ N 2v y v Y st h h
h 1


2 L 1 f s 2 h 2 Nh sh N h ( N h nh ) h nh nh h 1 h 1 L
三、总体比例的估计

L
N h N h nh 2 ˆ ˆ 的无偏估计。 v Ast N v pst ph qh 是 V A st n 1 h 1 h

L
比率估计量
分别比估计

要求各层的样本量 nh 比较大。 定义: 对于分层随机抽样,总体均值 Y 和总体总量 Y 的 分别比估计为
机抽样,所得到的样本称为分层随机样本。
符号说明
设总体分为L层,下标h表示层号(h=1,2,…,L)。 则关于第h层的记号如下: 第h层总体单元数: N h (通常已知),且 N h N 第h层样本单元数: n ,且hlnh 1l
h 1
h
n
第h层总体和样本第i个单元标志值(观察值): Yhi
二、总体总量的估计
总体总量Y的估计为: L ˆ ˆ Yst NY Y h st
h 1
如果得到的是分层随机样本,则总体总量Y的简 单估计为:
ˆ Ny Y st st
性质4
ˆ 是 Y 的无偏 对于一般的分层抽样,如果 Y st
ˆ 的方差为: ˆ 是Y的无偏估计。Y 估计,则 Y st st
ˆ ˆ N 2V Y V Y st st
2 L 2 h h
ˆ N W V Y ˆ N V Y

L h 1 h 1 2 h h
性质 5
ˆ 的方差为: 对于分层随机抽样, Y st
L
2 L 1 f S ˆ N2 2 h h ˆ N 2V Y V Y S N ( N n ) st h h h h h h h n nh h 1 h 1 h 1 h

证明:当总样本量n比较大时,有 xst X
所以 y Y y st X R X X ( y Rx st ) y Rx st RC st st x st x st 于是
E ( y RC Y ) E( y st Rx st ) E ( y st ) RE ( x st ) Y RX 0
联合比估计

定义: 对于分层随机抽样,总体均值Y 和总体总量 Y 的联合比估计为
ˆ X y st X y RC R c x st
y st ˆ YRC Rc X X x st
y st Wh y h和 x st Wh x h 分别是 Y 和 X 的分层简单估计量;
h 1 L
h 1 h 1 L L
ˆ N y N [ y ( X h x h )] Y lrs h h lrs h
h 1
L
当各层的回归系数
L
ˆ ) MSE (YRC ) V (Y RC
L
2 Nh (1 f h ) 2 2 ( S yh R 2 S xh 2 R h S yh S xh ) nh h 1
2 2 S yh , S xh , h 分别为第h层指标Y和X的方差以及相关
系数;R为总体比率, R Y / X Y / X 。
2 h
L
性质 10
对于分层随机抽样,总体中具有指定特征
的单元总数A的简单估计量为:
ˆ Np N A Wh ph st st
h 1 L
N
h 1
L
h
ph
且具有如下性质:
ˆ ) A E( A st
2 N h nh P h Qh ˆ V Ast N h N h 1 nh h 1

E ( y RC ) Y
令 Ghi Yhi RX hi 又令 gst yst Rxst 因此
则 Gh Yh RX h 则
E ( gst ) 0
2 V ( y RC ) E ( y RC Y ) E ( y st Rx st )2 E ( g st )
1 Nh Y Y R X X hi h hi h N h 1 i 1
相关主题