当前位置:
文档之家› 抽样技术课件 第三章(分层抽样)
抽样技术课件 第三章(分层抽样)
估计量方差的证明
在一般分层抽样下
L L L L ˆ V W Y ˆ W 2V Y ˆ 2 ˆ ,Y ˆ VY W W Cov Y st h h h h h k h k h 1 k h h1 h1 L ˆ ˆ V Y W 2V Y
L 2 h L L 2 h
1 2 N
2 L Nh ( N h nh ) PhQh PhQh 2 Wh (1 f h ) Nh nh nh h 1 h 1
性质二的证明:
ph qh v( pst ) W v( ph ) W (1 f h ) nh 1 h 1 h 1
ˆ 2 2 1 fh 2 V (Yst ) V ( yst ) Wh V ( yh ) Wh Sh nh h 1 h 1
L L
1 fh 2 v( yst ) W v( yh ) W sh nh h 1 h 1
L 2 h L 2 h
无偏性的证明
在一般分层抽样下
ˆ Y EY h h
30
200
25
180
10
300
30
220
25
N1 200 N 2850 W1 0.07018 N 2850 n1 10 f1 0.05 nh 10 N1 200 n1 n1 1 2 2 1 y1i y1 1624.722 y1 y1i 39.5 s1 n1 1 i 1 n i 1
L L ˆ E W Y ˆ W EY ˆ EY st h h h h h1 h1
L
1 L 1 L Y WhYh N hYh Yh Y N h1 N h1 N h 1
在分层随机抽样下
ˆ y Y h h
所以无偏性也成立
h 1
L
L
ˆ ) N 2 W 2V (Y ˆ) ˆ ) N V (Y V (Y st st h h
2 h 1
注意:总体总量的估计,完全可以由总体均值来推算,因为它们只
相差一个常数。
性质二(分层随机抽样)
ˆ 是Y的无偏估计,即 ˆ ) Y Y E ( Y st st
ˆ ) N V(y ) N V (Y st st
i 1
ˆ Ny N W y Y st st h h
h 1
L
简单估计量: 由于没有其他总体信息的,这也是总体的简单估计量。
性质一(一般的分层抽样)
• 对于一般的分层抽样,如果每层的均值都是无 偏估计,则总体总量也是无偏估计。
ˆ ) N W E (Y ˆ) ˆ ) E ( NY E (Y h h st st
二、估计量
1、简单估计量
– 总体均值的估计 – 总体总量的估计 – 总体比例的估计
2、比率估计量
– 分别比率估计 – 联合比率估计
一、简单估计量
总体均值的估计 总体均值的期望 总体均值的方差 总体总量的估计 总体均值的期望 总体均值的方差 总体比例的估计 总体均值的期望 总体均值的方差
2 h
L
例3.2
• 在例3.1的调查中,同时调查了居民户拥有家庭电 脑的情况,获得如下数据(单位:台),要估计 该地区居民拥有家庭电脑的比例及估计的标准差。
例子
• 调查杭州的超市情况: 分成大超市和小超市两层。 如果在两层都独立进行简单随机抽样,则 为分层随机抽样。 如果在大超市一层中,先确定下沙物美必 定抽样。则为一般分层抽样。
3、分层抽样的符号说明
h层指标
总体指标 总体总量: N 总体层数:L 总体均值:Yst 总体总量:Yst 总体比例:Pst
2 h
4、分层抽样的作用
• 分层抽样的抽样效率比较高,也就是说分 层抽样的估计精度高。 • 分层抽样不仅能对总体指标进行推算,而 且能对各层指标进行推算。 • 层内抽样方法可以不同,而且便于抽样工 作的组织。
5、分层原则:
• 1. 估计:层内单元具有相同性质,通常按调查对 象的不同类型进行划分。 • 2. 精度:尽可能使层内单元的指标值相近,层间 单元的差异尽可能大,从而达到提高抽样估计精 度的目的。 • 3. 估计和精度:既按类型、又按层内单元指标值 相近的原则进行多重分层,同时达到实现估计类 值以及提高估计精度的目的。 • 4. 实施:抽样组织实施的方便,通常按行政管理 机构设置进行分层。
2 h 2 h
L
L
性质二的证明:
P h Qh V ( pst ) W V ( ph ) W (1 f h ) nh h 1 h 1
2 h 2 h L L
证明:因 为是分 层随机 抽样样,所 N h nh PhQh V ( ph ) , 及N h 1 N h N h 1 nh N h nh PhQh V ( pst ) W V ( ph ) W N h 1 nh h 1 h 1
E ( yst )
ˆ E(Yst )
V ( yst )
ˆ V (Yst )
E ( pst )V ( pst )
1、总体均值的估计
1 Y N
Y
i 1
N
N
i
L 1 L ˆ ˆ ˆ Yst WhYh N hY h N h 1 h 1
如果是分层随机抽样
1 Y N
Yi
i 1
层 居民户 总数 1 1 2 200 400 10 50 2 40 130 3 0 60 样本户奶制品年消费支出 4 110 80 5 15 100 6 10 55 7 40 160 8 80 85 9 90 160 10 0 170
3
4
750
1500
180
50
260
35
110
15
0
0
140
20
60
ˆ y W y Y h h st st
h 1
L
简单估计量: 由于没有其他总体信息的,这也是总体的简单估计量。
性质一(一般的分层抽样)
• 对于一般的分层抽样,如果每层的均值都是无 偏估计,则总体均值也是无偏估计。
ˆ ) E( W Y ˆ ) W E (Y ˆ) E (Y hh h h st
所以
1 fh 2 v y st W v y h W sh nh h 1 h 1
L 2 h L 2 h
2、总体总量的估计
Y Yi
i 1
N
ˆ NY ˆ Y ˆ NY Y h h ˆh st
h 1 h 1
L
L
如果是分层随机抽样
N
Y Yi
y3 165
y4 24
W4
N 4 1500 0.52632 N 2850
f4
n4 10 0.0067 N4 1500
ˆ N y Y h h
h 1
4
200 39.5 400 105 750 165 1500 24
2 2 2 1 fh 2 8 ˆ v Y N Wh v yh N h sh 5.93 10 nh h 1 h 1
209650
4
4
ˆ v Y ˆ 23208 s Y
ˆ ts Y
ˆ 209650 2 23208 Y
3、总体比例的估计 总体比例的估计,是总体均值估计的一 种特例,所以具有相同的特点。
1, Yi 0, 则有 A 1 P N N
简单估计量:
由于各层是独立进行的,所以协方差为0,即
st
h 1
h h
在分层随机抽样下,由于每层都是简单随机抽样,所以
1 fh 2 V yst W V yh W Sh nh h1 h1
L 2 h L 2 h
估计量的方差的估计的证明
在分层随机抽样下,
1 fh 2 v y h sh nh
第i个单元具有所考虑的特 征 其他
Y
i 1
N
i
Y pst Wh ph
h 1
L
由于没有其他总体信息的,这也是总体的简单估计量。
性质一(一般的分层抽样)
• 对于一般的分层抽样,如果每层都是无偏估计, 则总体比例也是无偏估计。
ˆ ) W E ( P ˆ ) E(P st h h
1
N 400 W2 2 0.14035 N 2850
f2
f3
n2 10 0.025 N 2 400
y2 105
s22 2166.667
s32 8205.556
2 s4 193.333
N 750 W3 3 0.26316 N 2850
n3 10 0.0133 N3 750
2 h 2 h
L
L
证明:因 为是分 层随机 抽样样, 所以 1 fh v ( ph ) ph qh nh 1 1 fh v( pst ) W v( ph ) W ph qh nh 1 h 1 h 1
L 2 h L 2 h
ph qh W (1 f h ) nh 1 h 1
单元总体:N h 样本单元数: nh 第i个单元标志值: yhi 层权:Wh n 抽样比:h Nh 1 h层总体均值: Yh Nh 1 h层样本均值: yh nh
2 h
Nh N
Y
i 1 nh i 1
Nh
hi
y
Hale Waihona Puke hi1 Nh h层总体方差: S (Yhi Yh ) 2 N h 1 i 1 1 nh h层样本方差: s ( yhi yh ) 2 nh 1 i 1