当前位置:文档之家› 抽样理论与方法:分层随机抽样

抽样理论与方法:分层随机抽样

总体第h层 Yh Yhi Yh 1 Yhi N h i1
i 1 Nh Nh
第h层样本 y h y hi yh 1 y hi n h i1
i 1 nh nh
Nh nh 1 1 2 2 2 2 Sh ( Y Y ) s ( y y ) h h h N h 1 i1 hi n h 1 i1 hi
层 居民 户总 数 1 200 样本户奶制品年消费支出 1 10 2 40 3 0 4 110 5 15 6 10 7 40 8 80 9 90 10 0
2
3 4
400
750 1500
50
180 50
130
60
80
0 0
100
140 20
55
60 30
பைடு நூலகம்
160
85
160
300 30
170
220 25
260 110 35 15
4.2
简单估计量及其性质
对总体均值或总值的估计:
设总体分为 L层,以h表示层的编号, h1 , 2, ,L
总体(N) N1, ,N L 样本(n) n1, ,n L
N
i 1 L
L
h
N n
n
i 1
h
N h / N Wh 层权
总体第h层有N h 个总体单元:Yh1, ,Yhi, ,YhNh 第h层样本有nh 个样本单元:y h1, ,y hi, ,y hnh
200 39.5 400 105 750 165 1500 24 209650 ˆ 的方差V( Y ˆ )的估计: ( 2)Y
2 1 fh 2 ˆ v( Y ) v( N y st ) N h s h 5.39 108 nh h 1 L
^
Y 的方差V( y st )的无偏估计: v( y st ) Wh
2 h 1 L
1 fh 2 sh nh
例3.2 调查某地区的居民奶制品年消费支出,以居民 户为抽样单元,根据经济及收入水平将居民户分为4 层,每层按简单随机抽样抽取10户,调查数据如下, 估计该地区居民奶制品年消费总支出及估计的标准差。 样本户奶制品年消费支出
h1 h1
^
L
^
L
^
1 fh 2 y st的方差为V(y st) Wh V(y h) Wh Sh nh h 1 h 1
L 2 L 2
^
Y 的方差V( y st )的估计: v( y st ) Wh
2 h 1 L
1 fh 2 sh nh
且为V(y )的无偏估计。
二、分层抽样的适用场合 不仅需要估计总体参数,也需要估计各层参数。 便于管理,按现成的地理分布或行政划分来分层。 希望样本中能包含各个部分,以增加代表性。 把一个内部差异很大的总体分成几个内部比较相似的 子总体(层)进行分层抽样,可以提高估计量的精度。 如果有极端值,也可以把它们分离出来形成一层。即 “层间方差大,层内方差小”。 三、进行分层抽样时,应注意的方面 层内抽样设计的选择。 分层变量的选择。 各层样本量的分配,样本总量的确定。 层数。 层的分界。
200 180 25 10
解:
2 y 1 39.5 s1 1624.722
y 2 105 各层样本均值及方差为: y 3 165 y 4 24
s2 2 2166.667 s2 3 8205.556 2 s4 193.333
ˆ Nh y h (1)Y
h 1
L
Y的置信度为1 的置信区间为: y st u1 s( y st ), y st u1 s( y st ) 2 2
2.总体总和Y的估计: ˆ Y ˆ h Nh Yh Nh y h Y
h 1 h 1 h 1 2 1 fh 2 ˆ ˆ 方差V(Y) V(Yh) N h V(y h) N h Sh nh h 1 h 1 h 1 L L 2 L L L ^ L
例4.1 总体由1000人组成,按以往的收入情况将总体分成 两层:第一层(高收入层),20人;第二层(低收入 层),980人。从第一层随机抽取2人,调查上月收入, 得数据(单位:元)1200及1600;从第二层随机抽取8人, 调查上月收入,得数据(单位:元)220、230、180、 320、400、340、280、360。估计这1000人上月平均收入。 解: ˆ1 Y ˆ 2 N1 y 1 N 2 y 2 Y ˆ Y W1 y 1 W2 y 2 N N 20 980 1400 291.25 313.43 1000 1000 对比:
1200 1600 220 360 y 513 10
一、分层抽样中,
若对任一层,假设为第h层,都有 Y h N Y h , Y Yh
h 1 L
ˆ ˆ Y ˆ h Nh Y (1)Y h
h 1 h 1
L
L
ˆ) ˆ ) V(Y ˆ h) N h 2 V(Y 方差V(Y h
h 1 h 1
L
L
ˆ ( 2) Y st
ˆ Y
h 1
L
h
N
L Nh ˆ ˆ Yh Wh Y h N h 1 h 1 L
L
ˆ ) W 2 V( Y 方差V(Y h ˆh) st
h 1
^
分层随机抽样, 则 Y h 的简单估计为y h
1.Y的无偏简单估计Yst 为:y st Wh Yh Wh y h , Yst 记为y st
分层随机抽样
4.1
概述
一、分层抽样(stratified sampling)、分层随机抽样 (stratified random sampling) 分层抽样:将容量为N的总体分成L个不相重叠的子总 体,子总体的大小分别为N1、 N2、… NL,皆已知,且
N
i 1
L
h
N
则每个子总体就称为层。从每层中独立地进行抽样, 这样的抽样方法称为分层抽样。 分层随机抽样:在分层抽样中,如果每层中的抽样都 是简单随机抽样,则这样的分层抽样称为分层随机抽 样。
相关主题