当前位置:文档之家› 初级1 -第四章分层随机抽样

初级1 -第四章分层随机抽样


各层可以采用不同的抽样方法,只要相应的估计 量是无偏的,则对总体的推算也是无偏的。
抽样调查
原理与方法
证明性质1
L L ˆ ˆ ˆ E Yst E WhYh Wh E Y h h1 h1 L L 1 1 L Y WhYh N hYh Yh Y N h1 N h1 N h 1

抽样调查
原理与方法
性质6:对于分层随机抽样, 偏估计为:
ˆ VY
的一个无
2 h
1 f h 2 ˆ v Y N v y h N sh nh h 1 h 1
L 2 h L

抽样调查
原理与方法
例3.1
调查某地区的居民奶制品年消费支出,以居民户为抽样单 元,根据经济及收入水平将居民户划分为 4层,每层 按简单随机抽样抽取10户,调查获得如下数据(单位 :元),要估计该地区居民奶制品年消费总支出及估 计的标准差。
首先,根据分层的目的确定分层的标志,也就是 应根据研究的需要来分层。分层的目的不同,分层的
标志通常也不一样:为了便于抽样的组织管理,可以按总体单 元的组织系统来分层;为了了解各地区子总体的情况,可以按 地区来分层;为了提高抽样效率,可以把标志值大小相近的单 元划在同一层内,按标志值大小分层。上述分层目的如果能够 统一起来则最佳,如果不能统一则需要权衡利弊,服从主要目 的。另外,当分层的目的是为了提高抽样效率时,由于现实中 的调查通常是多指标的,那么就会有以哪个指标作为分层标志 的问题。这时需要视具体情况来决定是按照主要指标来分层, 还是施行照顾多数指标的折衷方案来分层。
果用于分层的指标是属性变量,如性别、行政区划等,通常可按其分类 值直接进行划分。但有时候也需要根据研究目的来确定层的粗细,比如 全国按地区分层,既可以按行政区划的省、市分层,也可以按经济发展 情况将几个省市归并在一起作为一个层。而如果用于分层的指标是数值 型变量,例如工业企业可按产值或增加值分层,人口可按年龄分层等, 这时划分多少个层,就具有很大的灵活性。此时需要综合考虑研究目的 、抽样框的可获得性、如何提高抽样效率等多方面的因素,做到恰当的 分层。


h 1

ˆ W 2V Y ˆ VY h h st


抽样调查
原理与方法
性质2:对于分层随机抽样, y st 是 Y y st 的方差为: 的无偏估计,
1 fh 2 V yst W V yh W Sh nh h1 h1
L 2 h L 2 h
差异。
抽样调查
原理与方法
2. 可对各层进行估计
分层抽样不仅能对总体指标进行推算,而且能够对各层指标进行 推算。有时候,调查的目的不仅要推算总体指标,而且需要推 算各层的指标。例如,某省准备实施一项针对全省中小企业的 调查,以了解它们的生存状况,要求最终能给出各企业所属行 业的相关指标。从而,如果按行业进行分层,调查所得的样本 则不仅能推算全省的指标,还能对各个行业的相关指标进行推 算。
抽样调查
原理与方法
证明性质2:
E y h Yh
对于分层随机抽样,各层独立进行简单随机抽样 ,对每一层有
因此,由性质1,有
E y st Y L V y st Wh2V y h
h 1
1 f 2 h 由第二章性质2,得 V yh Sh nh L L 2 2 1 fh 2 因此 V yst Wh V yh Wh Sh nh h1 h1
2 L
抽样调查
原理与方法
第四章
分层随机抽样
二、特点 1. 提高估计精度
分层抽样如果实施的好,将可以提高整体估计的精度,即抽 样效率较高。这是因为分层抽样估计量的方差只和层内方差 有关,和层间方差无关。因此,人们可以通过对总体分层, 尽可能地降低层内差异,使层间差异尽可能大,从而提高估 计的精度。比如,不同年龄的人血压值通常存在很大差异, 因此在研究血压的时候,按照不同的年龄分类是很有意义的 。在研究地区农作物产量的时候,按照地形的不同分类也是 很有意义的,沼泽地里的农作物和森林里的农作物就有很大
抽样调查
原理与方法
3.目标总体应具有这样的结构:即对总体分层后能使得层内 单元的标志值尽量相近,而层间单元的差异尽可能大。这 时,分层抽样能够达到提高抽样估计精度的目的。 4.既按类型又按层内单元标志值相近的原则进行多重分层, 可同时达到实现估计类值和提高估计精度的目的。
抽样调查
原理与方法
四、实施方法
nh 1 2 2 sh yhi yh nh 1 i1
抽样调查
原理与方法
第四章
分层随机抽样
nh fh Nh
nL n NL N
第 h 层抽样比
Nh Wh 第 i 层权数 N
n1 n2 等比例抽样 N1 N 2
N h nh n 即: N
不等比抽样
N h nh N n
抽样调查
原理与方法
性质3:对于分层随机抽样, V yst 的一个无 偏估计为:ቤተ መጻሕፍቲ ባይዱ
1 fh 2 v y st W v y h W sh nh h 1 h 1
L 2 h L 2 h
抽样调查
原理与方法
证明性质3:
对于分层随机抽样,各层独立进行简单随 机抽样,由第二章性质3,得 V y 的无偏 估计为: 1 fh 2
由于对每一层有
因此,

ˆ Y EY h h


估计量的方差 L L L L ˆ V W Y ˆ W 2V Y ˆ 2 ˆ ,Y ˆ VY W W Cov Y st h h h h h k h k h 1 k h h1 h1 由于各层是独立抽取的,因此上式第二项中的协方差全为 0,从而有 L
抽样调查
原理与方法
第二节 估 计 量
一、对总体均值的估计 分层样本,总体均值 Y 的估计
1 Yst Wh Yh N h 1
L
L
N Y hh
h 1
L
分层随机样本,总体均值 Y 的简单估计
1 y st Wh y h N h 1
N
h 1
L
h
yh
抽样调查
原理与方法
估计量的性质
是 Y 的无 性质1:对于一般的分层抽样,如果 Y h h 是 Y 的无偏估 偏估计( h 1,2, , L ),则 Y st 计。 Yst 的方差为:
W 2V Y V Y h h st
h1

L

只要对各层估计无偏,则总体估计也无偏。
如果得到的是分层随机样本,则总体总量 的简单估计为:
Y Nyst
抽样调查
原理与方法
2.估计量的性质
性质4:对于一般的分层抽样,如果 Y st ˆ 是 Y 的无偏估 是 Y 的无偏估计,则 Y ˆ 的方差为: 计。 Y
2 ˆ ˆ ˆ V Y N V Yst V Y h
2 L 2 h
2 1
f2
f3
n2 10 0.025 N 2 400
n3 10 0.0133 N3 750
y2 105
抽样调查
原理与方法
三、分层原则
根据分层抽样的特点,分层除了可以提供层指标和便于调查的组织实施,通 常,使用分层抽样的主要目的是为了提高估计的精度。 总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个 层或不属于任何一个层。 分层抽样通常考虑如下原则:
1.可以对调查对象按不同类型进行划分,划分后层内单元具有相同性 质。这时,分层抽样能够对每一类的目标量进行估计。 2.为了方便抽样的组织和实施,通常按行政管理机构设置进行分层。
抽样调查
原理与方法
其次,实施分层抽样,要求事先掌握总体单元的有关 信息,如分层的抽样框,分层后各层的总体单元数 等。但在某些场合,我们可能没有层的抽样框。这时可以采用先抽样
,再根据样本单元进行分层的办法。这种分层称作事后分层,将在本章 的后面加以介绍。
最后,要确定层的划分界限,即划分多少层的问题。如


L
2 ˆ ˆ N W V Yh N h V Yh h1 h1

h 1
L


抽样调查
原理与方法
ˆ 的方差为: 性质5:对于分层随机抽样, Y
2 2 1 fh 2 ˆ V Y N h V yh N h Sh nh h1 h1 L L
层 居民户 总数
200 400 750 1500
样本户奶制品年消费支出
1 10 50 180 50 2 40 130 260 35 3 0 60 110 15 4 110 80 0 0 5 15 100 140 20 6 10 55 60 30 7 40 160 200 25 8 80 85 180 10 9 90 160 300 30 10 0 170 220 25
抽样调查
原理与方法
3. 便于组织
分层抽样实施起来灵活方便,也便于组织。一方面,由于抽样在各层 独立进行,因而允许我们视层内的具体情况采用不同的抽样方 法。例如,在一个商业调查中,规模较大的公司可能采取邮寄 的方式调查,而小的公司可能采用入户调查或者电话调查的方 式。再比如,对于某些调查,针对城市和农村可能要采用不同 的调查方法。另一方面,分层抽样的数据处理比较简单,各层 的数据处理可以单独进行,而层间汇总方式又非常简单,对估 计量而言仅是对均值估计的加权平均或是对总量估计的简单相 加,相应的精度估计也不复杂。
h
v y h
2 h
V yst 的一个无偏估计为: 因此,
nh
sh
相关主题