当前位置:
文档之家› 分层随机抽样概述(PPT 148页)_8284
分层随机抽样概述(PPT 148页)_8284
估计为:
L
1L
yst Whyh
h1
Nh1Nhyh
(二)估计量的性质
性质1 对于一般的分层随机抽样,如果 Yˆh 是 Y h
的无偏估计(h=1,2,…L),则 Yˆst 是Y 的无偏估计。
即对各层估计是无偏的,则对总体的估计也是无
偏的。
Yˆst 的方差为:
VYˆst L Wh2VYˆh
L
合起来就是整个总体(N=
N h )。
h 1
然后,在每个层中分别独立进行抽样,这种抽样就是分层抽样,
所得到的样本称为分层样本。如果每层都是简单随机抽样,则 称为分层随机抽样,所得到的样本称为分层随机样本。
2021/2/27
3
各层中的抽样是独立进行的,因此,在各 层中所采取的抽样手段完全可以不相同, 在一个层进行简单随机抽样,在另一层则 可采用更复杂一些的抽样,完全视各层的 情况不同而定,这种因地制宜的手段将使 样本尽可能反映总体的特性以及子总体的 特性。 分层抽样有时也称为类型抽样或分类抽样。
从该层中抽取的样本的单元值为: yh(ii1,2,..n .h,)
层权:
Wh
Nh N
抽样比: f h
nh Nh
总体均值:Yh
1 Nh
Nh
Yhi
i1
2021/2/27
样本均值:yh
1 nh
nh i1
yhi
10
▪
层内方差:
Sh2
1 Nh
2
Nh1i1(YhiYh)
▪ 样本方差: sh2 nh11inh1(yhiyh)2
2021/2/27
4
分层随机抽样三原则: (1)每层都抽样; (2)各层都独立地抽样; (3)各层的抽样都是简单随机抽样。
2021/2/27
5
(二)特点:
1.分层抽样的抽样效率较高,也就是说分层 抽样的估计精度较高。
注意:
分层抽样估计量的方差只和层内方差有关, 和层间方差无关。
2.分层抽样不仅能对总体指标进行推算, 而且能对各层指标进行推算。
分层随机抽样概述(PPT 148页)
▪ 简单随机抽样只适合小型的抽样调查: 1. 抽样框 2. 代表性 如:了解中国各民族的情况:(鄂伦春族)
2021/2/27
2
第一节 概述
Байду номын сангаас
一.定义与作用 (一)分层抽样和分层随机抽样
不重 不漏
先将总体N个单元划分成L个互不重复的子总体,每个子
总体称为层,它们的大小分为别 N1,N2,..N .L,这L个层
也适用于正态近似其置信区间。
2021/2/27
17
二.总体总量的估计
(一)简单估计量的定义
总体总量Y的估计为: Yˆ NYˆst L Yˆh h1
分层随机样本: Yˆ Nyst
(二)估计量的性质
性质4 对于一般的分层抽样,如果Yˆst 是 Y 偏估计,则Yˆ
是Y的无偏估计。
Yˆ 的方差为:
2021/2/27
11
第二节 简单估计量及其性质
一.总体均值的估计
(一)简单估计量的定义
对于分层样本,对总体均值Y 的估计是通过对
各层的Y h 公式为:
的估计,按层权 W h 加权平均得到的。
YˆstL WhYˆh h1
N 1hL 1NhYˆh
2021/2/27
12
如果得到的是分层随机样本,则总体均值 Y 的简单
行划分,这时,分层抽样能够对每一类的目标量进行估 计。 2.尽可能使层内单元的标志值相近,层间单元的差异尽可 能大,从而达到提高抽样估计精度的目的。 3.既按类型又按层内单元标志值相近的原则进行多重分 层,同时达到实现估计类值以及提高估计精度的目的。 4.为了抽样组织实施的方便,通常按行政管理机构设置进 行分层。
h1
由于各层的抽样
2021/2/27
是相互独立的
13
证明:因各层抽样是相互独立,则Yˆh 也相互独立,
则有 covYˆh,Y ˆj 0
VYˆst
VhL1WhY ˆhhL 1Wh2VY ˆh
L
2
L WhWjcoY vˆh,Y ˆj
h1 jh
L Wh2VYˆh h1
2021/2/27
性质6 对于分层随机抽样, V (Yˆ ) 的一个无偏估计为:
v(Y ˆ)hL 1N h2v(yh)hL 1N h21 nhfhsh2
2021/2/27
20
P69
【例3.1】调查某地区的居民奶制品年 消费支出,以居民户为抽样单元,根据经 济及收入水平将居民户划分为4层,每层 按简单随机抽样抽取10户,调查获得如 下数据(单位:元),估计该地区居民奶
2021/2/27
18
V (Yˆ ) V
N Y st
N 2V (Yˆst )
L
V (Yˆh )
N2LW h2V(Yˆh)L
h 1
Nh2V(Yˆh)
h1
h1
2021/2/27
19
性质5 对于分层随机抽样,Yˆ 的方差为:
V (Y ˆ)hL 1N h2 V (Y ˆh)hL 1N h21 nhfhSh2
14
性质2 对于分层随机抽样 , y st 是 Y y st 的方差为:
的无偏估计,
V ( yst )
L
Wh2V ( yh )
h1
L
Wh 2
h1
1 fh nh
Sh2
L Wh2
h1
1 nh
1 Nh
Sh
2
L Wh2Sh2 L WhSh2
h1 nh
h1 N
2021/2/27
15
性质3 对于分层随机抽样, V ( yst ) 的一个无偏估 计为:
2021/2/27
8
如:对全国汽车货运量调查,目的是不仅要 了解全国货运量,而且推算不同经济成分 货运量。
首先为组织方便,按省分层;各省再按 经济成分分层;为提高抽样效率,再按吨位 分层。
2021/2/27
9
三.符号说明
层号:h(h=1,2…,L) 第h层的记号如下: 单元总数:N h 样本单位数:n h 第i个单元标志值为: Yh(ii1,2,..N .h ,)
L
v ( y st ) W h 2 v ( y h ) h 1
L h 1
W
2 h
1
fh nh
sh
2
L W h 2 s h 2 L W h s h 2
h1 n h
h1 N
2021/2/27
16
▪ 注:
当 Nh, nh与 Nhnh适当的大,各层样本
平均数 y h 均可适用正态近似,因此一般地 y st
如:消费物价指数(全国和各省) 3.层内抽样方法可以不同,而且便于抽样
工作的组织。
2021/2/27
6
(三)作用
可以对各层的参数进行估计, 有助于提
高估计精度。
2021/2/27
7
二.使用场合
应用条件: 适合于各层差异较大,有进行分层的辅助信息。
层的划分原则: 1.层内单元具有相同性质,通常按调查对象的不同类型进