当前位置:文档之家› 第三章分层随机抽样

第三章分层随机抽样


一.总体均值的估计
(一)简单估计量的定义
对于分层样本,对总体均值 的估计是通过对
各层的 公式为:
的估计,按层权 Wh 加权平均得到的。
Yˆst
L WhYˆh
h1
1 N
L NhYˆh
h1
2020/11/30
12
如果得到的是分层随机样本,则总体均值 Y 的简单
估计为:
(二)估计量的性质
性质1 对于一般的分层随机抽样,如果 Yˆh 是 Yh
4 1500 50 35 15
的一个无偏估
L
v( yst ) Wh2v( yh ) h1
L
Wh 2
h1
1
f nh
h
sh
2
L Wh2sh2 L Whsh2
n h1
h
h1 N
2020/11/30
16
▪ 注:
当 Nh,nh与Nh nh 适当的大,各层样本
平均数 yh 均可适用正态近似,因此一般地 yst
也适用于正态近似其置信区间。
2020/11/30
17
二.总体总量的估计
(一)简单估计量的定义
总体总量Y的估计为:
分层随机样本: Yˆ Nyst
(二)估计量的性质
性质4 对于一般的分层抽样,如果 是Y的无偏估计。
Yˆ 的方差为:
2020/11/30
是 Y 偏估计,则Yˆ
18
2020/11/30
19
性质5 对于分层随机抽样, 的方差为:
的无偏估计(h=1,2,…L),则 Yˆst 是Y 的无偏估计。
即对各层估计是无偏的,则对总体的估计也是无
偏的。
Yˆst 的方差为:
V Yˆst L Wh2V Yˆh
h1
由于各层的抽样
2020/11/30
是相互独立的
13
证明:因各层抽样是相互独立,则Yˆh 也相互独立,
则有 cov Yˆh , Yˆ j 0
第三章 分层随机抽样
3.1 概述 3.2 简单估计量及其性质 3.3 样本量在各层的分配 3.4 回归估计量及其性质 3.5 各层样本量的分配 3.6 总样本量的确定
2020/11/30
1
▪ 简单随机抽样只适合小型的抽样调查: 1. 抽样框 2. 代表性 如:了解中国各民族的情况:(鄂伦春族)
2020/11/30
4
分层随机抽样三原则: (1)每层都抽样; (2)各层都独立地抽样; (3)各层的抽样都是简单随机抽样。
2020/11/30
5
(二)特点:
1.分层抽样的抽样效率较高,也就是说分层 抽样的估计精度较高。
注意:
分层抽样估计量的方差只和层内方差有关, 和层间方差无关。
2.分层抽样不仅能对总体指标进行推算, 而且能对各层指标进行推算。
2020/11/30
3
各层中的抽样是独立进行的,因此,在各 层中所采取的抽样手段完全可以不相同, 在一个层进行简单随机抽样,在另一层则 可采用更复杂一些的抽样,完全视各层的 情况不同而定,这种因地制宜的手段将使 样本尽可能反映总体的特性以及子总体的 特性。 分层抽样有时也称为类型抽样或分类抽样。
2020/11/30
从该层中抽取的样本的单元值为: yhi (i 1,2,..., nh )
层权:
Wh
Nh N
抽样比: fh
nh Nh
总体均值:Yh
1 Nh
Nh
Yhi
i 1
2020/11/30
样本均值:yh
1 nh
nh i1
yhi
10
▪ 层内方差: ▪ 样本方差:
2020/11/30
11
第二节 简单估计量及其性质
如:消费物价指数(全国和各省) 3.层内抽样方法可以不同,而且便于抽样
工作的组织。
2020/11/30
6
(三)作用
可以对各层的参数进行估计, 有助于提
高估计精度。
2020/11/30
7
二.使用场合
应用条件: 适合于各层差异较大,有进行分层的辅助信息。
层的划分原则: 1.层内单元具有相同性质,通常按调查对象的不同类型进
V (Yˆ)
L h1
Nh2V (Yˆh )
L h1
Nh2
1
f nh
h
S
h
2
性质6 对于分层随机抽样,
的一个无偏估计为:
v(Yˆ)
L h1
Nh2v( yh )
L h1
Nh2
1 fh nh
sh 2
2020/11/30
20
【例3.1】调查某地区的居民奶制品年 消费支出,以居民户为抽样单元,根据经 济及收入水平将居民户划分为4层,每层 按简单随机抽样抽取10户,调查获得如 下数据(单位:元),估计该地区居民奶
2
第一节 概述
一.定义与作用 (一)分层抽样和分层随机抽样
不重 不漏
先将总体N个单元划分成L个互不重复的子总体,每个子
总体称为层,它们的大小分为别
,这L个层
合起来就是整个总体(N=
)。
然后,在每个层中分别独立进行抽样,这种抽样就是分层抽样,
所得到的样本称为分层样本。如果每层都是简单随机抽样,则 称为分层随机抽样,所得到的样本称为分层随机样本。
行划分,这时,分层抽样能够对每一类的目标量进行估 计。 2.尽可能使层内单元的标志值相近,层间单元的差异尽可 能大,从而达到提高抽样估计精度的目的。 3.既按类型又按层内单元标志值相近的原则进行多重分 层,同时达到实现估计类值以及提高估计精度的目的。 4.为了抽样组织实施的方便,通常按行政管理机构设置进 行分层。
2020/11/30
8
如:对全国汽车货运量调查,目的是不仅要 了解全国货运量,而且推算不同经济成分 货运量。
首先为组织方便,按省分层;各省再按 经济成分分层;为提高抽样效率,再按吨位 分层。
2020/11/30
9
三.符号说明
层号:h(h=1,2…,L) 第h层的记号如下: 单元总数: 样本单位数: 第i个单元标志值为: Yhi (i 1,2,..., Nh )
V Yˆst
V
L WhYˆ h
h1
L h1
Wh2V
Yˆ h
L
2
L WhWjcov Yˆ h , Yˆ j
h1 jh
L 对于分层随机抽样 , 是 的无偏估计, 的方差为:
2020/11/30
15
性质3 对于分层随机抽样, 计为:
制品年消费总支出及估计的标准差。
2020/11/30
21
样本户奶制品年消费支出
层 居民户
样本户奶制品年消费支出
总数









10
1 200 10 40
0 110 15 10 40 80 90
2 400 50 130 60 80 100 55 160 85 160 3 750 180 260 110 0 140 60 200 180 300
相关主题