讲稿3-分层抽样
10 750
1 n1
y 1
i 1
n1
1i
y 1 1 6 2 4 .7 2 2
2
s 2 2 1 6 6 .6 6 7
2
400 2850
0 .1 4 0 3 5
0 .0 2 5
y2 105
W3
N3 N
0 .2 6 3 1 6
f3
0 .0 1 3 3
y3 165
h 1
L
N h N h n h Ph Q h
2
Nh 1
nh
h 1
L h 1
1 N
2 h
N
2
N h
N
h
n h Ph Q h nh
W 1
fh
Ph Q h nh
2013-6-21
22
V 性质9:对于分层随机抽样, p 的一个无偏估计为:
st
v p st
ˆ E Yh Yh
ˆ V Y st
估计量的方差
L ˆ V W hYh h 1
h 1
L
ˆ 2 W h V Yh 2
L
L
ˆ ˆ W h W k Cov Y h , Y k
h 1 k h
由于各层是独立抽取的,因此上式第二项中的协方差全 L 为0,从而有 ˆ ˆ 2 V Y st W h V Y h
24
解:由上表可得,
h
p 4 0 .1
p 3 0 .4
p 2 0 .2
p 1 0 .2
根据前面对各层层权 W 及抽样比
v p 2 1 f 2 v p 4 1 f 4 p2q2 0 .0 1 7 3
fh
的计算结果,可得各层估计量的方差:
二、分层原则:
总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个 层或不属于任何一个层。
1.估计:层内单元具有相同性质,通常按调查对 象的不同类型进行划分。 2.精度:尽可能使层内单元的指标值相近,层间 单元的差异尽可能大,从而达到提高抽样估计精 度的目的。 3.估计和精度:既按类型、又按层内单元指标值 相近的原则进行多重分层,同时达到实现估计类 值以及提高估计精度的目的。 4.实施:抽样组织实施的方便,通常按行政管理 机构设置进行分层。
2
1 Nh 1
y
i 1
hi
Yh
2
总体方差
样本方差
sh
2
1 nh
2013-6-21
y hi 1
i 1
yh
2
6
第二节
估 计 量
一、对总体均值的估计 分层样本,总体均值 Y 的估计
Y st
h 1
L
W h Yh
1 N
h 1
L
N h Yh
5
2013-6-21
三、符号说明 (关于第h层的记号 )
层号
h 1, 2 , , L
单元总数
N
h
样本单元数
第 i个单元的值
nh
y hi
Wh N N
h
层权
抽样比
Yh 1 N
Nh
h
fh
nh N
h
i 1
Nh
y hi
总体均值
样本均值
yh 1 nh
nh
i 1
nh
y hi
Sh
s 3 8 2 0 5 .5 5 6
2
2850
W4
N4 N
1500 2850
0 .5 2 6 3 2
f4
n4 N4
10 1500
0 .0 0 6 7
y4 24
s 4 1 9 3 .3 3 3
2
2013-6-21
19
ˆ Y
h 1
2
4
N h yh
2 0 0 3 9 .5 4 0 0 1 0 5 7 5 0 1 6 5 1 5 0 0 2 4
第三章 分层随机抽样
第一节 第二节 第三节 第四节 第五节 分层随机抽样的定义、使用场合以及符号 估计量及其性质 样本量的分配原则 样本量的确定 分层抽样的若干问题
2013-6-21
1
第一节
一、定义
引
言
不重 不漏
在抽样之前,先将总体N个单元划分成L个互不 重复的子总体,每个子总体称为层,它们的大 小分别为 N 1 , N 2 , , N L ,这个层合起来就是 N N 整个总体 ,然后,在每个层中分别 独立地 进行抽样,这种抽样就是分层抽样,所 得到的样本称为分层样本。 如果每层都是独立按照简单随机抽样进行,则 称为分层随机抽样
4
2013-6-21
例题
例如,对全国范围汽车运输的抽样调查,调查目的不 仅要推算全国货运汽车完成的运量,还要推算不同经 济成分(国有、集体、个体)汽车完成的运量。 为组织的方便,首先将货运汽车总体按省分层,由 各省运输管理部门负责省内的调查工作。 各省再将省内拥有的汽车按经济成分分层。 为提高抽样效率,再对汽车按吨位分层。 例如,某高校对学生在宿舍使用电脑的情况进行调查, 根据经验,本科生和研究生拥有电脑的状况差异较大。 因此,在抽样前对学生按本科生和研究生进行分层 是有必要的。
2013-6-21 14
2.估计量的性质
Yst
性质4:对于一般的分层抽样,如果 是 Y 的无偏估计,则 Yˆ 是 Y 的无偏估 计。Yˆ 的方差为: L
ˆ ˆ N 2V Y V Y st
N
2
ˆ V Yh
2
h 1
L
ˆ W h V Yh
2
h 1
st
v y st
W v y W
2 h h h 1 h 1
L
L
2 h
1 fh nh
sh
2
2013-6-21
12
证明性质3:
对于分层随机抽样,各层独立进行简单随 V 机抽样,由第二章性质3,得 y 的无偏 1 fh 2 估计为: vyh sh nh V 因此, y 的一个无偏估计为:
h 1
4
Wh ph
1 N
h 1
4
N h ph
1 2850
2 0 0 0 .2
4 0 0 0 .2 7 5 0 0 .4 1 5 0 0 0 .1
209650
ˆ v Y N
ˆ s Y
Yˆ
W h v yh
2 h 1
4
h 1
4
Nh
2
1 fh nh
s h 5 .9 3 1 0
2
8
v Yˆ 2 3 2 0 8
ˆ ts Y 2 0 9 6 5 0 2 2 3 2 0 8
h 1
N hV yh
2
h 1
L
Nh
2
1 fh nh
Sh
2
2013-6-21
17
例3.1
调查某地区的居民奶制品年消费支出,以居民户为抽 样单元,根据经济及收入水平将居民户划分为4层,每 层按简单随机抽样抽取10户,调查获得如下数据(单 位:元),要估计该地区居民奶制品年消费总支出及 估计的标准差。
20
2013-6-21
三、对总体比例的估计
总体比例P的估计为:p
估计量的性质
st
W
h 1
L
h
ph
性质7:对于一般的分层抽样,如果 p h是 Ph 的无偏估计 (h 1, 2 , , L ),则 p st 是 P 的无偏估计。 的方差为: p
st
V p st
h 1
h 1
L
ˆ N h V Yh
15
2013-6-21
性质6:对于分层随机抽样, V Yˆ 的一个 无偏估计为:
ˆ vY
N
L h 1
2 h
vyh
h 1
L
Nh
2
1 fh nh
sh
2
2013-6-21
16
性质5:对于分层随机抽样, Yˆ 的方差为:
L
ˆ V Y
W v p
2 h h h 1
L
1 N
2
h 1
L
N h 1 f h
2
nh
sh
2
W 1
2 h h 1
L
fh
phqh nh 1
2013-6-21
23
例3.2
在例3.1的调查中,同时调查了居民户拥有家 庭电脑的情况,获得如下数据(单位:台), 要估计该地区居民拥有家庭电脑的比例及估计 的标准差。
2013-6-21
h 1
9
性质2:对于分层随机抽样, y 是 Y y 的无偏估计, st 的方差为:
st
V y st
W
h 1
L
2 h