第四章 整群抽样
E (Yij Y )(Yik Y ) E (Yij Y )
N M i 1 j k
2
2 M
(Yij Y )(Yik Y )
NM ( M 1) 2
NC
2015/11/30
31
分母可写 成:
(Y
i 1 j k
N
M
ij
y)
2
于是
又可以写成:
N M
NM
2015/11/30 26
(一)均值估计量的定义 在群的抽取是简单随机的,且群的 大小(M)相等,则总体均值的估计为:
1 y yi n i 1 i 1 j 1 nM
n
M
yij
n
2015/11/30
27
(二)估计量 y 的性质
性质1 y 是 的无偏估计. Y
性质2
y 的方差为:
2015/11/30
12
分群的原则:
划分群时应使群内方差尽可能大,群间方差 尽可能小。(注意:这一点与分层抽样中 总体内层的划分有着极大的差别) 这意味着每个群均具有足够的代表性。如 果划分的群相互之间颇多相似之处,那么 少量群的抽取足以提供良好的精度。
2015/11/30
13
分析: 整群抽样对于群而言是非全面调查,对于被抽中群 内基本单元而言则是全面调查,是“先部分,后全体” 的抽样组织形式,与分层抽样正好相反。根据方差 分析原理,当总体划分为群后,总体方差可以分解 为群间方差和群内方差两部分。这两部分是此消 彼长的关系。由于整群抽样是对入选群中的所有 单元都进行调查,因此影响整群抽样误差的主要是 群间方差。为了提高整群抽样估计的精度,划分群 时应使群内方差尽可能大,群间方差尽可能小。
第四章 整群抽样
4.1 4.2
4.3
引言 群规模相等时的估计 总体比例的估计
2015/11/30
1
第一节 引言
一.整群抽样的定义与特点 (一)定义 整群抽样(cluster sampling)或集团 抽样,是将总体划分为若干群,然后以群为 抽样单元,从总体中随机抽取一部分群, 对中选群中的所有基本单元进行调查的一 种抽样技术。
2015/11/30 18
当各群所含次级单元数相等时,就称群的
大小相等;当各群所含次级单元数不相等 时,就称群的大小不相等。 当群的大小接近时,常采用简单随机抽样 抽取群;当群的大小相差比较大时,为提 高效率则更多地采用不等概率(按与群的 大小成比例的概率抽样)方法。
2015/11/30
19
2
2 n M
2
n
2
样本群间方差:
样本群内方差: sw
2015/11/30
1 yij yi nM 1 i 1 j 1
2
24
总体ANOVA(方差分析)表---群规模相等的整群抽样
来源
自由度
平方和
均方
群间 群内
N-1
SSB Yi Y
i 1 j 1
N
第二节 群规模相等时的估计
一.符号说明 总体有N个群,每个群包含的单元数M相等(或 相近)。 符号: 总体群数: N 样本群数: n 总体第 i 群中第 j 个单元的指标值: Yij 样本第 i 群中第 j 个单元的指标值: yij 第 i 群中的单元数: M i
2015/11/30
M1 M 2 ... M N M
NM 1 2 S MN
2015/11/30
2 (Yij Y )(Yik Y )
i 1 j k
( M 1)( NM 1) S
2
32
y
1 V ( y) V ( y) 2 M
N
的方差可以用群内相关系数近似表示:
2
1 f 1 (Yi Y ) 2 nM N 1 i 1
总体总值Y
NMY 的估计量及相应的方差为:
ˆ NMy Y 2 2 ˆ V (Y ) V ( NMy ) N M V ( y ) ˆ ) N 2 M 2 v( y ) v(Y
2015/11/30 30
三、整群抽样效率分析
整群抽样的估计精度与群内相关系数
有关。
分子可写成:
N
1 f 1 Yij Y 2 n M N 1 i 1 j 1 1 f NM 1 2 S 1 ( M 1) 2 n M ( N 1) 1 f 2 S 1 ( M 1) (当N-1=N,NM-1=NM时) 2015/11/30 nM 33
2
N(M-1) SSW
Y
N i 1 j 1
ij
Yi
2
2
SSB S N 1 SSW 2 Sw N ( M 1)
2 b
总计
2015/1பைடு நூலகம்/30
NM-1
SST Yij Y
i 1 j 1
N M
SST S NM 1
2
25
二. 估计量
整群抽样是以群为单位进行抽样,如果 群的抽取是简单随机的,则当群的大小都 相等时,可以将简单随机抽样理解为是一 种特殊的整群抽样,特别当总体分群后的 每个群都只包括一个次级单元时,整群抽 样和简单随机抽样一致。因此,整群抽样 的估计量可以比照简单随机抽样方式来构 造。
y 样本中的群均值:
i 1 n
N
yi n
总体中的个体均值:
Y Y M
22
2015/11/30
样本中的个体均值:
y y M
总体方差:
S
2
1 M0
Y 1
N M i 1 j 1
N
ij
Y
2
总体群间方差:
2 1 M Sb Yi Y Yi Y N 1 i 1 j 1 N 1 i 1 2
20
总体中单元总数:
M0 Mi
i 1
N
总体中第
i 群的群总值:
Yi Yij
j1
M
样本中第
i 群的群总值:
yi yij
j 1
M
总体中第
2015/11/30
i 群的个体均值:
Yi Yi M
21
yi 样本中第 i 群的个体均值: yi M
Y 总体中的群均值: Y i i 1 N
2015/11/30
N M
2
23
总体群内方差: 样本方差:
1 Yij Yi Sw N M 1 i 1 j 1
2 N M
2 N M
2
1 yij y s nM 1 i 1 j 1
M yi y sb n 1 i 1
2015/11/30 16
注: 整群抽样与分层抽样的的比较
二者在分组(层或群)的条件、调查的方
式、分组(层或群)的目的、分组(层或 群)的原则、总体方差的分解等方面都存 在着较为明显的差别。
2015/11/30
17
群的规模大,估计的精度差但费用省;群的 规模小,估计的精度高但费用增大。
通常我们面临的总体会有自然的初级单元, 例如各所中学它们互相之间关于学生的体质很 相似,但在一个学校里每个学生之间有一定的 差异。 倘若需要我们自行划分群,一般还要考虑 到组织管理上的方便、精度上的要求以及费用 的多少等因素。
2015/11/30
6
例如,在进行农村居民户收入情况调查时,在一 个县抽千分之五的村庄,对其所有居民户进行调 查,明显地比从全县直接抽千分之五的农户进行 调查,更便于组织,节省人力、旅途往返时间及 费用。
2015/11/30
7
3.整群抽样的随机性体现在群与群间不
重叠,也无遗漏,总体任何一个基本单元 都必须且只能归于某一群,群的抽选按概率 确定。 4.如果把每一个群看作一个单位,则整群 抽样可以被理解为是一种特殊的简单随机 抽样。理解这一点对给出整群抽样的估计 量的方差有帮助. 5.整群抽样也是多阶段抽样的前提和基 础。
N
Y E( y) Y M
1 f 1 2 2 1 f V ( y) (Yi Y ) Sb n N 1 i 1 nM
2015/11/30 28
证明: 因为 y My
N
,则
2 i
1 f V ( y) n
N
(Y Y )
i 1
N 1
2
N
M V y
M
2
其中:
Yi Y Yij Y i 1 i 1 j 1 N M M 2 Yij Y 2 Yij Y Yik Y i 1 j 1 j k 2 2 NM 1S NM 1M 1S
2. 实施调查便利,节省费用。 即使具备总体基本单元的名单,能直接抽取, 但总体基本单元在空间上的分布面很广,那么选定 调查单位后的调查工作却可能相当大。如果是实 地观测调查费用则很高,并需要较长的时间。
2015/11/30 5
对于整群抽样,由于样本单元的分布相对较集中, 在样本单元数相同的条件下,整群抽样与简单随 机抽样相比,虽然样本的代表性较差,但调查组 织实施过程更加便利,同时还可以大大地节省调 查费用。因此,实际工作中,在权衡费用和精度 之后,有时宁可适当增加一些样本单元数,也采 用整群抽样方法。
(二)特点 1. 抽样框编制得以简化。 在大规模抽样调查中,常常没有或很难编 制出包括总体所有次级单元在内的抽样框,而 整群抽样则不需要编制庞大的抽样框。 因此,在缺少基本单元名单,但群有现成的 名单或明显的空间界限时使用此方法很方便。