第七章 整群抽样
j 1
y 1 yi i M M
y
j 1
M
总体总值及按群平均的总体均值:
Y Yi Yij
i 1 i 1 j 1 A A M
Y 1 A Y Yi A A i 1
样本总值及按群平均的样本均值:
y yi yij
i 1 i 1 j 1 a a M
• 总体均值 Y 的无偏估计: y y 1 aM aM
V ( y) 1 f 2 Sb aM
1 a y y y ij i a M i 1 j 1 i 1
a
M
• 方差:
2 • 方差的无偏估计: v ( y ) 1 f sb
aM
第二节
群大小相等的整群抽样
LOGO
第一节
抽样方式
LOGO
• 实施理由: ① 缺少调查单位的必要信息无法对其直接编制抽样框实施 概率抽样,而由调查单位组成的群是现成的或者群很容 易划分从而编制群抽样框非常容易时,常采用整群抽样。 ② 使调查实施便利、节省费用而采用整群抽样。 ③ 对某些由特殊结构的群组成的总体实施整群抽样能使精 度有较大提高。
第七章 整群抽样
本章要点
LOGO
对于整群抽样,本章给出了群大小相等和群大小不等 的整群抽样方法及与之匹配的估计量、估计量的方差及方差 的估计量。 • 具体要求: • 掌握群大小相等情形对群进行简单随机抽样简单估计量的 无偏性、方差及方差的无偏估计,掌握群的划分原则;了 解群内方差、群间方差概念及其对整群抽样精度的影响。 • 掌握群大小不等情形与简单随机抽样相匹配的简单估计量、 比率估计量及与抽样相匹配的汉森-赫维茨估计量及性质。 • 掌握估计总体比例的整群抽样方法及简单估计量、比率估 计量。
AM ( M 1) 2
• 分母:
2 ( Y Y ) ij i 1 j k
AM
AM 1 2 S MN
• 经计算可以得到:
2 (Yij Y )(Yik Y )
i 1 j k
A
M
( AM 1)( M 1) S 2
第二节
• 变形:
群大小相等的整群抽样
a M
A
M
1 A M 总体方差: S (Yij Y )2 AM 1 i 1 j 1
2
M A 总体群间方差: S (Y i Y )2 A 1 i 1
2 b
A M 1 A 2 1 2 ( Y Y ) 总体群内方差: S Si i ij A i 1 A(M 1) i 1 j 1 2 w
M0: 总体包含调查单位总数 M 0 M i
i 1
A
第三节
群大小不等的整群抽样
LOGO
一 、符号说明
总体第 i群总值及均值: Yi
Yij
j 1 Mi
样本第 i群总值及均值: yi yij
j 1
mi
Yi 1 Mi Yi Yij M i M i j 1 yi 1 mi yi yij mi mi j 1
(基本出发点是群的组成应有利于整群样本估计量精度尽可能高)
• 二是如何确定群的规模。
(群的规模的选择取决于精度与费用之间的平衡)
第二节
群大小相等的整群抽样
LOGO
一 、符号说明
总体由A个群组成,从中随机抽取a个群,对抽中群的所有单位全部调查。
A: 总体群数 a: 样本群数 Yij: 总体第i群的第j单位调查标志值
2 ( Y Y ) M ( Y Y ) i i ij 2 i 1 j 1 i 1
A
M
A
AM 1
2 A( M 1) S w ( A 1) Sb2 AM 1
2 S 2是常数,故当群内方差 Sw 对于固定的总体, 增大(或减 小)时,群间方差 Sb2 必然减小(或增大)。
1 M 2 ( Y Y ) 总体第i群群内方差: S i ij M 1 j 1
2 i
第二节
群大小相等的整群抽样
LOGO
一 、符号说明 样本方差:
a M 1 s ( yij y)2 aM 1 i 1 j 1 2
样本群间方差:
M a s ( y i y )2 a 1 i 1
试求该居民小区平均每户每周食品支出费用并给出其置信水平为95%的 置信区间。
第二节
群大小相等的整群抽样
LOGO
三、整群抽样效果分析及群的划分原则
当直接对调查单位进行简单随机抽样时,有:V ( y )
1 f 2 V ( y) V ( y) ( Sb S 2 ) aM
2 0, Sb S2
LOGO
三、按简单随机抽样抽群,采用比率估计量
• Y 的比率估计量:
ˆ YR
A
y
i 1 a i 1
a
i
m
i
(有• 方差: V (Y ) R 2 aM
(Y YM )
第一节
抽样方式
LOGO
二、整群抽样的特点
• 调查精度:整群抽样估计量的精度(估计量方差)与群的 划分有直接关系。 • 调查费用:整群抽样调查单位相对集中,平均单位调查费 用较少,因此可以通过适当扩大群样本量以提高整群抽样 的精度,同时使调查费用仍比较省。
第一节
抽样方式
LOGO
三、群的划分原则
一般群是自然形成的,或者是现有的单位。 当群需通过划分确定时需考虑两个问题: • 一是如何定义群的组成;
2 b
样本群内方差:
a M 1 a 2 1 2 s si ( y y ) ij i a i 1 a(M 1) i 1 j 1 2 w
样本第i群群内方差:
1 M s ( yij y i )2 M 1 j 1
2 i
第二节
群大小相等的整群抽样
LOGO
二、估计量及其性质
• 表明:按调查单位的相同样本量,整群抽样的方差为简单 随机抽样的方差的 1 ( M 1) 倍。
V ( y) deff 1 ( M 1) Vsrs ( y )
第三节
群大小不等的整群抽样
LOGO
一 、符号说明
总体由A个群组成,第i群含Mi个调查单位
A: 总体群数 a: 样本群数 Yij: 总体第i群的第j单位调查标志值 yij: 样本中第i群的第j单位调查标志值 Mi: 第i群规模(单位个数)
第一节
抽样方式
LOGO
一、整群抽样及其实施理由
• 定义:
一级抽样单位
设总体由A个初级抽样单位组成,在总体中按某种方 法抽取a个初级抽样单位,如果对被抽中初级抽样单位的次 级单位不再进行抽样观测而是全部进行调查,则称此抽样方 法为整群抽样(cluster sampling),初级抽样单位称为群。
将总体划分为若干群,以群为抽样单位,对群中的所有单位进行调查。 二级抽样单位
第三节
群大小不等的整群抽样
LOGO
一 、符号说明
A Y 1 A 按调查单位平均的总体均值: Y Yi M i Y i M 0 M 0 i 1 i 1 M 0
1 a 按调查单位平均的样本均值: y y i a i 1
第三节
群大小不等的整群抽样
LOGO
二、按简单随机抽样抽群,采用简单估计量
1 f 2 S aM
2 0, Sb S2
2 0, Sb S2
在相同的调查单位样本量aM下,只有当群间方差Sb2 比总 体方差 S 2 小时整群抽样才优于简单随机抽样。
第二节
群大小相等的整群抽样
LOGO
总体方差分解:
A M A M 1 1 2 S (Yij Y ) [(Yij Y i ) (Y i Y )]2 AM 1 i 1 j 1 AM 1 i 1 j 1 2
a A ˆ y Ay • 总体总值 Y的无偏估计: Y i a i 1
A
• 方差:
2 A ˆ ) (1 f ) V (Y a
2 ( Y Y ) i i 1
A 1
2
ˆ) • 方差的无偏估计: v(Y
( y y) A (1 f )
i 1 i
a
2
a
a 1
M ( A 1) Sb2 ( AM 1) S 2 ( AM 1)( M 1) S 2
LOGO
2 ① 当群内方差 Sw 0 时, 1为极大值; 2 2 ② 当群内方差与群间方差相等,即 Sw 时, Sb 0;
(分群过程完全随机,为简单随机抽样)
1 ③ 当群间方差 S 0 时, ,为极小值,此时各群的 M 1
yij: 样本中第i群的第j单位调查标志值
Mi: 第i群规模(单位个数) 本节中,M1= M2 =……=MN =M
第二节
群大小相等的整群抽样
LOGO
一 、符号说明
总体第 i群总值及均值:
Yi Yij
j 1 M M
Y 1 Yi i M M
Yij j 1
ij
M
样本第 i群总值及均值: yi yij
y 1 a y yi a a i 1
第二节
群大小相等的整群抽样
LOGO
一 、符号说明
按调查单位平均的总体均值:Y Y 1 AM AM
y 1 按调查单位平均的样本均值:y aM aM
1 A Y Yij Y i A i 1 M i 1 j 1
1 a y y y ij i a M i 1 j 1 i 1
群的划分原则:使群内差异尽可能大,群间差异尽可能小。