第七章抽样调查技术
第一,对总体的每个单位进行编号,总体单位数 为10,000的总体可编为00 001到期10,000号;
第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
第三,在有明确总体单位的数字表中选出符合上 述数字的总体单位,这些总体单位就是样本。
2020/11/17
23
三、分层抽样
(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2020/11/17
24
(一)分层抽样的具体步骤
第一步,辨明突出的(重要的)人口统计 特征和分类特征,这些特征与所研究的行 为相关。
第四,整群抽样也是多阶段抽样的前提和基础。
2020/11/17
34
五、多阶段抽样
(一)多阶段抽样的特点
第一,多阶段抽样对基本调查单位的抽选不是一 步到位的,至少要两步。
第二,组织调查比较方便,尤其对于那些基本单 位数多且分散的总体,由于编制抽样框较为困难 或难以直接抽取所需样本,就可以利用地理区域 或行政系统进行多阶段抽样。
2020/11/17
16
(四)简单随机抽样的优缺点
方法简单直观,当总体名单完整时,可直 接从中随机抽取样本,由于抽取概率相同 ,计算抽样误差及对总体指标加以推断比 较方便。
尽管简单随机抽样在理论上是最符合随机 原则的,但在实际应用中则有一定的局限 性。
Hale Waihona Puke 2020/11/1717
二、等距抽样
(一)等距抽样法的具体操作 (二)等距抽样的实施办法 (三)等距抽样的参数估计 (四)等距抽样的优缺点
20
(三)等距抽样的参数估计
1、估计量
1 n
ysy yi n j1 yij
2020/11/17
21
V ( ysy
)
N 1S N
2
K (n 1) N
S2 wsy
2.估计量的方差
V
( ysy )
N 1S2 N
K (n 1) N
S2 wsy
其中,
S2 wsy
1 K (n 1)
K i
n
( yij yi )2
一、简单随机抽样 二、等距抽样 三、分层抽样 四、整群抽样法 五、多阶段抽样
2020/11/17
12
一、简单随机抽样
(一)简单随机抽样的具体操作 (二)简单随机抽样平均误差 (三)简单随机抽样的方法 (四)简单随机抽样的优缺点
2020/11/17
13
一、简单随机抽样
(一)具体操作步骤:
整群 抽取 抽取 低于简单随机 缩小群间差异,增
抽样 部分 全部 抽样
大群内差异,增加
群数
二级 抽取 抽取 介于整群抽样 减少一级单元之间
j
为等距样本(群) 内方差
S 2 为总体方差。
2020/11/17
22
(四)等距抽样的优缺点
第一,运用等距抽样的前提是要有总体每 个单位的有关材料,特别是按有关标志排 队时,往往需要有较为详细、具体的相关 资料。
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。
2020/11/17
27
(四)分层抽样的优点
分层抽样比简单随机抽样和等距抽样等方 法更为精确,能够通过对较少的抽样单位 的调查,得到比较准确的推断结果,特别 是当总体较大、内部结构复杂时,分层抽 样常能取得令人满意的效果。同时,分层 抽样在对总体推断的同时,还能获得对每 层的推断。
2020/11/17
2020/11/17
33
(三)整群抽样需注意的几个问题
第一,整群抽样的随机性体现在群与群之间不重叠, 总体的任何一个基本单位都必须且只能归于某一群, 群的抽选按概率确定。
第二,如果把每一个群看成一个单位,那么,整群抽 样就是以群为单位的纯随机抽样。
第三,整群抽样对于群而言是非全面调查,对于被抽 中群内基本单位而言则是全面调查,是“先部分,后 全部”的抽样组织形式,与分层抽样正好相反。
类别
各自特点
共同点
抽样间的联系 适用范围
简单随机 抽样 等距抽样
分层抽样
从总体中逐个抽 (1)抽样过
取
程中每个个
体被抽到的
将总体均分成几 可能性相等 在起始部分时
部分,按预先制 (2)每次抽 采用简单随机
定的规则在各部 出个体后不 抽样
分抽取
再将它放回,
即不放回抽
样 将总体分成几层,
分层抽样时采
分层进行抽取
(4)复合连接是指抽样框单元与目标总体单元不完全一一 对应,而是存在一对多、多对一或多对多模式的现象。
(5)不正确的辅助信息误差也被称为“内容上的偏差”, 这种误差会降低估计的精度。
(6)抽样框老化又被称为“抽样框过时”或“不准确的抽 样框”。
2020/11/17
10
3.减少抽样框误差的方法
(1)在抽选样本之前,要对抽样框加以检查,发 现可能存在的问题,进行识别、处理,并采取一 定措施加以补救。
分类:
全及总体可以根据单位数量是否有限,分为无限 全及总体(infinite population)和有限全及总体 (finite population)。
2020/11/17
5
(二)样本总体
概念: 也称抽样总体(sampled population)或者“子
样”、“样本”,是指从全及总体中抽取出来的 单位集合。
2020/11/17
8
(二)抽样框误差
1.抽样框误差的概念 抽样框误差(sampling frame error)是因不
准确或不完整的抽样框而引起的误差。抽 样框误差是一种非抽样误差
2020/11/17
9
2.抽样框误差的形成
(1)丢失目标总体单位也被称为“涵盖不足”,是指抽 样框没有覆盖全部目标总体单位。 (2)包含非目标单位也被称为“过涵盖”,是指抽样框 中包含了一些不属于研究对象的非目标总体单位。 (3)丢失目标单位和非目标单位共存,是指在抽样框中 既有丢失目标单位,也有包含非目标单位。
第七章:抽样调查技术
本章教学目的 第一节 抽样调查的基本概念 第二节 概率抽样设计 第三节 非概率抽样 第四节 样本容量的确定
2020/11/17
1
本章教学目的
通过本章学习,了解抽样调查的各项 技术的特点,正确地应用各项技术进行 抽样调查;掌握如何选取样本、样本框, 减少抽样调查的误差,提高抽样调查的 精确度。
(2)联接遗漏单位法,就是指把抽样样本遗漏的 个体和抽样样本中某个值相联接,其联接规则必 须在调查前明确规定。
4.抽样估计的总体参数 (1)总体和 (2)总体中具有某种特定特征的个体总数或它们
在总体中所占的比例或百分率: (3)总体两个不同指标的总和或均值的比值
2020/11/17
11
第二节 概率抽样设计
然后,用简单随机抽样的方法对各类人员 进行抽样。
2020/11/17
26
(三)分层指标的选择
例如,我国国内一般大规模的民意调查都是以居 住地分层的,至少分为城镇和乡村两层。因为城、 乡居民的观念、行为和习惯等是很不相同的。中 央人民广播电台1992年的全国抽样调查是多级分 层的,第一级的分层是按经济发展水平将全国467 个地区分成四层:“经济发达地区”、“经济一 般发达地区”、“不发达地区”和“贫困地区”, 因为根据以往的研究,人们的广播接触行为是与 地区的经济发展水平和个人的经济地位相关的。
用简单随机抽
样或等距抽样
总体个数 较少
总体个数 较多
总体由差 异明显的 几部分组 成
2020/11/17
30
四、整群抽样法
(一)整群抽样法的具体操作 (二)采用整群抽样的原因 (三)整群抽样需注意的几个问题
2020/11/17
31
(一)整群抽样法的具体操作
假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2020/11/17
14
2
Sx
nn
(二)简单随机抽样平均误差公式
2
Sx
n
n
是全及总体标准差; n 是抽样单位数
2020/11/17
15
(三)简单随机抽样的方法
1.抽签法 2.随机掷骰子法 3.计算机随机数法 4.随机数表法 5.使用统计软件直接抽取 6.其他方法 7.放回抽样与不放回抽样的比较
同其它调查形式相比,涉及面大、调查的内 容和项目比较简单,但所收集的资料全面准确、 可靠、误差比较小。同时,普查需要占用较多的 人力、花费较多的财力和物力才能完成。
2020/11/17
4
二、全及总体与样本总体
(一)全及总体
概念:
也称目标总体(target population),是由符合研 究目的的所有具有相同性质或特征的个体(individual) 所组成的集合。在抽样调查中,全及总体是抽样推 断的目标。
2020/11/17
7
四、抽样框与抽样框误差
(一)抽样框(sampling frame) 1.抽样框的概念
抽样框就是供抽样调查使用的所有调查单位 的名单。这份名单为调查者提供了辨别和联系调 查总体中个体的有效途径。 2.设计抽样框的要点
准确的抽样框包括两个方面:完整性与不重复 性。①完整性是指不遗漏总体中的任意一个个体; ②不重复性是指任意一个个体不能重复列入抽样 框。
2020/11/17