当前位置:
文档之家› 4抽样设计 社会调查研究方法讲义
4抽样设计 社会调查研究方法讲义
• 回置抽样可以保证每一个总体单位有相同被抽到的机会。
• 不回置抽样由于被抽中的单位不回置,总体单位被抽到的 机会逐渐有些增加。但不回置抽样操作起来比较方便,且 在总体相对于样本规模较大时,其结果与回置抽样的结果 差别很小,故平常用得很多。
等距抽样
• 又称系统抽样。将总体各单位按某种顺序排列、编号,而 后从随机选择的第一个单位开始,按照相等的间距抽取样 本单位。系统抽样又称为“随机起始的抽样”,随机程度 没有简单随机抽样的随机程度那样高。但只要总体单位有 某种自然顺序,系统抽样做起来比较方便,特别适合用于 象生产流水线上抽检产品质量这种情况。
二、抽样的术语
• 抽样单位:在社会调查研究中,分析单位是我们进行信息 收集和分析的基本单位。而当我们确定采用抽样调查进行 社会调查时,习惯于把分析单位称为抽样单位。
• 总体:总体就是抽样调查中所有调查对象的集合体,也称 母体。总体中含有的分析单位的数目,叫总体规模或总体 单位数(一般用英文字母N表示)。
抽样调查的本质是要保证样本对总体的近似,即 样本在多大程度上可以代表总体,不同的抽样方法将 导致样本对总体不同程度的代表性。因此,设计一个 科学合理的抽样方案就显得十分必要。
对总体 进行分析
选择抽样方法 保证样本的代表性
制定抽样框
实际抽取样本
2.样本的产生
• 样本质量决定了调查研究结论的适用性,以及能否进行推 论,所以样本选择是抽样设计中的一个重要环节。如果抽 样调查最后得出的结论的适用范围很小,缺乏“共性”, 也就意味着不能用样本有效推断总体,调查在一定程度上 就是失败的。这对调查过程中的各种资源投入而言也是一 种浪费,做无用功。
抽样调查方法
大数规律
抽样调查
等概率原则 随机抽样
非随机抽样
简单随机抽样 等距抽样 分层抽样 整群抽样 偶遇抽样 判断抽样 配额抽样
滚雪球抽样
概率抽样
(一)概率抽样的地位 • 概率抽样是按“随机原则”产生样本的抽样。在抽样
调查中,概率抽样最严格,也最有说服力,故据于主 导地位。 • 概率抽样又称随机抽样即在抽样时,母体中每一个抽 样单位被选入样本的机率相同。随机抽样具有健全的 统计理论基础,可用机率理论加以解释,是一种客观 而科学的抽样方法。
,层间差异尽可能大,层内差异尽能小;整群抽样时群 间差异尽可能小,群内差异尽可能大。
多段抽样
• 如果总体过于庞大,在整群抽样的基础上可以发展出一种 多段整群抽样。整群抽样的最大优点是可以大大简化抽样
过程,在无法直接获得抽样框的情况下进行调查。而在多 段整群抽样的过程中,每一步采用的都是随机抽样法。
1000 样本容量
800
600
400
200
总体规模 0
0
1
2
3
4
5
6
7
8
9
10
11
样本大小与总体规模的关系
4.大数规律
随机现象是事先不好确定其结果的现象。随机现象有规 律可循的,【关键是要大量观察,看少了不行。】
大数规律是随机现象出现的基本规律,它的一般意义是,尽 管观察过程中每次取得的结果不同(因为具有随机性), 但大量重复观察结果的平均数却几乎接近某个确定的数值 。
• 等距抽样最大的缺点是在总体呈现的自然顺序具有某种规 律性(如某种间隔顺序)时,如不了解或处理不当,有可 能将产生较大的抽样误差,甚至导致样本对于总体完全不 具有代表性。
• 等距抽样的优点是显而易见的。等距抽象比较实用,相比 较简单随机抽样工作量较小,更容易操作,尤其对于调查 的初学者,这种方法用起来较方便。
择的前提下,使总体中每一个单位有相同的被抽 中的机会。所谓随机原则,也叫机会均等原则( 或等概率原则)。
总体参数和样本统计量
• 总体参数是关于总体中某一变量取值的综合描述,即根据 总体中各单位的已知量计算出来的关于总体的统计指标。 在抽样调查时,这个量一般是未知的(但是唯一的)。因 为如果这个量已知,就不必进行抽样调查了。
下四个方面: 1 获得的信息不正确或不真实; 2 定义和标准不严格、不确切、不适当; 3 样本不能代表总体; 4 部分数据对总体的估计将要产生的误差。 • 对抽样调查而言,前面两个可以称为系统误差,后面两个可
以称为抽样误差。影响调查质量的因素主要是系统误差。
二、系统误差及其控制
• 系统误差可以归纳为两大类:①抽样设计误差;②测量误 差。
容量较大时,再增加n收效就不大了。因此,即使面对大总
体,许多调查机构也将他们的样本容量限制在2000以内。】
PPS抽样
• 偶遇抽样是对应于简单随机抽样的非随机抽样 • 判断抽样又称立意抽样,是调查者根据研究目的和自己主观经验,来
选择和确定调查对象的一种方法。 • 配额抽样是对应于分层抽样的非随机抽样。 • 滚雪球抽样,应用这种方法,首先是找出少数个体;然后通过这些个
体了解更多的个体;再通过更多的个体去了解另外的个体;如此类推 下去,从而就象滚雪球一样,了解的个体越来越多,越来越接近于总 体。
抽样调查的涵义及原理
一、抽样调查 抽样调查为科学研究方法中重要的技术之一,是指按照科学的
原理和计算从所要研究的现象的全部分析单位中按随机原则,抽取部 分单位进行调查,取得资料后,再根据样本的实际数据对总体的数量 特征作出具有一定可靠程度的估计和判断的方法。抽样调查旨在以样 本的资料来推断调查对象总体的相关统计数据。 • 抽样调查的特点之一:抽取样本时要遵循“随机原则”,即产生样本 时,调查对象总体中的所有单位都有同等被抽中的机会。 • 抽样调查的特点之二:大数规律起作用的条件是样本容量足够大,如 此样本对总体才有充分的代表性。 • 抽样调查的特点之三:抽样误差可以事先经过计算而控制在一定范围 内,并且能采取一定的组织措施来控制这个误差。
三、抽样误差及其控制
• 抽样误差是在遵守随机原则的条件下,用样本指标代表总体 指标不可避免存在的误差。抽样误差也称为代表性误差。常 识和科学原理都告诉我们,抽样误差是与样本容量呈反向关 系的,抽样误差随样本容量的增加而减小。
• 样本容量n是我们手中握有的控制抽样误差的“王牌”。
• 【进一步研究还表明,对于小总体,样本容量的很小一点增 加,会带来代表性方面很明显的提高;而对大总体,当样本
•
其实,多段抽样并不限于多段整群抽样。在实际工作
中,往往可以灵活地把简单随机抽样、系统抽样、分层抽
样和整群抽样这几种抽样方法结合起来使用,以解决更复
杂的问题。
(二)非概率抽样
• 凡是那些没有严格遵循随机原则的抽样统称为非概率抽样。非概率抽 样更多的建立在调查者对总体有所了解的基础上,是不严格遵循随机 原则的抽样调查。
样本 抽样 抽样框 随机原则
• 样本是指从总体中抽取出来的那一部分进行调查 的分析单位的集合体。样本中含有的分析单位的 数目,叫样本容量(一般用英文字母n表示),也 称样本大小。
• 抽样特指从总体中抽取部分单位(即从总体中获 得样本)的过程。
• 抽样框就是抽样单位的具体化的实际名单。 • 随机原则是指抽样时,在完全排除主观上人为选
2.偶遇抽样
• 偶遇抽样是对应于简单随机抽样的非随机抽样,又称方便 抽样、便利抽样。偶遇抽样要求调查者根据实际情况,以 自己方便的形式遇到谁就调查谁,即在样本的选择只考虑 到接近样本或衡量便利,离得最近的、最容易找到的人就 是调查对象。对于偶遇抽样,样本是随便产生的,而不是 随机产生的,所以它是否是总体的近似不好判断。
3.判断抽样
• 判断抽样又称立意抽样,是调查者根据研究目的和自己主 观经验,来选择和确定调查对象的一种方法。
4.配额抽样
• 配额抽样是对应于分层抽样的非随机抽样。与分层抽样不 同之处在于,配额抽样将预定的样本容量按各层单位在总 体中的比例分配到各层,然后按这些比例从各层中非随机 地抽取样本。配额抽样要预先精确了解总体的结构比例特 征。
抽样调查的几种组织形式:
简单随机抽样
按完成 整个抽 样过程 的阶段 来分
单阶段抽样
只需一次 抽样过 程 ……
多阶段抽样
类型……抽样 系统……抽样 整群……抽样
将总体分层,再 逐层抽取样本单 位。
简单随机抽样
• 简单随机抽样(如“抓阄” ),又称纯随机抽样,它适用 于调查总体内单位不多的情况。
• 简单随机抽样按对抽取到的单位是否回置,可分为回置抽 样和不回置抽样。回置抽样是从总体中抽取一个单位,登 记后又放回总体中去,然后再抽下一个单位。
意义
抽样调查的重要意义,就在于用样本统计量来推断总体参 数。虽然用前者来推断后者误差总是在所难免。但由于大 数规律,只要样本容量足够大,计算出来的样本统计量就 和总体参数非常接近。这样一来,总体参数虽然一般是未 知的,却可以用样本统计量来推断。这就是抽样调查的魅 力所在。
抽样设计
1.抽样设计的一般程序
5.滚雪球抽样
• 滚雪球抽样指利用随机方法或初步调查选出原始的样本。 再根据原始样本提供的信息去找到其它样本。应用这种抽 样方法的前提是,总体单位之间具有一定的联系。如果总 体单位间缺乏联系,那么就失去了“滚雪球”的依据。
抽样调查误差及其控制
一、误差及其分类 • 根据鲍德威在1915年提出的分类方法,调查误差一般有以
唯一的估计值,所以用样本统计量去推断总体参数时,误 差总是不可会避免的。科学的抽样设计其目的在于尽可能 减少这种误差。
置信度和置信区间
• 置信水平指总体参数值落在样本统计值某一区间的概率, 它用于反映样本统计量估计总体参数的可靠性(信度)。
• 置信区间指在一定置信水平下,样本统计量与总体参数偏 差的最大允许范围。
整群抽样
• 整群抽样与前几种抽样的最大差别在于,它的抽样单位不 是单个的个体,而是成群的个体,所以它并不以抽样框的 获得为前提。所谓整群抽样,就是从总体中成群地抽取调 查单位。也就是说,要先将总体单位分为若干群,再在其 中随机地抽取部分群,最后对抽中所有的单位一一进行调 查。