当前位置:文档之家› 《现代社会调查方法》第四章抽样

《现代社会调查方法》第四章抽样


第二节 概率抽样的原理与程序

概率抽样的两项优点:

概率样本更具代表性,可避免各种偏见和减少误差 概率理论使我们能够估计样本的精确度和代表性

概率抽样之所以能够保证样本对总体的代表性, 其原理就在于它能够很好地按总体内在结构中 所蕴涵的各种随机事件的概率来构成样本,使 样本称为总体的缩影。
第二节 概率抽样的原理与程序
第二节 概率抽样的原理与程序


1、概率抽样的基本原理
现实社会的异质性与同质性。 样本代表性与概率抽样。 概率抽样的基本原则:

如果总体中的每一个个体被抽取为样本的概率相同, 那么从这个总体中抽取的样本就具有对该总体的代 表性。

代表性,即所选取的样本能再现总体的结构。

具有这一性质的样本通常被称为等概率抽样方法 (Equal Probability of Selection Method,EPSEM)。
第二节 概率抽样的原理与程序


2、抽样分布
抽样分布是根据概率的原则而成立的理 论分布,它显示出:从一个总体中不断 抽取样本时,各种可能出现的样本统计 值的分布情况。
2、抽样分布
2、抽样分布
2、抽样分布
2、抽样分布
2、抽样分布
2、抽样分布
极限定理:大数定理与中心极 限定理

极限定理:观察次数n趋向无限时的极限行为。采用极限的方法 所得出的一系列定理,统称极限定理。可分为两类:


第三节 概率抽样方法

优点:在抽样过程中完全排除了主观因素的干 扰,而且简单、易行,只要有总体各单位名单 就可以进行。
缺点:只适用于总体单位数量不多的调查对象, 如果总体单位数量很大,编制抽样框的工作就 十分复杂;样本代表性较差,抽样误差大;抽 取的样本可能比较分散或者过分集中。

第三节 概率抽样方法

变异性原理:变异性是社会科学研究的真正本质。我 们不是研究类型的,而是研究变异和差异的。当然, 差异也有可能是组与组之间的差异。比如男女之间的 收入不一样,假如说男女收入是一样的话,那么我们 就不会认为性别在研究收入这个现象中是一个有趣的、 重要的东西。我们之所以要研究性别收入差,就是因 为有差别的存在。虽然这是一个组间差别,但是我们 的重点还是在差异上,比如说种族之间的差异、家庭 背景之间的差异、教育的差异、家庭婚姻的差异等等。 你仔细想一想,我们研究的东西是差异,而不是共性。 类型之间的差异也是差异,只不过是一个特例而已。

第二节 概率抽样的原理与程序

(3)决定抽样方案。 (4)实际抽取样本。 (5)评估样本质量。指的是对样本的质 量、代表性、偏差等等进行初步的检验 和衡量,其目的是防止由于样本的偏差 过大而导致调查的失误。
抽样分类
非概率抽样
抽样技术
概率抽样
偶遇抽样
判断抽样
定额抽样
雪球抽样
简单的原理与程序

社会分组原理:为什么要分组?因为社会分组可减少 组内差异。个体之间是很不一样的,但是个体可以分 成组,比如分成年龄组、性别组、家庭背景境况组等 等。分组显示了组与组之间的差异,这意味着每个组 里面有相对组外来说更高的共同性。如果一个组当中 没有共同性的话,那么组和组之间就没有差异性。如 果女人没有共同性的话,那么就不可能有男和女的差 异。同样的道理,每一个组当中有相对来说比较相似 的特点。我们分组是基于组员之间有一定的共同性, 分组以后组与组之间就有差异性。社会分组能减少社 会结果的差异性,减少得越多,社会分组就越有意义。


二、系统抽样(systematic sampling)
又称等距抽样或间隔抽样,是把总体的元素进 行编号排序后,再计算出某种间隔,然后按照 这一固定的间隔抽取元素来组成样本的方法。
第三节 概率抽样方法


系统抽样的具体步骤

1、给总体中的每一个元素按顺序编上号码,制定出抽 样框。 2、计算出抽样时间距,方法是用总体的规模除以样本 的规模。K(抽样间隔)=N(总体规模)/n(样本规模) 3、在最前面的K个元素中,采用简单随机抽样的方法 抽取一个元素,记下这个元素的编号(假设为A),A 称为随机起点。 4、在抽样框中,自A开始,每隔K个元素抽取一个元素, 即所抽元素编号为A,A+K,A+2K,…A+(n-1)K。 5、将这n个元素合起来,就构成了该总体的一个样本。
大数定理(大数法则或平均法则):


研究在什么条件下,随机事件可以转化为不可能事件或必然事件, 即有关阐明大量随机现象平均结果的稳定性的一系列定理。 它的意义:在随机事件的大量重复出现中,往往呈现几乎必然的规 律。

中心极限定理:

研究在什么条件下,随机变量之和的分布可以近似正态分布。 中心极限定理表明,如果一个现实的量是由大量独立偶然因素的影 响迭加而得,且其中每一个偶然因素的影响又是均匀地微小的话, 则可以断定这个量将近似地服从正态分布。

(卢淑华,1998:177)《社会统计学》
中心极限定理与正态分布

在自然、社会、经济领域里大量存在服从正态分布的 随机变量,如身高、体重、智商、婚龄等。
根据中心极限定理,均值的抽样分布具有如下特征:



如果样本相当大(不少于30,最好是大于等于100),则抽样 分布接近正态分布。其特点是单峰和对称,众值、中位值与 均值都相同。 抽样分布之均值就是总体之均值(μ)。

民意调查机构准 确预测 1亿选民,调查 对象仅2000人!

两个例子

1936年美国总统大选
PK
Franklin Rooselvelt
Alfred Landon
两个例子

《文学文摘》杂志曾准确地预测了1920、1924、1928、 1932年的美国总统大选。 1936年,《文摘》进行了一次最具雄心的民意测验活 动:
分层抽样
整群抽样
多段抽样
其他抽样技术
按比例
不按比例
图 抽样分类
第三节 概率抽样方法


一、简单随机抽样(simple random sampling)
又称纯随机抽样,是按照等概率原则直接从含 有N个元素的总体中抽取n个元素组成样本 (N>n),常用的办法是抽签。

另外方法是利用随机数表进行抽样。
第三节 概率抽样方法
第四章 抽样
本章主要内容:
1、抽样的意义与作用 2、概率抽样的原理与程序 3、概率抽样方法 4、非概率抽样方法 5、样本规模与抽样误差
第一节 抽样的意义与作用


1、抽样及其相关的概念
(1)总体(population),总体是构成它的所有元素的集合,而 元素(element)则是构成总体的最基本单位。一个总体中所包 含的元素数目常用大写字母N表示。

抽样分布的标准差,称为标准误差(SE)。

由于均值的抽样分布是正态分布,而其面积就是均值的次数, 故任何两值之间的样本均值次数所占的比例是可以知道的。
正态分布图与统计推论
第二节 概率抽样的原理与程序


3、抽样的一般程序
(1)界定总体。指的是在具体抽样前,首先 对从中抽取样本的总体范围与界限作明确的界 定。 (2)制定抽样框。这一步骤的任务就是依据 已经明确界定的总体范围,收集总体中全部抽 样单位的名单,并通过对名单进行统一编号来 建立起供抽样使用的抽样框。


利用随机数表进行抽样的步骤。
(1)先取得一份调查 总体所有元素的名单。 (2)将总体中所有的元素一一按顺序编号。 (3)根据总体规模是几位数来确定从随机数表中选几 位数码。 (4)以总体的规模为标准,对随机数表中的数码逐一 进行衡量并决定取舍; (5)根据样本规模的要求选择足够的数码个数。 (6)依据从随机数表中选出的数码,到抽样框中去找 出它所对应的元素。
简单随机抽样 系统抽样 分层抽样 整群抽样
抽样方法
多段抽样
偶遇抽样
判断抽样 非概率抽样 定额抽样 雪球抽样
第二节 概率抽样的原理与程序
社会科学研究的三个基本原理: 变异性原理

同质性与异质性 单个案不具有代表性

社会分组原理

社会情境原理

(谢宇,2006:15)《社会学方法与定量研究》
第二节 概率抽样的原理与程序

随机抽样:同等、独立
第二节 概率抽样的原理与程序

在概率抽样的过程中,我们总是要求保 证总体中的每一个个体都有同等的机会 入选样本,而且,任何一个个体的入选 与否,与其他个体毫不相关,互不影响。
随机事件与概率

确定性现象:必然发生的。 必然事件:在一定条件下必然发生的。 如:在一个大气压下,水在100摄氏度时必然沸腾。
第一节 抽样的意义与作用


2、抽样的作用
抽样作为人们从部分认识整体这一过程的关键 环节,其基本作用是向人们提供一种实现“由 部分认识总体”这一目标的途径和手段。 在社会调查中,抽样主要是解决的是调查对象 的选取问题,即如何从总体中选出一部分对象 作为总体的代表的问题。

两个例子

1984年的美 国总统大选


第一节 抽样的意义与作用




(5)抽样框( sampling frame),又称抽样范围,指的是一次 直接抽样时总体中所有元素的名单。 (6)参数值(parameter),也称之为总体值,它是关于总体中 某一变量的综合描述,或者说是总体中所有元素的某种特征的综 合数量表现。 (7)统计值(statistic),也称样本值,它是关于样本中某一变 量的综合描述,或者说是样本中所有元素的某种特征的综合数量 表现。 (8)置信度(confidence level),又称置信水平,指的是总体 参数值落在样本统计值某一区间的概率,或者说,是总体参数值 落在样本统计值某一区间中的把握性程度。 (9)置信区间(confidence interval),指在一定的置信度下,样 本统计值与总体参数值之间的误差范围。它反映抽样的精确性程 度。
相关主题