当前位置:文档之家› 第六章 抽样

第六章 抽样


第三节 概率抽样方法
1、简单随机抽样 2、系统抽样 3、分层抽样 4、整群抽样 5、多段抽样
一、简单随机抽样
又称纯随机抽样,是概率抽样的最基本形式。 它是按照等概率原则,直接从含有N个元素 中的总体中抽样n个元素组成样本。抽样时 不进行任何分组排列,使总体中的任何个体 都有同等被抽中的机会。 常用的办法是抽签,但对于总体元素很多的 情形,采用随机数表来抽样。
4.抽样单位sampling unit:一次直接的抽样所使用的基
本单位。 从全国高校中抽取100个班级,抽样单位为班级 从全班50人中抽取10人构成小样本,个人(学生)是 抽样单位。
实际抽样中,抽样单位往往是多层次的。如调查家庭,通过县乡-村三级抽样,抽样单位为乡、村、家庭三种,分别为初级抽样 单位、次级抽样单位和终极抽样单位。

(4)在抽样框中,自A开始,每隔K个个体抽取 一个个体,即所抽取个个体编号分别为A,A+K, A+2K,﹍,A+(n-1)K。 (5)将这n个个体合起来,就构成了该总体的 一个样本。 例如在由1000个单位组成的总体中抽取100个样 本。先将1000个总体标上从1-1000的序号,再 在前10个中随机地抽取一个号,如2,再依次抽 取12,22,…,92,组成样本。
非概率抽样则主要依据研究者的主观意愿, 判断或是否方便等因素来抽取样本,它不 考虑抽样中的等概率原则,因而往往产生 较大的误差,难以保证样本的代表性。
分析
概率抽样的方法
简单随机抽样 系统抽样 分层抽样 整群抽样 多段抽样
非概率抽样
1、偶遇抽样 2、判断抽样 3、定额抽样 4、雪球抽样
例2:假设要在一栋公寓建筑物中选择公寓样 本。如果样本是从每个公寓的编码(如101, 102,103,104,201,202,203等等)中抽 出的话,那么所使用的抽样间隔,可能刚好 等于每层楼的户数或是每层楼户数的倍数。 这样选择的样本可能具有共同的特性,从而 产生偏误。
分层抽样(一)
分层抽样又称类型抽样,它是先将总体中的所有单 位按某种特征或标志(如性别、年龄、职业或地域 等)划分成若干类型或层次,然后再在各个类型或 层次中采用简单随机抽样或系统抽样的方法抽取一 个子样本,最后,将这些样本合起来构成总体的样 本。 如对某大学的学生进行分层抽样,首先要将所有的 学生按年级加以分类,然后再分别从一年级、二年 级、三年级和四年级的学生中,各抽出适当数量的 要素组成样本。
第六章 抽样
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、户内抽样与PPS抽样 五、非概率抽样方法 六、样本规模与抽样误差
普遍调查
普遍调查通常简称普查,它指的是对构成总 体的所有个体无一例外地进行调查。比如全 国人口普查,就是对全国所有人口逐个进行 调查。
1998年4,北京市海淀区某街道15-45岁居民对计划
生育的态度。 界定总体是达到良好的抽样效果的前提条件。如果 不清楚明确界定总体的范围与界限,即使采用最严格的 抽样方法,也可能抽出对总体严重缺乏代表性的样本来。
《文学文摘》是一本1890-1938年间美国颇为流 行的新闻杂志。1920年《文摘》杂志通过邮寄明 信片的方式,正确预测了当年的总统大选的结果。 在之后的1924、1928、1932年,也给出了准确 的预测。 但该杂志1936年美国总统大选的民意测 验,尽管调查了200万人,但是却得出了错误的结 果。但当年,盖洛普民意测验所只调查了3000人, 就对投票结果作出了准确的预测。 其中一个很重要的原因便是对抽取样本的总体缺乏 清楚认识和明确的界定。
随机数表中的数 码 8432990906 1053873020 9427410041 0139022507 9361404310 1359866042 6321912683 9420582507 2725651176
选用 的数 码
0906
不选原因
后4位大于3000 0041 2507 后4位大于3000 后4位大于3000 2683 与所选第3个数重
系统抽样(二)
需要注意的是,系统抽样有一个十分重要的前提 条件,就是总体中个体的排列相对于研究的变量来说, 应是随机的,即不存在某种与研究变量相关的规则分 布。否则,系统抽样的结果将会产生极大的偏差。 例1:在一项有关二战士兵的经典研究中,研究人员 从名册中每隔10个士兵抽出一个来进行研究。然而士 兵的名册时以下列组织方式来编排的:首先是中士, 接着是下士,其后才是二等兵;用一班一班的方式进 行编排,每班10个人。因此次名册中每隔10个就是中 士。如此系统抽样可能会得到一个完全是中士的样本, 也可能会得到一个完全不含中士的样本。
6.参数值/总体值
——是对总体元素特征的综合数量表现。 例如:全国妇女平均受教育年限 参数值只有通过总体的每一个元素都进行调查 或测量才到。
7.统计值/样本值
——是关于调查样本中的某一变量的综合描
述。
例如从一个样本中得到的妇女平均受教育年
限。
8 .抽样误差 样本代表性大小的一个标准,是用样本的统 计值推算总体的参数值是存在的偏差。 抽样中因误抄、计算错误等人为过失和其 他一些因违反随机原则而产生的误差并不是 抽样误差。
三、抽样设计的原则
1、目的性原则
即要以课题研究的总原则
指的是抽样设计能够从样本自身计算出有效的估计值或 抽样变动的近似值。
3、可行性原则
研究者所设计的抽样方案必须在实践中切实可行。
4、经济性原则
抽样方案的设计要与研究的可的资源相适应。
在各种随机事件的背后,存在着事件 发生的客观概率,这种概率决定着随 机事件的发展变化规律。概率抽样能 够很好地按总体内在结构中所蕴含的 各种随机事件的概率来构成样本,使 样本成为总体的缩影。
二、抽样的一般程序
1.界定总体 对抽取样本中的总体范围与界限作明确的界定。清 楚地说明研究对象的范围(时间、地点、人物),如
二、概率抽样的原理与程序
概率抽样的基本原理 抽样的一般程序 概率抽样的原则
一、概率抽样的基本原则
在概率抽样的过程中,我们要保证总体中的 每一个个体都有同等的机会入选样本,而且, 任何一个个体的入选与否,与其他个体毫不 相关、互不影响。(单选) 当总体情况不明时,无法做到随机抽样。

利用随机数表抽样的具体步骤: (1)先取得一份总体所有元素的名单(抽样框); (2)将总体中所有元素一一按顺序编号; (3)根据总体规模是几位数来确定从随机量表中选几 位数; (4)以总体规模为标准,对随机数表中的数码逐一进 行衡量并决定取舍; (5)根据总体规模的要求选择出足够的数码个数; (6)依据从随机数表中选出的数码,到抽样框中找出 它所对应的元素。
1176
简单随机抽样的特点: 简单随机抽样是概率抽样的理想类型,没有偏 见,简单易行,且在从随机样本的抽样到对总 体进行推断时,有一套健全的规则。 但是,当总体所含个体数目太多时,采用这种 抽样方式不仅费时多,工作繁杂且费用太高。 此外,这种抽样方法,在构成总体的个体差异 不大时,用之比较有效,而在总体异质性较高 时,误差较大。
是构成它的所有元素的集合。
人口普查——全国人口
某省大学生择
业观念调查——某省全体大学生
2.样本sample:从总体中按一定方式抽取 出来的一部分元素的集合,是总体的一个子 集。
从某省大学生总体中抽取1000名大学生,所 抽取的1000名大学生就构成一个样本。 3.抽样sampling:从总体中按一定方式抽取 样本的过程。 从17000名在校大学生构成的总体中,按照一 定方式抽取200名学生的过程。
普遍调查的特点
工作量大,费时、费力、费钱。 资料准确,适用了解总体的基本情况。 需要高度集中的组织和高度统一的安排。 调查项目不能多,只能了解某一方面必不 可少的基本情况。
二、抽样调查
抽样调查就是从所研究的总体中,按照一定 的方式选取一部分个体进行调查,并将从这 部分个体中所得到的调查结果推广到总体中 去。
抽样调查的特点(一)
抽样调查非常节省时间、人力和财力,这也 许是抽样调查最突出的优点。 抽样调查可以十分迅速地获得资料数据。
抽样调查的特点(二)
抽样调查可以比较详细地收集信息,获得内 容丰富的资料。 应用范围十分广泛。 准确性高。
第一节 抽样的意义与作用
一、抽样概念
1.总体population:调查研究的全部事物,
5.抽样框sampling frame:也称抽样范围,指一 次直接抽样时总体所有抽样单位的名单。
从某校的全体在校生中,直接抽取200名大 学生作为样本,该校全体学生名单就是该次抽 样的抽样框。
抽样框的数量抽样单位的层次相对应。 如对家庭的抽样中,有三个层次的抽样单位: 乡、村、家庭,则对应的抽样框也有三个:全 部乡的名单、乡样本中所有村的名单、村样本 中所有家庭的名单。
对样本的质量、代表性、偏差等等进行初步 的检验和衡量,防止由于样本的偏差国大导 致的失误。基本的方法是将可得到的反映总 体中某些重要特征及其分布的资料与样本中 的同类指标的资料进行对比。差别小,则说 明样本质量高。
样本评估实例
1 用小学生中独生子女的比重这一指标来衡量。 在现有资料,有两个结果与本研究所抽取的小学 生样本口径一致成或相似,可用作比较的参考对 象。 2 章永生1989年对北京两所小学1-6年级12个班及 三所中学18个班的调查结果,独生子女在小学生 中的比重为51.9%,非独生子女比重为48.1%,而 在风笑天研究的小学生样本中,二者的比重分别 为56.9%和43.1%,相差不大。
系统抽样(一)
系统抽样又称等距抽样或机械抽样。它是把总体的单位 进行编号排序后,再计算出某种间隔,然后按这一固定 的间隔抽取个体的号码来组成样本的方法。 具体步骤 (1)给总体中的每一个个体按顺序编号,即制定出抽 样框。 (2)计算出抽样间距。计算方法是用总体的规模除以 样本的规模。假设总体规模为N,样本规模为n,那么抽 样间距K就由下列公式导出: K= N÷ n (3)在最前面的K个个体中,采用简单随机抽样的方法 抽取一个个体,记下这个个体的编号A,称为随机起点。
相关主题