当前位置:文档之家› 抽样知识讲解

抽样知识讲解

▪ (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
▪ (一)概率抽样的基本原理 ▪ 1、总体的同质性与异质性 ▪ 同质性:如果某个总体中的每一个成员在所有方
面都相同,那么,我们就说这个总体具有完全的 同质性。 ▪ 否则,就存在不同程度的异质性。 ▪ 同质性总体不需要抽样。 ▪ 社会各种总体的异质性决定了严格的概率抽样的 必要性。
面助知识,将在分层抽样、配领抽样中进行介绍)。 ▪ 这就保证7选取样布的质量,在调查方法上他们
也否定邮寄问卷的方式,村所选取的调查对象尽 可能地用直接面谈的方法进行调查。
(三)抽样的程序
▪ 2、决定抽样方案:根据研究目的、总体特 征、客观条件选择不同的抽样方案。并同 时根据调查的精确程度和可靠性的要求, 确定样本规模。
3、简单随机抽样方法
▪ ②当总体元素很多时:采用随机数表来抽样。 ▪ 具体步骤如下: ▪ a.先取得一份总体所有元素的名单(即抽样框); ▪ b.将总体中所有元素一一按顺序编号; ▪ c.根据总体的规模为标准,对随机数表中的数码逐一进行
衡量并决定取舍。 ▪ d.以总体规模为标准,对随机数表中的数码逐一进行衡量
抽样
(一)抽样的概念
▪ 2、样本(sample)——从总体中按一定方式抽 取出的一部分元素的集合。 样本数目一般用小写 字母n表示。
▪ 3、抽样(sampling)——从总体中按一定方式选 择或抽取样本的过程。
▪ 4、抽样单位(sampling unit)——一次直接的抽 样所使用的基本单位。
▪ 注意:抽样单位与构成总体的元素有时相同,有 时是不同的
小于或至多等于简单随机抽样。
(二)系统抽样
▪ <2>系统抽样缺点: ▪ ①系统抽样是以总体的随机排列为前提,
如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。
▪ ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。
▪ <3>适用范围:系统抽样最适用于同质性较 高的总体。
注意:应随机制定抽样框
(一)抽样的概念
▪ 7、统计值(statistic)——也称样本值,它是关 于样本中某一变量的综合描述,或者说是样本中 所有元素的某种特征的综合数量表现。通常用罗 马字母表示。
▪ 注意:参数值和统计值重要区别: ▪ 参数值是确定不变的、唯一的,并且通常是未知
的; ▪ 统计值则是变化的,即对于同一个总体来说,不
三、概率抽样方法
▪ 抽样方法涉及到研究问题的性质、抽样框 的获得、经费的多少、样本的代表性要求、 调查资料的获取等等因素。
▪ 不同的方法适用不同的情形。
(一)简单随机抽样(simple random sampling)
▪ 又称纯随机抽样,是概率抽样的基本形式。
▪ 1、抽签。总体的每一元素编号(抽样 框)——将号码写在一张张纸条上——搅 拌均匀——抽出纸条——找出编号所对应 的元素
(二) 抽样的作用
▪ ——为人们提供一种实现“由部分认识整 体”这一目标的途径和手段。
▪ 抽样调查是架在研究者十分有限的人力、 财力和时间与庞杂、纷繁、多变的社会现 象之间的一座桥梁
(三)抽样的类型
▪ (1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样
表示置信区间。
(三)抽样的程序
▪ 1、界定Biblioteka 体:1936年总统选举预测情况表
1、界定总体
▪ 什么原因导致《文摘》杂志的预测失败?
1、界定总体
▪ 盖洛普博土的成功主要得益于其选取样本的方法。 ▪ 首先.他分析了选民酌性别、年龄、社会阶层、
人种等。 ▪ 还分析了人口数量分布特征。 ▪ 再依据分析结果对样本数量进行分配。(有关这方
(五)多段抽样
▪ 3、注意:如何确定每一级抽样的单位数目? 要在类别和个体之间保持合适的比例。一 般来说,类别相对较多、每一个类别中个 体相对较少的抽样效果较好。考虑因素有 三:
▪ (1)各抽样阶段中的子总体同质性程度; ▪ (2)各层子总体的人数; ▪ (3)研究者拥有的人力和经费
(五)多段抽样
▪ 整群抽样的优点:可以简化抽样过程,降低收集 资料的费用,还能相对地扩大抽样的应用范围。
▪ 缺点:样本分布面不广,样本对总体的代表性相 对较差。
▪ 3、注意:适用分层抽样的情况:子总体之间差 异大,而内部差异小
▪ 适用整群抽样的情况:子群体之间差别不大,而 内部差异大
(五)多段抽样(multistage sampling)
(三)抽样的程序
▪ 3、制定抽样框:根据抽样方案分阶段制定。 ▪ 4、实际抽取样本:可以事先确定抽样框
和抽样,也可能需要到了目的地才能制定 抽样框和抽样,再调查,也可能一边抽取 样本,一边开始调查。
(三)抽样的程序
▪ 5、评估样本质量。 ▪ 基本方法:将可得到的反映某些总体重要
特征及其分布的资料与样本中的同类指标 的资料进行对比,看是否基本一致。 ▪ 如性别比例、学历比例等。
(四)整群抽样(cluster sampling)
▪ 1、含义:抽样单位为群体,而非个体。它 是从总体中抽取(可采用随机抽样、系统 抽样、分层抽样方法)一些小群体,然后 由所抽出的若干小群体的所有元素构成调 查样本。
(四)整群抽样(cluster sampling)
▪ 2、比较:四种抽样方法:从全国所有城市中抽 出40个城市的样本
▪ 2、随机表:抽样框——编号——确定从随 机表中选取几位数——逐一取舍——找出 所选中的编码的对应元素
随机数表抽样举例
3、简单随机抽样方法
▪ ①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
▪ 2、步骤: ▪ (1)制定抽样框 ▪ (2)计算抽样间隔K=总体规模N/ 样本规模n ▪ (3)选择随机起点A ▪ (4)抽取个体:自A开始,每隔K个个体抽取一
个个体。A,A+K,A+2K…… ▪ (5)将n个个体合起来,构成一个样本
(二)系统抽样
▪ 3、系统抽样优缺点: ▪ <1>优点: ▪ ①易于实施,工作量少。 ▪ ②样本在总体中分布更为均匀,抽样误差
同样本所得的统计值是有差别的。同时,对于任 一特定的样本来说,统计值是已知的,或者说是 可以通过计算得到的。
(一)抽样的概念
▪ (8)置信度:又称置信水平,它指的是总 体参数值落在样本统计值某一区间内的概 率,或者说,是总体参数值落在样本统计 值某一区间中的把握性程度。
▪ (9)置信区间:指在一定的置信度下,样 本统计值与总体参数值之间的误差范围。
3、中心极限定理
▪ 在一个含有N个元素且平均数为μ标准差为σ 的总
体中,抽取所有可能含有n个元素的样本。(根据组
合计算全部可能的样本数目为m=
cNm
(N
N! ) n)!n!
▪ 样本平均数的分布将是一个随n愈大而愈趋于具有平 均数μ和标准差σ的正态分布。
▪ 这一定理说明:当n足够大时(通常假定大于30), 无论总体的分布如何,其样本的平均数所构成的分 布都趋于正态分布。
▪ 4、多段抽样的优缺点 ▪ 优点:抽样比较容易进行 ▪ 缺点:由于每一级抽样都会产生误差,故
(1)用容量为1的样本来估计总体 的平均数
(2)用容量为2的样本来估计总体的 平均数
(3)用容量为3的样本来估计总体的 平均数
(4)用容量为4的样本来估计总体的 平均数
(5)用容量为5的样本来估计总体的 平均数
▪ 样本容量增大时,样本平均数的分布变化 趋势:平均数的范围将逐步缩小,相同的 平均数会相应增多;全部平均数的分布向 总体平均数集中。
人们通常采用下列几组数字
▪ 有90%的样本统计值落在u±1.65SE(样本 平均数的标准差)之间;
▪ 有95%的样本统计值落在u±1.96SE之间; ▪ 有98%的样本统计值落在u±2.33SE之间; ▪ 有99%的样本统计值落在u±2.58SE之间。 ▪ 其中,百分数表示置信水平,u±1.65SE等
▪ (2)然后再在各个类型或层次中采用简单 随机抽样或系统抽样的办法抽取一个子样 本
▪ (3)最后将这些子样本合起来构成总体的 样本。
(三)分层抽样(stratified sampling)
▪ 2、优点: ▪ (1)在不增加样本规模的前提下降低抽样
误差,提高抽样精度。子总体内部同质性 较强、子总体之间异质性较强。 ▪ (2)便于了解总体内不同层次的情况,便 于对总体中不同类别进行单独研究或比较。
▪ 1、含义:又称多级抽样或分段抽样,它是按抽样 元素的隶属关系或层次关系,把抽样过程分成几 个阶段进行。
▪ 2、步骤: ▪ (1)从总体中随机抽取若干大群; ▪ (2)再从这几个大群内抽取几个小群…… ▪ (3)直到抽到最基本的抽样元素为止。 ▪ 在每个阶段中,都要采用简单随机抽样、系统抽
样或分层抽样方法。
(一)抽样的概念
▪ 5、抽样框(sampling frame)——又称抽 样范围,指一次直接抽样时总体中所有抽 样单位的名单。
▪ 6、参数值(parameter)——也称总体值, 它是关于总体中某一变量的综合描述,或 者说是总体中所有元素的某种特征的综合 数量表现。如,工学院教师的平均收入。 通常以希腊字母表示
正态分布图
正态分布图
正态分布图
4、正态分布的特点
▪ (1)单峰、对称。其平均数、众数(次数最多 的值)、中位数(其两边的样本数相同)都相同。
▪ (2)全部样本平均数的平均值正好等于总体的 平均数;全部样本平均数的标准差则等于总体标 准差除以 n 。
相关主题