第六章抽样案例
不再把这个单位重新放回总体,这个总体单位
26
不再继续参加下2次021/抽4/13选。
二、抽样的作用
基本作用:是人们从部分认识整体的关键环节. “你不必吃完整头牛,才知道肉是老的。” 必要性:研究人员难以做到任何研究都进行全面
调查,而抽样误差可以控制到很小,因而抽样调 查成为最常用的研究方法之一。
2.制定抽样框
制定抽样框 依据已经明确界定的总体范围,收集总体中全 部抽样单位的名单,并对名单进行统一编号,从 而建立抽样框。 当抽样是分几个阶段、在几个不同的抽样层次 上进行时,要建立不同的抽样框。
﹠准确的抽样框原则:
1、完整性 2、不重复性
例如: 在城市居民户的抽样中,会经常出现一户有多处住房的
参数值/总体值
——是关于总体中某一变量的综合描述,或者说 是总体中所有元素的某种特征的综合数量表现。 例如:全国妇女平均受教育年限
参数值只有通过总体的每一个元素都进行调查 或测量才到。
统计值/样本值
——是关于调查样本中的某一变量的综合描述。
是从样本中计算出来的 是作为总体值的估计值 例如:从一个样本中得到的妇女平均受教育年限。
普遍调查的特点
工作量大,费时、费力、费钱。 资料准确,适用了解总体的基本情况。 需要高度集中的组织和高度统一的安排。 调查项目不能多,只能了解某一方面必不可
少的基本情况。
二、抽样调查
抽样调查就是从所研究的总体中,按照一定的 方式选取一部分个体进行调查,并将从这部分 个体中所得到的调查结果推广到总体中去。
但是,当总体所含个体数目太多时,采用这种抽样 方式不仅费时多,工作繁杂且费用太高。
此外,这种抽样方法,在构成总体的个体差异不大 时,用之比较有效,而在总体异质性较高时,误差 较大。
适用范围:总体单位数目和所需样本数目都比较少。
例:某总体共6000人,现需要从中抽取300名作 为样本进行调查,运用随机数表法。
抽样的优越性
1.调查费用较低。 2.速度快 3.应用范围广。 4.可获得内容丰富的资料。 5.准确度高。
举例:美国的总统选举预测
总体:全体合法选民
样本:部分选民
推断:根据部分对整体做出归纳
指标:1、全体合法选民的平均年龄
2、当前登记投票的全体合法选民的百分比
以上总体指标是不能精确测定的,仅能根据统计量 和样本指标来估计
抽样误差
是指在用样本统计值去推估总体参数值时所存 在的偏差。它是由抽样本身的随机性引起的,是 不可避免的。但是抽样误差的大小是控制的。
﹠抽样误差的意义:是衡量样本代表性好坏的标 准,抽样误差越小,说明样本的代表性越好,反 之,则越不好。
抽样中因误抄、计算错误等人为过失和其他一 些因违反随机原则而产生的误差并不是抽样误差。
★方法:一是抽签;二是利用随机数表来抽样
抽签
先将研究总体中的每一个单位统一编号,使每 一个单位都有一个号,然后将每一个号作成一 个卡号并且混合均匀,最后从中随机抽取卡片, 直到抽到额定的数目为止。这种方法在一般日 常生活中用得比较多。
利用随机数表抽样的具体步骤:
(1)先取得一份总体所有元素的名单(抽样框); (2)将总体中所有元素一一按顺序编号; (3)根据总体规模是几位数来确定从随机量表中选几
三 、抽样的类型
根据抽取对象的具体方式,我们可以把抽样分 为两个大的类型:概率抽样和非概率抽样。
概率抽样是依据概率论的基本原理,按照随机 原则进行的抽样,它能够避免抽样过程中的人 为误差,保证样本的代表性。
非概率抽样则主要依据研究者的主观意愿,判 断或是否方便等因素来抽取样本,它不考虑抽 样中的等概率原则,因而往往产生较大的误差, 难以保证样本的代表性。
分析
概率抽样的方法
简单随机抽样 系统抽样 分层抽样 整群抽样 多段抽样
非概率抽样
1、偶遇抽样 2、判断抽样 3、定额抽样 4、雪球抽样
第二节 概率抽样的原理与程序
一、概率抽样的基本原理
随机抽取式概率抽样的关键 在概率抽样的过程中,我们要保证总体中的每
一个个体都有同等的机会入选样本,而且,任 何一个个体的入选与否,与其他个体毫不相关、 互不影响。(单选) 当总体情况不明时,无法做到随机抽样。
1.总体population:调查研究的全部事物,是构 成它的所有元素的集合。
人口普查——全国人口 某省大学生择业 在社会调
观念调查——某省全体大学生查表中示用N
在社会调 查中用n
表示
总体与样本
总体
样
样本统计量
本
例如:样本均
值、比例、方
差
实际抽样中,抽样单位往往是多层次的。如 调查家庭,通过县-乡-村三级抽样,抽样单 位为乡、村、家庭三种,分别为初级抽样单 位、次级抽样单位和终极抽样单位。
第六章 抽样
第六章 抽样
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、户内抽样与PPS抽样 五、非概率抽样方法 六、样本规模与抽样误差
普遍调查
普遍调查通常简称普查,它指的是对构成总体 的所有个体无一例外地进行调查。比如全国人 口普查,就是对全国所有人口逐个进行调查。
第四章 抽样
置信水平与置信区间
(1)置信水平(Confidence Level) 也称置信度,指的是总体参数值落在样本统计值某一区间内的 概率。
(2)置信区间(Confidence Interval) 是指在一定范围的置信水平下,样本统计值与总体参数值之间 的误差范围
(3)置信水平与置信区间的关系
﹠置信水平反映的是抽样的可靠性程度,置信 区间反映的是抽样的精确性程度。
﹠在其他条件不变的情况下,置信水平越高, 置信区间越大;置信水平越低,置信区间越小。 对抽样的可靠性程度要求越高,抽样的精确性 程度将越低;对抽样的可靠性程度要求越低, 则抽样的精确性程度将越高。
异质性
社会中由不同的个人所组成的各种群体、组织等构成了社会 调查的研究总体。它们所包含的个体相互之间总是存在着 或大或小的差异,这种差异就用异质性来表示。
界定总体是达到良好的抽样效果的前提条件。如果不 清楚明确界定总体的范围与界限,即使采用最严格的抽 样方法,也可能抽出对总体严重缺乏代表性的样本来。
三、抽样的一般程序
1.界定总体
但当年,盖洛普民意测验所只调查了3000人,就对 投票结果作出了准确的预测。
其中一个很重要的原因便是对抽取样本的总体缺乏 清楚认识和明确的界定。
同质性
一个总体中的各元素之所以会归为这个总体中,总是存在 着一些相似点或共同特征。同质性就是指总体中个体相互 之间的相似程度,它与异质性相对应。
25
2021/4/13
放回抽样
是指每次从总体中抽取一个单位进行观察后再 把这个单位重新放回总体,使之继续参加下次 抽选。
不放回抽样
是指每次从总体中抽取一个单位进行观察后,
指的是抽样设计能够从样本自身计算出有效的估计值 或抽样变动的近似值。
3、可行性原则
研究者所设计的抽样方案必须在实践中切实可行。
4、经济性原则
抽样方案的设计要与研究的可的资源相适应。
第三节 概率抽样方法
一、简单随机抽样
又称纯随机抽样,是概率抽样的最基本形式。 它是按照等概率原则,直接从含有N个元素中 的总体中抽样n个元素组成样本。抽样时不进 行任何分组排列,使总体中的任何个体都有同 等被抽中的机会。其典型就是抽签。
抽样调查的特点(一)
抽样调查非常节省时间、人力和财力,这也许 是抽样调查最突出的优点。
抽样调查可以十分迅速地获得资料数据。
抽样调查的特点(二)
抽样调查可以比较详细地收集信息,获得内容 丰富的资料。
应用范围十分广泛。 准确性高。
第一节 抽样的意义与作用
第一节 抽样的意义与作用
一、抽样概念
情况,这样很容易把一户重复列入抽样框,使得他们 在抽样中的中选概率高于其他居民,相反,许多城市 居民居住条件比较差,很多居民同住在一个门牌号中, 因此很容易遗漏。两种情况均违背了随机抽样的等概 率原则。
52
3.决定抽样方案(准备采用哪种抽样方法)
4.实际抽取样本
5.评估样本质量 评估样本:对样本的质量、代表性、偏差等等 进行初步的检验和衡量,防止由于样本的偏差 国大导致的失误。
位数; (4)以总体规模为标准,对随机数表中的数码逐一进
行衡量并决定取舍; (5)根据总体规模的要求选择出足够的数码个数; (6)依据从随机数表中选出的数码,到抽样框中找出
它所对应的元素。
随机数表的使用举例P329
从3000总体中抽取100人 作为样本
1 取得总体名单;
随机数表中的数 码
评估样本的正误
如果总体的资料分布与样本的资料分布基本上一致, 则我们对样本的代表性就有较大的信心。
Hale Waihona Puke 年龄总体样本(n=1000)
(N=100000)
15~17
30
28
18~22
50
51
23~25
20
21
四、抽样设计的原则
1、目的性原则
即要以课题研究的总体方案和研究目标为依据。
2、可测性原则
二、系统抽样
系统抽样又称等距抽样或机械抽样。它是把总 体的单位进行编号排序后,再计算出某种间隔, 然后按这一固定的间隔抽取个体的号码来组成 样本的方法。
具体步骤
(1)给总体中的每一个个体按顺序编号,即 制定出抽样框。
(2)计算出抽样间距。计算方法是用总体的 规模除以样本的规模。假设总体规模为N,样 本规模为n,那么抽样间距K就由下列公式导出:
8432990906
选用 的数 码
0906
不选原因
2 从1到3000编号; 3 从随机数表中选择4位
1053873020 9427410041 0139022507