当前位置:文档之家› 7第七章 抽样调查

7第七章 抽样调查


2 p
P(1
P)
PQ;
样本总体
n
x
n
x
;
x
xf f
p
n1 n
Sx S p
(x x)2
n ;Sx p(1 p) pq
(x x)2 f f
S
2 x
(x n
x)2
;
S
2 x
(x x)2 f f
S
2 p
p(1
p)
pq
(三)重复抽样与不重复抽样
1.重复抽样:是指把从总体中抽中的单位,经登记调 查后,再将其放回去,重新参加下一次的抽选,直 到抽取n个总体单位。又称为重置抽样或有放回抽 样。显然,采用此方法抽取样本时,某个总体单位 有重复抽中的可能,故其名。
(3)适用条件:适宜于总体单位多、情况复杂、差 异较大时使用。
(4)优缺点:优点是样本代表性较高、误差较小; 不足是误差的计算较麻烦.
2、抽取样本单位的具体方法
❖由于类型抽样是在分组后从各组中抽取样 本单位,因此,类型抽样条件下抽取样本 单位主要问题是,在总的样本容量确定后, 样本数目如何在各个组之间分配的问题。 类型抽样中,常用以下两种方法确定各层 间样本单位的分配比例。
❖本节介绍了抽样误差的概念、影响因素、 抽样平均误差的概念及其计算原理。
❖重点掌握简单随机抽样方式下抽样平均误 差的计算方法.
一、抽样误差的概念
❖抽样误差是指随机抽样所得的样本指标与 总体指标的随机误差。
登记

误差


偏差

代表
抽样实际误差
误差
随机
抽样平均误差
误差
抽样极限误差
(一)登记性误差与代表性误差
全及总体
单位数 :
N
平均数 : 成数 :
X X ; X XF
N
F
P N1 N
平均数的标准差 : x
(X X )2
N
; x
(X X )2 F F
成数的标准差 :
p P(1 P) PQ
平均数的方差 : 成数的方差 :
2 x
(X N
X
)2
;
2 x
(X X )2 F F
❖所谓交替标志,是指只有两种可能结果的标 志(是否,或是非)。如性别要么是男性, 要么是女性;再如考试成绩要么及格,要么 是不及格,等等。
❖所谓成数,就是指交替标志中具有某种特征 的单位数占全部总体单位数的比重.
(1)成数的平均数
❖ 下面以以总体成数为例说明。
❖ 设:N表示总体单位数;0表示不具有某种特征; 1表示具有某种特征。则:
(3)适用条件:适用面广,特别适宜于连续、大批量 生产的现象的调查。
(4)优缺点:优点是通常能保证样本均匀分布,减少 误差,提高样本的代表性;不足是有时可能有系统 (周期)性误差.
2、抽取样本单位的具体方法
❖只有不重复抽样方法。关键是第一个样本 单位的抽选。先按N / n =K求出抽样间隔; 再在第一组中按简单随机抽样的方法,抽 出第一个样本单位;然后再按抽样间隔K随 之确定其余样本单位。具体又可分为两种:
2.不重复抽样:是指把从总体中抽中的单位,经调查 登记后,不再放回去参加下一次的抽选,直到抽取 n个总体单位。显然,采用此法抽取样本时,某个 总体单位不可能被重复抽中,故其名。
(四)考虑顺序与不考虑顺序
1.考虑顺序:指抽取样本单位时,要考虑抽 中单位出现的先后顺序,如AB与BA是两 种不同的抽样组合。
1.总体:指要调查研究对象的全体,通常 称为全及总体或母体。
2.样本:指在全及总体中按随机原则抽取 的那部分单位所构成的集合体,通常称 为抽样总体或样本总体或子体.
(二)总体指标与样本指标
1.总体指标:指根据全及总体各单位标志值计算的有 关综合指标。由于全及总体是唯一确定的,故根据 全及总体计算的总体指标也是唯一确定的。常用的 总体指标有总体单位数、平均数、成数、标准差及 方差等,常用各种大写符号表示。
2.中心极限定理:是关于研究变量和的分布序 列的极限定理。它论证了在大样本的情况下, 抽样误差服从于正态分布,从而为抽样误差 的概率估计提供了理论基础及使用的方便。
(注意:本部分内容重在逻辑思维上的理解即可,深 层次的内容可参看有关数理统计方面的书籍).
二、抽样调查中的几个基本概念
(一)总体与样本
(1)等比例抽样:即各组按相同的比例抽取 样本单位。
(2)不等比例抽样:即各组抽取样本单位的 比例不完全相同。
(三)等距抽样
1、等距抽样的概念和特点
(1)概念:是指先按有关或无关标志将总体单位按一 定顺序排列,然后再按相等的距离或间隔抽取样本 单位的方式,又叫机械抽样。
(2)基本特点:先排队,再等距抽选样本。具体特点 有二:一是抽取样本单位的方法简便易行 ;二是估 计量的方差小,样本的代表性较高。
(2)成数的标准差
x
f
xf x x (x x)2 (x x)2 f
0 Q 0Q 0-P
P2
P 2Q1Fra bibliotekP 1P 1-P=Q Q2
Q2P
合计 P+Q p


P2Q Q2P
则: P
P2Q Q2P PQ
PQ(P Q) PQ
PQ
P(1 P)
故:
2 P
P(1
P)
各种抽样基本公式一览表
❖所谓登记性误差,又称为调查误差或工作 误差,它是指调查人员在调查过程中,由 于工作不认真(如粗心大意抄错、写错、 写漏等)或计量工具不准确而形成的调查 结果与实际结果之间的差别。这种误差是 可以尽量加以克服或避免的。
❖所谓代表性误差,是指根据部分(少数) 单位调查的结果去代表(或推断)全部单 位的数量特征时,两者之间的差别。这种 误差通常是不可避免的.
(四)抽样实际误差
面情况的现象; ❖用于不必要进行全面调查的现象; ❖用于对全面调查资料的评价与修正; ❖用于工业生产过程的控制,等等。 上述作用也可以说是抽样调查的应用范围.
(五)抽样调查的理论基础
1.大数法则:是关于大量的随机现象具有某种 稳定性质的法则。它论证了样本平均数趋近 于总体平均数的趋势,从而为抽样推断提供 了重要的理论依据。
2.样本指标:是根据抽样总体各单位标志值计算的综 合指标。由于从一个全及总体中可以抽取许多个不 同的样本,故样本指标是一个不确定的随机变量。 常用的样本指标有样本单位数、平均数、成数、标 准差及方差等,常用小写符号表示.
关于成数P的有关概念及计算问题
❖在抽样调查中,成数是针对交替(或是非) 标志而言的。
(二)偏差与随机误差
❖所谓偏差,是指在随机抽样中调查人员 (有意识地)破坏了随机原则抽样(即不 按随机原则抽样),由此形成的样本指标 与总体指标之间的差别。在抽样调查中, 通常所说的抽样误差是不包括偏差的,又 称为系统性误差。
❖所谓随机误差,是指由于随机抽样的随机 性由此而形成的样本指标与总体指标之间 的差别,通常也叫做抽样误差.
(1)按有关标志排队的等距抽样; (2)按无关标志排队的等距抽样.
(四)整群抽样
1、整群抽样的概念和特点
(1)概念:是先将总体全部单位划分为若干群 (组),然后以群为单位随机抽取若干群,对 抽中群内的所有单位全部进行调查的方式。
(2)基本特点:先分群,再以群为单位抽取样 本。
(3)适用条件:适宜于群内差异较小而群与群 之间差异较大现象的调查。
❖所谓随机数字表法,就是利用随机数字表 随机抽取样本单位的方法。
❖有关随机数字表法的具体内容,详见教材 (略).
(二)类型抽样
1、类型抽样的概念和特点
(1)概念:是先将总体中所有单位按某一标志分成 若干组(或类),然后再在各组中随机抽取样本单 位的方式。
(2)基本特点:先分组,再在各组中随机抽取样本 单位。
(三)抽样误差
❖所谓抽样误差,就是指在随机抽样中按随 机原则从总体中抽取一部分单位构成样本, 并计算出有关样本指标(如样本平均数或 成数),再通过样本指标去推断总体有关 指标(如总体平均数或成数)时两者之间 存在着的差别。简而言之,抽样误差就是 样本指标与总体指标之间的差别。
❖抽样误差是抽样调查不可避免的误差。因 为部分单位与全部单位的数量特征通常是 不可能完全一致的.
各种抽样方法下可能的样本组合计算公式
重复抽样
考虑顺序 :
BNn N n
不考虑顺序 :
D
n N
C
n N
n1
不重复抽样
ANn
N! (N n)!
C
n N
(N
N! n)!n!
(五)单阶段抽样与多阶段抽样
❖所谓单阶段抽样是指某次抽样时一次 就抽出样本单位的抽样。
❖所谓多阶段抽样是指需经两次或两次 以上的抽样,最后才抽样具体样本单 位的抽样。如我国职工家计抽样调查 采用省抽→县市→区(街)→居民家 庭户三阶段抽样技术.
(4)优缺点:优点是抽样组织工作较方便;不 足是有时误差较大,样本代表性较低.
2、抽取样本单位的具体方法
❖在整群抽样中,为避免抽样误差过大,一 般采用不重复抽样的方法;
❖抽选群的方法与简单随机抽样相同.
第二节 抽样误差
❖抽样理论是在研究误差的基础上逐步发展 和完善起来的,误差理论是抽样理论的核 心。
(4)优缺点:简单随机抽样优点是最符合 随机抽样原则;不足是编号做签的工作量 较大,总体单位数较多时无法使用且误差 往往较大.
2、简单随机抽样抽取样本单位的方法
❖简单随机抽样抽取样本单位的具体方法主 要有:
(1)抽签法(抓阄法)。具体作法是:当给 总体各个单位编号后,把号码写在结构均 匀的签(如同等大小的纸片等)上,将签 混合均匀后即可以从中抽取。抽签法简便 易行,然而对于较大的总体来说,编号、 做签条的工作量很大,且不易做到混合均 匀。因此,抽签法的应用有一定的局限性.
相关主题