当前位置:文档之家› 抽样调查-Ch2 基本概念-026

抽样调查-Ch2 基本概念-026

2.3 若干数学准备
2.1.2 抽样单元与抽样框 -2
抽样框 (sampling frame): 为了实施概率抽样, 将总体中的每 个抽样单元进行编号, 包含所有抽样单元的清册就称为抽样 框.
抽样框是抽样总体的一种表现形式, 是有关抽样单元的一组 信息, 是调查者直接或间接从总体中抽样的工具.
抽样框的特征: 没有重复或遗漏; 信息准确; 使用方便; 编制 与更新费用低.
有限总体:总体中所包含的单位数目是有限的. 如:一个地 区的人口, 一个企业的年产量等.
无限总体:总体中所包含的单位数目是无限的. 如:湖泊海 洋中的鱼尾数, 森林中的树的棵数等.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.1.2 抽样单元与抽样框 -1
抽样单元 (sampling unit): 将总体划分成互不重叠又穷尽的 有限多个部分, 每个这样的部分称为抽样单元.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.1.3 总体指标
总体指标: 根据总体中各单位的标志值计算出来的用于反映 总体的数量特征的目标量.
例如:一批灯泡的平均使用寿命; 一个城市职工家庭的年平 均收入等等都是总体指标.
2.2.1 简单随机抽样 -2
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.2.2 分层抽样 -1
分层抽样 (stratified sampling): 将总体按一定的原则分成若 干子总体, 每个子总体称为层, 在每个层内进行抽样, 不同层 的抽样相对独立, 这样的抽样称为分层抽样.
2.3 若干数学准备
2.2.6 不等概率抽样
不等概率抽样 (sampling with unequal probabilities): 若抽样 单元的入样概率不等, 这种抽样方法称为不等概率抽样.
使用范围: 当抽样单元大小不等时, 常采用不等概率抽样.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
总体容量 (population size):总体中所含单元的总数, N.
总体总量 (population total):Y˜ = ∑N Yi.
i=1
总体均值
(population
mean):Y¯
=
1 N
∑N
Yi.
i=1
总体比例
(population
proportion):P
=
N1 N
,
其中
N1
为总体
V(θˆ) = E[θˆ − E(θˆ)]2. √
S(θˆ) = V(θˆ).
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.3.2 估计误差的度量 -3
Bias, MSE, Var, SE 之间的关系

罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
抽样调查
罗季
数学与统计学院 浙江财经大学
2014-2015 (2)
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
第 2 章 基本概念
2.1 总体与样本
2.2 几种基本的抽样方法
2.3 若干数学准备
罗季
优点: 效率高——样本相对集中; 调查费用低; 不需要关于所 有小单元的抽样框.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.2.4 多阶抽样 -2
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.2.5 系统抽样 -1
系统抽样 (systematic sampling): 若总体中的单元都按一定 顺序排列, 在规定的范围内随机地抽取一个单元作为初始单 元, 然后按照一套事先确定好了的规则确定其他样本单元, 这种抽样方法称为系统抽样, 也称机械抽样.
特点: 样本单元是以整群形式出现的, 故称整群抽样; 这里的 群, 即 2.1.2 中所讨论的初级单元, 而群中的小单元是初级单 元中的次级单元; 抽样时, 值需要关于初级单元的抽样框, 而 不要求提供关于次级单元的抽样框.
优点: 费用低.
缺点: 样本量相同的条件下, 一般精度较差.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
=
1 N
∑N (Yi

Y¯ )2 .
i=1
总体方差 (修正):
S2
=
1 N−1
∑N (Yi
i=1
− Y¯)2.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.3.2 估计误差的度量 -1
抽样调查中的误差来源 非抽样误差: 计量误差, 抽样框误差, 无回答误差. 抽样误差: 由于样本的随机性引起的误差.
分层随机抽样: 每层的抽样都是简单随机抽样. 优点: 便于实施; 精度高.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.2.2 分层抽样 -2
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.2.3 整群抽样 -1
整群抽样 (cluster sampling): 先将总体的各个单元归并成数 量较少而规模较大的单元, 称为群, 抽样时仅对群进行, 对抽 中的群调查其每一个小单元, 对没有抽中的群则不进行调查, 这样的抽样称为整群抽样.
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.1.1 总体
总体 (population): 是指由调查或研究对象的全部单位所构 成的集合体.
例如:要调查某城市居民的年龄结构、受教育程度, 则该市 的全体市民就构成一个总体. 又如, 要调查某区所有职工家 庭收入情况, 则该区全部职工家庭便构成一个总体.
估计量的误差度量
设 θ 是感兴趣的总体参数 (指标), θˆ 是基于样本的 θ 的估计 量. 则 θˆ 的随机误差的度量值主要有以下三种:
偏倚 (Bias): 均方误差 (MSE): 方差 (Var): 标准误 (SE):
B(θˆ) = E(θˆ) − θ.
MSE(θˆ) = E(θˆ − θ)2.
特点: 只需抽取一个初始单元. 优点: 实施简单; 有利于提高精度. 缺点: 估计量的精度评价困难.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.2.5 系统抽样 -2
思考: 系统抽样与整群抽样的关系.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
误差的控制
非抽样误差: 不能通过加大样本量来控制. 抽样误差: 可以通过加大样本量来控制, 样本量越大, 抽样误 差越小.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.3.2 估计误差的度量 -2
2.3 若干数学准备
2.3.1 盒子模型 -1
一般抽样调查面临的总体只有有限多个初级单元. 从总体中 抽样, 就相当于从一个盒子里摸取若干张票, 盒子里的票数相当 于有限总体的单元个数, 票上记载着反映该单元特征的指标的值.
建模: 设总体有 N 个单元, 各指标值为 Y1, . . . , YN. 则盒子 模型为:
mean):¯y
=
1 n
∑n
yi.
i=1
样本比例
(sample
proportion):p
=
n1 n
,
其中
n1
为样本中具
有某个特定特征的个体数目.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.2.1 简单随机抽样 -1
本节介绍几种基本的抽样方法: 简单随机抽样, 分层抽样, 整 群抽样, 多阶抽样, 系统抽样, 不等概率抽样.
例如:在粮食农药污染调查中, 调查对象是粮食, 若按颗粒 计, 数量极大, 可以看成是无限总体. 可以将粮食分成各个包 装 (如麻袋), 甚至仓库, 每个包装或者仓库就是一个抽样单 元.
抽样单元的大小. 在上例中可看出, 抽样单元常可以分级. 按 规模, 可分为初级单元与次级单元.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.3.1 盒子模型 -2
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.3.1 盒子模型 -3
感兴趣的总体参数 (指标)
总体均值:

=
1 N
∑N
Yi
.
i=1
总体方差
(未修正):
σ2
中具有某个特定特征的个体数目.
罗季
抽样调查
2.1 总体与样本 2.2 几种基本的抽样方法
2.3 若干数学准备
2.1.4 样本
相关主题