第七章抽样推断
ˆ 若 n 越大 ˆ越小,则称 为 的一致估计量
抽样估计量的优良标准
数理统计证明:
x 为 X的无偏、有效、一致估计量; S n 1 的无偏、有效、一致估计量; 为
p 为 P的无偏、有效、一致估计量。
指样本估计量与总体参数之间数量 抽样误差 上的差异,仅指由于按照随机原则 抽取样本而产生的代表性误差,不 包括登记性误差和系统偏差
N n N n n 1 N 1 N N
不重复抽样时:
x 2 N n
n N 1
2
n 1 n N
抽样平均误差的计算公式 ⒉ 样本成数的抽样平均误差 重复抽样时:
p
不重复抽样时:
p
P P 1 n 当N≥500时,有 N n N n n 1 N 1 N N
说 明
对于任何一个样本,其抽样 误差都不可能测量出来 抽样误差的大小可以依据概 率分布理论加以说明
更大样本 容量的抽 样分布
某个样本 容量的抽 样分布
X
x n
抽样平均 误差
指每一个可能样本的估计值与 总体指标值之间离差的平均数, 即样本估计量的标准差
x
1 M
x
M i 1
2 x
通常情况下,分层抽样的抽样平均误差小于简单随 机抽样的平均误差)。
方法:
1、比例分配法; 考虑每层中的总体单位数,按比例在 每层中抽出相同比例的样本,即
nk n n1 常数 N N1 Nk
N1 N 2 N k N
每层的样本容量
Ni ni n N
2、奈曼最佳分配法: 考虑每层中总体单位的变异程度不同, 在样本容量一定的条件下,变异大的层样本容 量也大,变异小的层样本容量也小。每层的样 本容量为
第七章 抽样推断
★ 第一节 抽样法的概述
第二节
第三节 第四节
抽样误差
抽样的组织方式 抽样方案的设计
第五节
抽样估计方法
第一节 抽样法的概述
抽样法的概念与特点 抽样推断中的基本概念 抽样的方法 非抽样误差和抽样误差
抽样法的基本概念:
抽样调查是一种非全面调查。它按随机的原则
从总体中抽出部分单位(简称样本)进行调查,以 获得有关的数据资料。
不重复抽样:抽一个容量为n的样本时,每 次抽出一个单位进行登记。不再放回总体中, 继续进行次抽选,直至抽够 个样本点为止。 n 特点是: 每个总体单位不可能被重复抽中; 不考虑顺序的情况下,有个可能的样本 ; n CN n CN 。 每个总体单位被抽中的可能性为1/ 1/ N
NEXT
调查误差:
非抽样误差—在统计调查中,由于主客观原
p ~ N ( P , P P n) 1 np 5, n(1 p ) 5
样本抽样分布 10
抽样估计量的优良标准
设 为待估计的总体参数, ˆ为样本统 计量,则 的优良标准为: ˆ 无偏性 指样本指标的均值应等于被估 计的总体指标
x ~ N ( X ,
2
n)
比率的抽样分布 全部可能样本比率的均值等于总体比率, 即: E ( p) P ( p P) 从非正态总体中抽取的样本比率,当n足 够大时其分布接近正态分布。 从正态总体中抽取的样本比率,不论容 量大小其分布均为正态分布。 1 样本比率的标准差为总体标准差的 n
总体各单位的差异程度(即标准差 的大小): 越大,抽样误差越大; n 样本单位数的多少: 越大,抽样误 差越小; 抽样方法:不重复抽样的抽样误差 比重复抽样的抽样误差小; 抽样组织方式:简单随机抽样的误 差最大。
抽样极限误差
99.73%
95.45% 68.27%
3 x 2 x x
xx n p n1 n
S 2
S [
总体平均数 X
总体成数 P
样本平均数
样本成数
总体方差 2
总体标准差
样本方差
样本标准差
( x x )2
n 1
( x x )2
n 1 ]1 2
抽样方法:
重复抽样:抽一个容量为 n 的样本时,每次抽 出一个单位进行登记。再放回下总体中继续下次 抽选,直至抽够样本点为止。 特点是:每个总体单位可能被重复抽中; 有 N n 个可能的样本 ; 每个总体单位被抽中的可能性为1 / N。
抽样推断是根据抽样调查所获得的样本信息,
对总体的数量特征做出具有一定可靠程度的估计和 推断。 特点:按随机原则抽取样本;目的在于用样 本指标推断相应的总体指标进行估计、推断;可 以计算和控制抽样误差。
NEXT
抽样推断的基本概念:
全及总体: (总体) 所要研究的全部对象构成的整体。 总体单位:组成总体的每一个单位。 有限总体与无限总体;总体容量(N) 样本总体(样本):
dt
1
2
2
标准正态分布函数值表
若确定了保证程度 0.95, 1 则 0.05, x 1 应查 2 0.975
第三节 抽样的组织方式
简单随机抽样 分层抽样 等距抽样 整群抽样
多阶段抽样
简单随机抽样:简单随机抽样又称纯随机抽样, 是直接从总体中按随机的原则抽容量为 n 的样本, 每一个总体单位有相同的可能性被抽中。 特点:在差异较大的总体中,简单随机抽样的 样本不一定能保证样本的代表性。
NEXT
整群抽样:
概念:首先将总体划分为群 R;然后按随机的 原则不重复抽出群 r ,在每群中进行全面调查。 该调查方法适用于单位较多的总体。 与分层抽样相反的,整群抽样在群内是全面 调查,在群间是抽样调查。 计算抽样平均误差的公式:
x 2 Rr
r ( R 1 )
1 R N i ( xi X ) 2 N i 1
z值 1.00 1.65 1.96 2.00 2.58 3.00
概率保证程度 0.6827 0.9000 0.9500 0.9545 0.9900 0.9973
1
2
Z
x
1
Z
2
Z
2
2
t2 2
Z
1 e 2
dt
x
x
1 e 2
t2 2
P 1 P n 1 n N
P 1 P N n n N 1
抽样平均误差的计算公式 关于总体方差的估计方法
用过去同类问题全面调查或抽样调查的经 验数据代替; 用样本标准差 s代替总体标准差 ,用 s p 代替 P 。
影响抽样误差的因素
NEXT
第四节 抽样方案的设计 ★ 一、抽样估计的意义和一般步骤
二、抽样方案设计的基本准则 三、抽样方案设计的主要内容
一、抽样估计的意义和一般步骤
㈠ 抽样估计的定义 ㈡ 抽样估计的特点 ㈢ 抽样估计的运用 ㈣ 抽样估计的一般步骤 ㈤ 总体参数与样本指标
抽样估计
按照随机原则 从调查对象中抽取一部 分单位进行调查,并以调查结果对总体 数量特征作出具有一定可靠程度的估计 与推断,从而认识总体的一种统计方法
NEXT
分层抽样(类型抽样) 概念:首先将总体单位按某一个标志分层;然后在各
层按随机抽样的方法分别抽出各层的样本。
特点:分层抽样在层内是抽样调查,层间是全面调查,
所以分层时应该尽量让每层内的变异程度小,而层间的变 异程度大。分层抽样的抽样误差较简单随机抽样小,样本 具有很好的代表性。
1 1 k 抽样平均误差的计算公式: N i i2 n N i 1
比率(成数)
方差
统计量
x
p
S
2
平均数的抽样分布 全部可能样本平均数的均值等于总体均 值,即: E ( x ) X ( x X ) 从非正态总体中抽取的样本平均数当n 足够大时其分布接近正态分布。 从正态总体中抽取的样本平均数不论容 量大小其分布均为正态分布。 1 样本均值的标准差为总体标准差 n
按随机原则从总体中抽取的部分单位构成的 小总体。 样本单位:构成样本的每一个单位。
样本容量(n)
总体参数— 描述总体数量特征的指标。总体是惟一的, 所以参数也是惟一的; 样本统计量— 描述样本数量特征的指标,由样本计算而 得。由于样本是随机的,所以样本统计量 是随机变量。
总体参数 样本统计量 样本统计量公式
抽样极限误差的计算公式 (大样本条件下)
⒈ 样本平均数的 极限误差: ⒉ 样本成数的极 限误差:
x z x
p z p
Z为概率度,是给定概率保证程度下样本均值 偏离总体均值的抽样平均误差的倍数。
抽样极限误差的计算公式 (大样本条件下)
Z与相应的概率保证程度存在一一对应关系, 常用Z值及相应的概率保证程度为:
ˆ ˆ 若 E ( ) ,则称 为 的无偏 估计量
抽样估计量的优良标准 有效性
若 ˆ1
作为优良的估计量,除了满足无偏 性的要求外,其方差应比较小
ˆ ,则称 1 ˆ为比 更有效的估计量 ˆ 2
2
指随着样本单位数n的增大,样本 一致性 估计量将在概率意义下越来越接近 于总体真实值
2
NEXT
多阶段抽样:
概念:先将一个很大的总体划分为若干个子总 体,既一阶单位;再把一阶单位划分为若干个更小 的单位,称为二阶单位,照此继续下去划分出更小 的单位。然后分别按随机的原则,逐阶段抽样。最 终抽出 mn n 阶单位构成样本。 个 多阶段抽样的抽样误差的计算公式: 各阶段抽样误差的合计。例如二阶段抽样的抽 样平均误差的为: 2 2 1 2 x 重复抽样 n nm 2 12 n 2 m 不重复抽样 x (1 ) (1 ) n N nm M