当前位置:文档之家› 抽样调查概述

抽样调查概述

在统计调查中,调查资料与实际情况不一 致,两者的偏离称为统计误差。
登记误差
统计误差
系统性误差
代表性误差
实际误差
随机误差
平均误差
抽样误差即指随机误差,这种误差是抽 样调查固有的误差,是无法避免的。
抽样误差就是指样本指标和总体指标之间数 量上的差别,即 x X 、p P 。
抽样误差的影响因素:
1. 全及总体标志变异程度。——正比关系 2. 抽样单位数目的多少。——反比关系 3. 不同的抽样方式。 4. 不同的抽样组织形式。
p
p(1 p) n
0.98 (1 0.98) 1.14% 150
若按不重复抽样方式:
p
p(1 p) (1 n )
n
N
0.98 (1 0.98) (1 150 ) 1.1374%
150
15000
(二)类型抽样的抽样平均误差
在重复抽样情况下:
2 i
x
n
2 i
2 i
N
i
N
简单随机抽样 类型抽样 机械抽样 整群抽样
(一)简单随机抽样(纯随机抽样)
即从总体单位中不加任何分组、排队, 完全随机地抽取调查单位。
随机抽选可有各种不同的具体做法,如: 1.直接抽选法; 2.抽签法; 3.随机数码表法;
(二)类型抽样(分类抽样)
先对总体各单位按一定标志加以分类 (层),然后再从各类(层)中按随机原则抽 取样本,组成一个总的样本。
第六章 抽样调查
第一节 抽样调查的基本概念与组织形式
一、抽样调查的意义
一般所讲的抽样调查,即指狭义的抽样
调查(随机抽样):按照随机原则从总体中抽 取一部分单位进行观察,并运用数理统计的 原理,以被抽取的那部分单位的数量特征为 代表,对总体作出数量上的推断分析。
二、抽样调查的适用范围
抽样调查方法是市场经济国家在调查方法
根据以往资料,产品质量不太稳定,若σ=200 小时,
于是: 20(小时)
(2)不重复抽样:
x
2 N n

n N1
但实际中, 往往N很大,n很小,故改用下列公式:
2
n
(1 )
x
n
N
上例中,若为不重复抽样,则:
400 (1
100 ) 1.99(小时)
x 100 10000
2.成数的抽样平均误差
1. 如果是重复抽样:
(1)考虑顺序的重复抽样:BNn N n(样本种数)
例 505 312,500,000种
(2)不考虑顺序的重复抽样:DNn
Cn N n1
2. 如果是不重复抽样:
⑴考虑顺序的不重复抽样:
ANn
N(N
1)( N
2)(N
n 1)
N! ( N n)!

A5 50
50 49 48 47 46
(三)机械抽样(等距抽样)
先将全及总体的所有单位按某一标志
顺序排队,然后按相等的距离抽取样本单 位。
排列次序用的标志有两种:
1. 选择标志与抽样调查所研究内容无关,
称无关标志排队。 例 研究工人的平均收入水平时,按工号排队。
2. 选择标志与抽样调查所研究的内容有关,
称有关标志排队。
例 研究工人的生活水平,按工人月工资额高
符号
pi
1-pi
pi(1-pi)
ni
丘陵
80
20
16
600
96.0
平原
90
10
山地
60
40
合计
-
-
9
360
32.4
24
240
57.6
-
1200
186
P(1 P) pi (1 pi )ni 186 15.5%
ni
1200
p
P(1 P) (1 n )
n
N
0.155 (1 1200 ) 1.078% 1200 12000
(六)重复抽样和不重复抽样
以上每一种组织方式又有不同的抽取样本方 法(机械抽样和整群抽样没有重复抽样):
重复抽样:又称有放回抽样。

1 , 1 , 1 , 5000 5000 5000
不重复抽样:又称不放回抽样。

1 , 1 , 1 ,
5000 4999 4998
第二节 抽样平均误差
一、抽样误差的概念及其影响因素
低排队。
机械抽样按样本单位抽选的方法不 同,可分为三种:
1.随机起点等距抽样
示意图:
a
k
k
k
k+a
2k+a
k
(n-1)k+a
(k为抽取间隔)
2.半距起点等距抽样
示意图:
k
k
k
2
k
kk 2
2k k 2
k
(n 1)k k 2
(k为抽取间隔)
3.对称等距抽样
示意图:
a
k
2k-a k
k 2k+a
k
(1)抽出的群数(r)多少 (反比关系) (2)群间方差( ) (正比关系)
一般计算方法如下:
2 (xi x)2 r
x
r
xi 为抽样各群的平均数 x 为抽样各群的总平均数
2 p
( pi p)2 r r
pi 为抽样各群的成数 p 为抽样各群的总成数
(3) 抽样方法
整群抽样都采用不重复抽样,所以在计算抽样
麦田类型抽样的平均误差计算表
类 型 全场播 抽样调 单位面积 种面积 查面积 产量不均 (公顷) (公顷) 匀程度指 标(千克)
符号
Ni
ni
σi
2 i
ni
丘陵地区 平原地区 山地 合计
6000 3600 2400 12000
600 360 240 1200
750 840 1000 -
337500000 254016000 240000000 831516000
方差:总体方差 2、样本方差s2 标准差:总体标准差 、样本标准差s
抽样框 ——即总体单位的名单,是指对可以选择作为
样本的总体单位列出名册或顺序编号,以 确定总体的抽样范围和结构。
样本数——指从总体中可能抽取的样本的数量。 样本容量——指一个样本所包括的单位数。
四、抽样调查的组织形式
通常有以下四种组织形式:
在不重复抽样情况下:
2
n
i (1 )
x
n
N
在成数情况下:
重复抽样 : p
P(1 P) n
不重复抽样 : p
P(1 P)(1 n )
n
N

某农场种小麦12000公顷,其中平原3600公 顷,丘陵6000公顷,山地2400公顷,现用类型 抽样法调查1200公顷,以各种麦田占全农场面 积的比重分配抽样面积数量。
体的单位数量较多的情况;
5.利用抽样推断的方法,可以对于某种总体的假设进
行检验,判断这种假设的真伪,以决定取舍。
三、抽样调查的基本概念
(一) 全及总体和抽样总体(总体和样本)
全及总体:所要调查观察的全部事物。
总体单位数用N表示。
抽样总体:抽取出来调查观察的单位。
抽样总体的单位数用n表示。 n ≥ 30 大样本 n < 30 小样本
(三)机械抽样(等距抽样)的抽样平均误差
1.若按无关标志排队
一般采用简单随机抽样不重复抽样公式:
2 (1 n )
x
n
N
p
p(1 n
p)
(1
n N
)
2. 若按有关标志排队
一般用类型抽样重复抽样的公式:
x
2 n
p
p(1 p) n
(四)整群抽样的抽样平均误差
整群抽样的抽样平均误差受三个因素影响:
2. 用样本标准差S代替全及标准差σ;
3. 在大规模调查前,先搞个小规模的试验性的 调查来确定S,代替σ;
4. 用估计的方法。

某灯泡企业从一天所生产的产品10,000个中 抽取100个检查其寿命,得平均寿命为2000小 时(一般为重复抽样),根据以往资料:σ=20 小时,
202 2(小时) x 100
r 24
r
群间方差2
(pi
i 1
p)2 r
0.05669
0.002362
p
r
24
p
2
p
(1
r
)
rR
0.002362 (1
24
)
0.0095(或0.95%)
24
288
(五)多阶段抽样的抽样平均误差
以两阶段抽样为例
设总体分R组,每组包含M个i 单位,若各组 M相 等,则 N RM
在抽样第一阶段,从R组中抽出r组; 在抽样第二阶段,在中选的r组中随机抽选 m个i 单位,若各组m相等,则n=rm
误差时要使用修正系数 R r ,当R的数目较大
时,可用1
r R
R 1
来代替。
2 x
(1
r
)
x
r
R
p
2 p
(1
r
)
rR
例 假如某一机器大量生产某一种零件,现每隔一小
时抽取5分钟产品进行检验,用以检查产品的合 格率,检查结果如下:
合格率 80% 85% 90% 95% 98% 合计
群数r 2 4 12 3 3 24
抽样误差的作用: 1. 在于说明样本指标的代表性大小。
误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。
相关主题