第七章 抽样调查
例 题 四 解:
已知: N 60000 n 300 n1 6
则:样本合格率 p n n1 300 6 0.98
n
300
p
p1 p 0.98 0.02 0.Biblioteka 08(%)n300
p
p1
p 1
n
n N
0.98 0.02 1
300
0.806(%)
300 60000
=2
1+4 2
=2.5
2+4 2
=3
3+5 = 4 …….. 2
多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽 样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平 均误差是反映抽样误差一般水平的指标。
抽样平均误差的计算理论公式
抽样平均数 的平均误差
x
xX 2
M
抽样成数 平均误差
第五节 抽样单位数目的确定
第五节 抽样单位数目的确定
样本单位数的计算方法: 教材P302-306
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数 抽样成数
重复抽样:
n
t
2
2 x
2x
不重复抽样:
n
t
2
N
2 x
2x N t 2
2 x
n
t 2 p1
2p
p
n
t2 Np1 p N2p t 2 p1
产品质量 x 数量(件) f
合格品 1
N1
不合格品 0
N0
合计
N
平均数
x xf f
1 N1 0 N0 N1 P (成数)
N1 N0
N
(三)样本容量和样本个数
样本容量:一个样本包含的单位数。用 “n”表示。 一般要求 n ≥30
样本个数:从一个全及总体中可能抽取的样本数目。
(四)重复抽样和不重复抽样
例题四: 一批食品罐头共60000桶,随机抽查300桶 ,发现有6桶不合格,求合格品率的抽样平 均误差?
例 题 三 解:
已知: n 400 n1 80 则:样本成数 p n1 80 20%
n 400
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
抽样误差不包括下面两类误差:一类是调查误差, 即在调查过程中由于观察、测量、登记、计算上的差 错而引起的误差;另一类是系统性误差,即由于违反 抽样调查的随机原则,有意抽选较好单位或较坏单位
进行调查,这样造成样本的代表性不足所引起的误差。
二、影响抽样误差大小的因素
1、总体各单位标志值的差异程度 2、样本的单位数 3、抽样方法 4、抽样调查的组织形式
第四节 抽样组织设计
一、简单纯随机抽样
1、含义:按随机原则直接从总体N个单位中
抽取 n 个单位作为样本。
2、样本单位数的计算方法:
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数 抽样成数
重复抽样:
n
t
2
2 x
2x
不重复抽样:
n
t
2
N
2 x
2x N t 2
2 x
n
t 2 p1
2p
p
n
t2 Np1 p N2p t 2 p1
p
p P2
M
(以上两个公式实际上就是第四章讲的标准差。 但反映的是样本指标与总体指标的平均离差程度)
实际上,利用上述两个公式是计算不出抽样平均误差的。
想一想,为什么?
抽样平均数平均误差的实际计算方法
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正比, 与样本容量成反比。(当总体标准差未知时,可 用样本标准差代替)(教材P279例题)
愈低,但抽样估计的精确度愈高。
三、总体参数区间估计的方法
(一)根据给定的概率F(t),推算 抽样极限误差的可能范围
分 析 步 骤:
1、抽取样本,计算样本指标。 2、根据给定的F(t)查表求得概率度 t 。 3、根据概率度和抽样平均误差计算极限误差。 4、计算被估计值的上、下限,对总体参数作
出区间估计。
通过例题可说明以下几点: ①样本平均数的平均数等于总体平均数。
②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加 2 倍、0.5 倍时,抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
第七章 抽样调查
本章主要内容
•抽样调查的一般问题 •抽样误差 •抽样估计的方法 •抽样组织设计
第一节 抽样调查概述
一、抽样调查的概念:是一种非全面调查,
就是按随机原则从全部研究对象中抽取部分
单位进行观察,并根据这一部分单位的实际 数据推断总体的数量特征,作出具有一定可 靠程度的估计和判断。
二、 特点
它是由部分推断整体的一种认识方法。 建立在随机取样的基础上。 运用概率估计的方法。 其误差可以事先计算并加以控制。
三、有关的基本概念
(一)总 体 和 样 本
总体: 又称全及总体。指所要认识的 研究对象全体。总体单位总数用“N” 表示。
样本: 又称子样。是从全及总体中随机 抽取出来,作为代表这一总体的那 部分单位组成的集合体。样本单位 总数用“n”表示。
某厂生产一种新型灯泡共2000只,随机 抽出400只作耐用时间试验,测试结果 平均使用寿命为4800小时,样本标准差 为300小时,求抽样推断的平均误差?
例题一解: 已知: n=100 x=58
σ=10
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
抽样单位数增加 0.5倍,即为原来的 1.5倍
则: x
1.5n
1 0.8165 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。
与重复抽样相比,不重复抽样平均误差是在重复 抽样平均误差的基础上,再乘以 (N-n)(/ N-1) , 而 (N-n)(/ N-1)总是小于1,所以不重复抽样的平
• 习题:有5个工人的日产量分别为(单位: 件):6,8,10,12,14,用重复抽样的方法, 从中随机抽取2个工人的日产量,用以代表这5 个工人的总体水平。则抽样平均误差为多少?
若改用不重复抽样方法,则抽样平均误差为多 少?
•
解:根据题意可得:X
6
8
10 5
12
14
1(0 件)
(X X)2
40
8(件)
N
5
重复抽样条件下
抽样平均误差 x 8 2(件)
n2
不重复抽样条件下
抽样平均误差
x=
2
(
N
n )=
n N 1
8( 2
5-2 5-1
)=1.732(件)
抽样成数平均误差的实际计算方法
采用重复抽样:
p
p1 p
n
采用不重复抽样: p
p1
n
p 1
n N
例题三: 某校随机抽选400名学生,发现戴眼镜的学 生有80人。根据样本资料推断全部学生中戴 眼镜的学生所占比重时,抽样误差为多大?
计算结果表明:不重复抽样的平均误差小于重复抽样, 但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。
四、抽 样 极 限 误 差
抽样极限误差是指样本和总体指标之间误 差的可能范围。
由于总体指标是一个确定的数,而样本指 标则是围绕总体指标上下波动的,它与总体指 标之间既有正离差,也有负离差,样本指标变 动的上限或下限与总体指标之差的绝对值就可 以表示抽样误差的可能范围,我们将这种以绝 对值形式表示的抽样误差可能范围称为抽样极 限误差。
指标和总体指标的误差不超过一定范 围的概率保证程度(教材P284)
符号表示: P( x - X ≤Δ )x =F(t) (教材P286例题)
理论已经证明,在大样本的情况下,抽 样平均数的分布接近于正态分布,分布特 点是:抽样平均数以总体平均数为中心, 两边完全对称分布,即抽样平均数的正误 差与负误差的可能性是完全相等的。且抽 样平均数愈接近总体平均数,出现的可能 性愈大,概率愈大;反之,抽样平均数愈 离开总体平均数,出现的可能性愈小,概 率愈小,趋于0。(见下图)
p
二、类型抽样
先对总体各单位按主要标志加以分组,然后再从 各组中按随机的原则抽选一定单位构成样本。
三、等距抽样
先按某一标志对总体各单位进行排队,然后依一 定顺序和间隔来抽取样本单位的一种组织形式。
四、整群抽样
将总体各单位划分成许多群,然后从其中随机抽 取部分群,对中选群的所有单位进行全面调查的 抽样组织形式。
正态概率分布图
因为扩大或缩小以后 的平均误差,就是极 限误差: Δ=tμ 所以,抽样平均误 差的系数就是概 率度t。
68.27%
数理统计已经证明,抽样 误差的概率就是概率度的
函数,二者对应的函数 关系已编成“正态分布 概率表”。
95.45%
x-2μ x-1μ X
x+1μ x+2μ
由此可知,误差范围愈大,抽样估计的置信度愈高,但抽样估计 的精确度愈低;反之,误差范围愈小,则抽样估计的置信度
例 题 一:
某农场进行小麦产量抽样调查,小麦播种总面积
为1万亩,采用不重复简单随机抽样,从中抽选了