第六章抽样调查资料
• 全及指标:反映总体数量特征的指标。 其数值是唯一的、确定的。
• 抽样指标:根据样本分布计算的指标。 是随机变量。
全及指标和抽样指标
总体
☺
☺ ☺
☺ ☺
☺☺☺
样本
☺☺ ☺
全及指标
X
、2
P
抽样指标
平均数
x
标准差、方差 S、 S2
成数
p
变量总体和属性总体
• 变量总体各单位标志值可用数量表示
X X N
代表性误差
偏差
随机误差
实际误差 抽样平均误差
抽样误差即指随机误差,这种误差是 抽样调查固有的误差,是无法避免的。
实际误差指样本指标和总体指标之间数 量上的差别,即 x X 、p P 。
二、抽样平均误差
抽样平均误差实际上是样本指标的标准 差。通常用μ表示。在N中抽出n样本,从 排列组合中可以有各种各样的样本组。
• 总体成数P是指具有某种特征的单位在总体中 的比重。成数是一种结构相对数,设总体单 位总数目是N,总体中有该特征的单位数是N1。 设x是0、1变量,则有:
P N1 N
样本成数
• 现从总体中抽出n个单位,如果其中有相应特 征的单位数是n1,则样本成数是:
p n1 n
• P也是一个随机变量,利用样本平均数的分布
第六章 抽样调查
第一节 抽样调查的意义 第二节 抽样调查的基本概念 第三节 抽样平均误差 第四节 全及指标的推断 第五节 抽样方案设计 第六节 必要抽样单位数的确定 第七节 假设检验
第一节 抽样调查的意义
一、抽样调查的概念
抽样调查是按随机原则,从全部研究 对象中抽取一部分单位进行观察,并根 据样本的实际数据,对总体的数量特征 做出具有一定可靠程度的估计和判断其 中心问题是如何根据已知的部分资料来 推断未知的总体情况。
二、抽样调查的特点
1.抽样调查是非全面调查。 2.抽样调查是用样本的指标数值去推算总 体的指标数值。 3.抽样调查是按随机原则抽选调查单位。 4.抽样调查中产生的抽样误差,可以事先 计算并加以控制。
第二节 抽样调查的基本概念
一、全及总体和抽样总体 二、抽样方法
1.重复抽样分布 2.不重复抽样分布
样本
34,34 34,38 34,42 34,46 34,50 38,34 38,38 38,42 38,46 38,50 42,34 42,38 42,42 42,46 42,50
样本平 均数 x
34 36 38 40 42 36 38 40 42 44 38 40 42 44 46
样本
46,34 46,38 46,42 46,46 46,50 50,34 50,38 50,42 50,46 50,50
E
A B EC D
B
AC BC
C
D
E
D
D
D
E
E
E
• 不考虑顺序时:样本个数
CNn
N! (N - n)!n!
E
三、大数定理
1
lim
n
p
n
n
xi X
i 1
1
当样本容量n 充分大时,可以用 样本平均估计总体平均。
lim
n
p
m n
Байду номын сангаас
p
1
当试验次数n充分大时,可以用 频率代替概率。
大数定理的意义:个别现象受偶然因素影响,但是,对总体 的大量观察后进行平均,就能使偶然因素的影响相互抵消, 从而使总体平均数稳定下来,反映出事物变化的一般规律。
样本平 均数 x
40 42 44 46 48 42 44 46 48 50
重置抽样分布--样本平均数的分布
样本平均数 x
34 36 38 40 42 44 46 48 50 合计
频数
1 2 3 4 5 4 3 2 1
25
E(x)
xf f
42(元)
2(
x)
(
x
X f
)2
f
16(元2)
• 验证了以下两个结论:
– 考虑顺序时:样本个数=Nn=52=25
– 不考虑顺序时:样本个数=
CNn
n
-
1
(N n-1)! (N -1)!n!
不重复抽样
• 例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2
A
A
B
B
AC D
BC D
C D
•
E
考虑顺序时:样本个数
E
PNn
N! E
(N - n)!
A B DC
E(x) X 2(x) 2
n
• 抽样平均数的标准差 反映所有的样本平均 数与总体平均数的平 均误差,称为抽样平 均误差,用 表示。
x
x
n
取得σ的途径有:
1. 用过去全面调查或抽样调查的资料,若同时 有n个σ的资料,应选用数值较大的那个;
2. 用样本标准差S代替全及标准差σ; 3. 在大规模调查前,先搞个小规模的试验性的
例
1 ,1 ,1 ,
5000 5000 5000
不重复抽样:又称不放回抽样。
例
1 ,1 ,1 ,
5000 4999 4998
重复抽样
• 例如从A、B、C、D、E五个字母中随机
抽取两个作为样本。N=5,n=2
A B AC D E
A B BC D E
A B CC D E
A B DC D E
A B EC D E
中心极限定理
中心极限定理:
1.独立同分布中心极限定理:
2
x~ NX,
n
2.德莫福-拉普拉斯中心极限定理:
X ~ N np,npq
大样本的平均数近似服从正态分布。
第三节 抽样平均误差
一、抽样误差的概念及其影响程度
在统计调查中,调查资料与实际情况不 一致,两者的偏离称为统计误差。
登记误差
统计误差
三、大数定理与中心极限定理
一、全及总体和抽样总体
全及总体:即总体,所要调查观察的全 部事物。总体单位数用N表示。
抽样总体:即样本,抽取出来调查观察的 单位。抽样总体的单位数用n表示。
n ≥ 30 大样本 n < 30 小样本
注 总体是唯一的、确定的,而样本是不确定的、 可变的、随机的
全及指标和抽样指标
性质结论,即有:
E( p) p
p
np 1 p
n-1
样本容量与样本个数
• 样本容量:一个样本中所包含的单位数, 用n表示。
• 样本个数:又称样本可能数目,指从一 个总体中所可能抽取的样本的个数。对 于有限总体,样本个数可以计算出来。 样本个数的多少与抽样方法有关。
二、抽样方法
重复抽样:又称有放回抽样。
注 抽样误差是由于抽样的随机性而产生的样本指
标与总体指标之间的平均离差。
按照定义:
x
( x X )2 K
重复抽样分布--样本平均数的分布
• 某班组5个工人的日工 资为34、38、42、46、 50元。
• = 42
• 2 = 32
• 现用重复抽样的方法 从5人中随机抽2个构 成样本。共有52=25个 样本。如右图。