当前位置:文档之家› 抽样调查与推断

抽样调查与推断

主要内容
第一节 抽样推断概述 第二节 抽样误差 第三节 抽样估计 第四节 抽样调查的组织方式与抽样方法 第五节 样本容量的确定
第一节 抽样推断概述
一、抽样推断的特点
(1)抽样的目的是由部分来估计和判断整 体。
(2)抽样是建立在随机抽样的基础之上的。 (3)抽样推断是运用概率估计的方法,其
的可能数目记作
C
n N
,由下列公式计算:
C
n N
N(N
1)( N
2) n!
(N
n 1)
N! n!( N n)!
③不考虑顺序的重复抽样
• 即通常所说的可重复组合数。一般的说,从总体的 N个单位中抽取n个允许重复的组合数记作 DNn,它 等于N+n-1个不同单位每次抽取的n个的不重复组 合,亦即:
P N1 N
Q N0 N N1 1 P
N
N
总体标准差、方差的计算与表达
( Xi X )2 ,
N
2 ( X i X )2
N
(2)样本指标
由样本中各单位的标志值或属性特征计算 的指标。
分别和总体指标对应,包括样本平均数、 样本成数、样本标准差、样本方差等。
样本平均数的计算与表达
检验,来判断这种假设是否正确,以决定行动的 取舍。
三、抽样推断的几个基本概念
1. 总体与样本 (1)总体:是所要认识的研究对象的全体,
它是由某些具有共同性质或特征的个体或 单位组成。 总体分类:
若研究其单位的品质标志,则把这个总体称为 属性总体;
若研究其单位的数量标志,这把这个总体称为 变量总体。
不同性质的总体计算不同的总体指标: 变量总体-总体平均数,标准差; 属性总体-总体成数。
总体平均数的计算与表达
• 设总体变量X有N个取值:X1,X2,X3,…,XN ; • 总体平均数用 X 表示,则有:
N
X
X1 X2
XN
Xi
i 1
N
N
总体成数的计算与表达
• 设总体N个单位中,有N1个单位具有某种属性, N0个单位不具有某种属性,则N1+N0=N,P为总 体中具有某种属性的单位数所占的比重,Q为总 体中不具有某种属性的单位所占的比重,则总体 成数为:
---接上页
(2)样本:是总体的一部分,它是由总体 中抽出来进行调查或观察的单位组成。
(3)N:总体单位数,n:样本单位数;
n>30称大样本, n<30称小样本;
2. 总体指标和样本指标
(1)总体指标: ①概念:根据总体各单位的标志值或属性
特征计算的反映总体某种特征的指标,也 称母体参数或参数。 ②总体指标的计算:
p n1 , n
q n0 n n1 1 p nn
样本标准差的计算与表达
S
(xi x)2 ,
n
S*
(xi x)2 n 1
样本成数的标准差
S p p(1 p)
S*p
n p(1 p) n 1
3.样本容量与样本个数
• 样本容量:是一个样本中所包含的单位数n.
• 样本个数:是指从总体中可能抽取或可能 构成样本的数目。
(1)登记性误差:即在调查过程中由于主客观原 因引起登记上的差错所造成的误差。
(2)代表性误差:即样本的结构情况不足以代表 总体的结构情况。分两种情况:
①一种是由于违反抽样调查的随机原则,形成的误差 称系统性的代表性误差(偏差);
②另一种是即使遵守随机原则,由于被抽选出的样本 有各种各样,只要被抽中的样本其内部各单位被研究 标志比例与总体有所出入,就会出现或大或小的偶然 性的代表性误差。
• 根据对样本要求不同,又分为考虑顺序抽 样和不考虑顺序抽样;前者如数字。
• 两种分类有交叉,形成四种抽样方法。
① 考虑顺序的不重复抽样数目
• 即通常所说的不重复排列数。一般的说,从总 体的N个单位中每次抽取n个不重复的排列,组 成样本的可能数目记作 ANn ,由下列公式计算:
An N ( N 1)( N 2) ( N n 1) N!
DNn
Cn N n1
第二节 抽样误差
一、抽样误差的概念
1. 抽样误差的概念 抽样误差是指样本指标数值和总体相应的
指标数值之间的差别,如样本均值与总体 均值,样本成数与总体成数。
一般所说的抽样误差通常是指偶然性的代 表性误差,不包括登记性误差和系统性的 代表性误差(偏差)。
2. 误差的来源
• 可知对于无限总体可能构成的样本的数目 是无穷多个;
• 而有限总体与抽样方法有关:如6个人组成 的总体抽取2个人的可能样本数目,重复简 单随机抽样时为36个,不重复简单随机抽 样时为15个。
4. 抽样方法与样本可能数目
• 在抽取样本单位时,又分为重复(放回) 和不重复(不放回)两种抽样方法。前者 抽完登记后放后,每次总体为N,而后者 不放回,抽样总体依次减少;
N
( N n)!
②考虑顺序的重复抽样
• 即通常所说的可重复排列数。一般地说,从总 体的N个单位中每次抽取n个允许重复的排列, 组成的可能数目记作BNn ,由下列公式计算:
BNn N n
③不考虑顺序的不重复抽样
• 即通常所说的不重复组合数。一般的说,从总体
的N个单位中每次抽取n个不重复的组合,组成的
• 设样本有n个变量值:x1,x2,…, xn, 则样本平均 数为:
n
x
x1
x2
xn
x1
i 1
n

n
样本成数的计算与表达
• 设样本n个单位中n1个单位具有某种属性, n0个 单位不具有某种属性,则n1 +n0=n,p为样本中具 有某种属性的单位所占比重,q为不具有某种属性 的单位所占比重,则样本成数为:
误差不仅可以事先计算,而且可以控制。
二、抽样推断的作用
(1)在无法进行全面调查或进行全面调查有困难 时,可以运用抽样调查来推断总体。
(2)采用抽样调查,可以节省费用和时间,提高 调查的时效性和经济效果。
(3)采用抽样调查,可以来对全面资料作检验和 修正。
(4)抽样推断可以用于工业生产过程的质量控制。 (5)利用抽样原理还可以对某种总体的假设进行
3.影响误差的因素
(1)抽样单位数的多少;
其它条件同,抽样单位数越多抽样误差越小
(2)总体被研究标志的变异程度;
其它条件同, 总体单位变异越小误差越小
(3)不同的抽样组织方式和抽样方法。
不同方法形成的样本对总体的代表性有差异: 等距抽样、类型抽样比简单随机抽样、整群抽 样代表性好,误差要小些;
相关主题