当前位置：文档之家› 《抽样调查》PPT课件

《抽样调查》PPT课件

2、样本可能数目
1）考虑顺序的重复抽样
BNn k N n
2）考虑顺序的不重复抽样
ANn k N (N 1)
(N n 1) N ! (N n)!
3）不考虑顺序的不重复抽样
CNn
k
N (N 1)
(N n 1) n!
N! n!(N n)!
4）不考虑顺序的重复抽样
DNn
k
Cn N n1
确定各类型组的抽样单位数： (1)标志差异大的组多抽一些，标志差异小的组少抽一些——类型适宜抽样。 (2)按各组的单位数占总体单位数的比例来确定各组的抽样单位数，称为类型比例抽样，这是通常采用的方法。类型抽样适用于各组组间单位标志差异较大，而组内差异较小的情况。
2、区间估计
可以将误差控制在一定的范围内（即说明总
体指标在某一范围内的可能性大小）。
二、抽样极限误差
由于存在误差，而且抽样指标会随着样本的不同而变动。这样，可以在统计意义上，推断总体指标在一定范围内。样本指标与总体指标的离差绝对值就是
抽样极限误差。由于离差可正可负，整个变动的范
围区间称为置信区间。
x x X t x
p p P t p
抽样极限误差为t个抽样平均误差，或者是抽样平均误差的t倍。这个t就称为概率度或置信度。
显然，概率度与抽样极限误差成正比。
P（概率）
3 2 1
P F (t)
常用的t及对应的F（t）
t F(t)
1 0.6827
1.64 0.90
x 1
68.27% 95.45% 99.73%
总数未知时，则默认采用重复抽样的计算公式。若N已知，未表
明重复或不重复抽样，则一律采用不重复抽样的计算公式。
2、抽样平均误差的影响因素：
1）全及总体标志变动程度。总体标志变动越大，抽样平均误差越大，反之则越小。 2）抽样单位数的多少。其他条件不变，抽取的单位数越多，抽样平均误差越小，反之越大。
返回目录
第五节抽样方案设计
一、抽样方案设计的原则
1）保证实现抽样随机性的原则； 2）保证实现最大抽样效果原则。
二、抽样组织形式（一）简单随机抽样
1）直接抽选法； 2）抽签法 3）随机数码表法
（二）类型抽样（分类抽样、分层抽样）
类型抽样是先对总体各单位按一定标志加以分类，然后再从各类中按随机原则抽取样本，由各类中的样本组成一个总的样本。
3）抽样遵循随机原则；
4）会产生抽样误差，但误差可以计算和控制。
3、统计误差
统计数字与各种实际数量之间的差别。
登记误差：调查误差或工作误差，指在登记、汇总计算过程中产生的误差。（可以避免的）
代表性误差：用部分去推断总体产生的误差。
（一般不可避免）
返回目录
第二节基本概念及理论依据
一、基本概念 (一)全及总体和抽样总体
(N n 1)! n!(N 1)!
例如：一个盒子里有三个球，标号分别为1、2、3，现从中随机抽取两个。即N=3，n=2：
1）考虑顺序的重复抽样
BNn k 32 9
2）考虑顺序的不重复抽样
ANn
k
3! 6 (3 2)!
3）不考虑顺序的重复抽样
DNn
k
C2 3 2 1
6
123 1 11 12 13 2 21 22 23 3 31 32 33
这种误差的直接表现就是没有真实客观地搜集或记录被调查单位的标志值或标志特征，从而使所计算的统计量偏离其真实值。
登记性误差存在于所有的统计调查中，而且调查的范围越大、调查单位越多，产生误差的可能性越大。
登记性误差与测量工具的精度、测量技术、调查人员的责任心、被调查者的合作态度等密切相关。
代表性误差：抽样过程中产生的以及用部分去推断总体过程中产生的误差。（一般不可避免）
第一节概述
1、抽样调查概念
广义：抽Байду номын сангаас部分单位观察，并根据观察结果推断全体。
狭义：按照随机原则抽取部分单位观察，并运用数理统计方法，由部分对总体做出数量上的推断分析。
随机抽样：保证总体中各单位具有同等机会被抽中，客观地抽取样本，并推断总体。
2、特点
1）只抽取部分单位；
2）用部分推断总体；
3）抽样方法。重复抽样的平均误差大，不重复抽样的平均误差小。
4）抽样的组织方式。
返回目录
第四节全及指标的推断
一、概述
抽样调查的目的是为了用样本指标推断总体指标。对总体指标的估计方法有两种：一种是点估计，另一种是区间估计。
1、点估计： x X
或p
P
它不能说明误差大小，意义不大。但它可以
说明优良估计的标准。（无偏性、一致性和有效性）
第六章抽样调查
掌握
本章要求
1、基本概念 2、抽样指标计算 3、抽样平均误差的影响因素及计算 4、全及指标推断：抽样极限误差计算、置信区间计算 5、简单随机抽样重复抽样的必要抽样单位数计算
理解
1、抽样调查分类 2、抽样调查特点 3、全及总体分类及全及指标 4、抽样方式分类 5、抽样误差概念及分类 6、抽样平均误差影响因素 7、可信程度、概率度 8、抽样方案设计基本原则 9、主要的抽样组织方式种类
2 (1 n )
n
N
例
n
Nt 2 2
x
N x 2 t 2 2
np
Nt 2 p(1 p) N p2 t 2 p(1
p)
（二）确定抽样单位数的依据
1、抽样推断的可靠程度和精确度的要求；如果要求高则抽样单位多，反之则少。 2、总体标志的变异程度，大则多，小则少。 3、抽样组织方法。简单随机抽样所需要的抽样单位数一般大于类型抽样或机械抽样，不重复抽样所需要的抽样单位数少于重复抽样。 4、根据成本效益原则。
[pp, p p]
显然：当置信区间已知时，可以根据已知条件倒推，计算抽样平均误差、样本容量、概率度等。
五、简单随机抽样的必要样本容量的确定
(一）计算公式：
重复抽样： x tx t
2
n
p t p t
p(1 p) n
n t 2 2
x
x2
t 2 p(1 p)
np
p2
不重复抽样： x tx t
变量总体属性总体
x x X p pP
对上式去掉绝对值符号，并且移项可得到：
x x X x x pp P pp
置信区间： X [x x , x x ] P [ p p, p p]
置信区间是统计意义上的，即一定概率下，总体指标所落在的区间范围。
抽样平均误差说明估计的准确程度，因此可以将抽样平均误差作为误差单位（当然在不同的条件下，这个单位的具体值是不同的），抽样极限误差可以表示为多少个误差单位（即抽样平均误差的多少倍），表示为：
1、全及总体：所要认识对象的全体。它是唯一的、确定的。
变量总体：总体中总体单位的标志为数量标志属性总体：总体中总体单位的标志为品质标志
2、抽样总体：从全及总体随机抽取得部分单位的集合体。
一个全及总体中，可以抽取多个抽样总体，即抽样总体不是唯一的、确定的。一般认为，样本容量n大于或等于30个单位数时称为大样本，小于30个单位数时称为小样本。
代表性误差又分为两种：
➢偏差：系统性误差
由非随机因素（违背随机原则）造成样本代表性不足而产生的误差。表现为样本统计量的值系统性偏高或偏低。这种误差也属于工作态度、水平、技术等的问题。应尽量避免。
➢随机误差：偶然性误差遵循了随机原则的原则，由偶然因素引起样本结构不能
完全代表总体结构而产生的误差。偶然误差不可避免，即使没有登记误差和系统性误差，仍会存在误差。虽然不可避免，但可以估计和控制。偶然误差总和等于0。
4）不考虑顺序的不重复抽样
CNn
k
3! 3 2!(3 2)!
二、抽样调查的理论依据
1、大数定律：
该定律表明，当样本单位数n足够大时，抽样平均数 x
趋近于总体平均数 X ，抽样成数p趋近于总体成数P。这
为抽样推断提供了重要依据。
2、中心极限定律：
该定律证明，不论总体服从何种分布，只要它的数学期望和方差存在，从中抽取容量为n的样本，当n足够大，
N1具有某种属性的单位数， N0 不具有某种属性的单位数。
属性总体成数方差公式推导：
X
F
及格
1
N1
不及格
0
N0
则属性总体的平均数
X
XF 1 N1 0 N0 N1 P
F
N1 N0
N
P
(X X )2 f
(1 P)2 N1 (0 P)2 N0
f
N1 N0
(1 P)2 P P2 (1 P) P(1 P) PQ
则这个样本的平均数 x 趋于正态分布。这为抽样误差的概
率估计提供了依据。
返回目录
第三节抽样平均误差
一、抽样误差的概念和理解
1、抽样误差：来源于登记性误差和代表性误差。
登记性误差：调查误差或工作误差，指在调查、编辑、编码、汇总过程中由于观察、测量、登记、计算上的差错或被调查者提供虚假资料而引起的误差。
（1）重复抽样：
变量总体：x
2
n
n
为总体标准差
属性总体：P
P(1 P) n
P为总体成数
1 公式说明了，抽样平均误差仅为全及总体标准差的 n。
（2）不重复抽样：
x
2 (N n)
n N 1
2 (1 n ) (当N很大时）
nN
P
P(1 P) (1 n )
n
N
当抽样比大大小于1时，不重复抽样的抽样平均误差与重复抽样的平均误差就非常接近。

e商务文档

《抽样调查》PPT课件

相关文档推荐：