当前位置:
文档之家› 优选第六章抽样调查课件Ppt
优选第六章抽样调查课件Ppt
全及总体:1、2、3、4、5。假设样本容量为3,则从全 及总体中采用不考虑顺序不重复的简单随机抽样,可以抽取 出10个抽样总体,这样就有10个样本平均数.
1,2,3
x1
1,2,4
x6
1,3,4
x2
1,2,5
x7
1,4,5
x3
3,4,5
x8
2,3,4
x4
1,3,5
x9
2,4,5
x5
2,3,5
x10
➢抽样方法和样本可能数目p 源自n1 nS p(1 p) pq
q n0 n
pq 1
n1 具有某种属性 , n0 不具有某种属性
▼抽样的目的就是通过观察样本的特征来推断总体的特征, 即用样本平均数用来推断总体平均数,而样本标准差作为总 体标准差估计值(当总体标准差未知)用来计算总体平均数 的估计区间(置信区间)。
例 某全及总体由1、2、3、4、5六个数字构成。
狭义:按照随机原则抽取部分单位观察,并运用数理统计 原理,由部分对总体做出数量上的推断分析。
一般地,属于随机抽样。
➢特 点
只抽取部分单位;
用部分推断总体;
抽样遵循随机原则;
会产生抽样误差,但误差可以计算和控制。
➢统计误差
统计数字与实际数量之间的差别。
登记误差: 调查误差或工作误差,指在登记、汇总计算过程中产 生的误差。(可以避免的)
考虑顺序的不重复抽样
ANn
N(N
1)(N
n 1)
N! (N n)!
不考虑顺序的不重复抽样
C
n N
N(N
1)(N n!
n 1)
N! n!(N n)!
考虑顺序的重复抽样
BNn N n
不考虑顺序的重复抽样
DNn
Cn N n1
➢抽样调查的理论依据
大数定律:证明了抽样平均数(成数)趋近于总体平均 数(成数)的趋势。
优选第六章抽样调查课件
抽样调查概述 基本概念及理论依据 抽样平均误差 抽样推断——均值的推断 抽样方案的设计 必要抽样单位数的确定
第一节 抽样调查概述
➢ 概念
广义:抽取部分单位观察,并根据观察结果推断总体。
非随机抽样: 通过主观判断,选取若干个有代表性的单位来推断
总体。 随机抽样:
保证总体中每个单位具有同等机会被抽中机会,抽 取样本,并推断总体。
全面调查不存在偶然误差。
▼随机误差可以分为实际误差和抽样平均误差 实际误差:样本指标与总体指标之间的差别,无法计算。 抽样平均误差:所有样本平均指标的标准差。可以计算。
抽样总体(样本):从全及总体随机抽取得部分单位的集合
体。
一般地, x 样本变量
n 样本单位数(样本容量)
x 样本均值 p 样本成数
n 抽样比: N
S 样本标准差
▼样本容量:一般样本容量大于30的称为大样本,小于30 个单位数的称为小样本。
一般地,一个全及总体中,可以抽取多个抽样总体,即抽 样总体不是唯一的,全部样本的可能数目与每个样本的容量 以及抽样方法有关。
这种误差的直接表现就是没有真实客观地搜集或记录被 调查单位的标志值或标志特征,从而使所计算的统计量偏 离其真实值。
登记性误差存在于所有的统计调查中,而且调查的范围 越大、调查单位越多,产生误差的可能性越大。
登记性误差与测量工具的精度、测量技术、调查人员的 责任心、被调查者的合作态度等密切相关。
代表性误差 由于样本的分布结构与总体分布不一致所差生的误差。
N 全及总体单位数 X 全及总体变量 X 总体平均数 P 全及总体成数
总体标准差
➢基本概念
全及总体:所要认识对象的全体。 变量总体:数量标志;
一般以N表示全及总体的单位总数, 表X示全及总
体的平均数, 表示全及总体的标准差。
属性总体:品质标志; 具有某种属性的单位占总体单位总数的比重,称为 总体成数P,标准差也用σ表示。
▼全及总体特征的描述
描述总体的特征一般采用均值和标准差。
☆全及总体是确定的,唯一的,因此全及指标也是确定的,
唯一的。
变量总体: X X
N
(X X )2
N
属性总体: P N1 1 Q N
2为总体方差
Q N0 N
σ P(1 P) PQ
P Q 1
N1 具有某种属性 , N0 不具有某种属性
这部分误差来源于抽样过程以及推断总体过程中(一般不 可避免)。 代表性误差又分为两种:
偏差:系统性误差 由非随机因素(违背随机原则)造成样本代表性不足而产 生的误差。表现为样本统计量数值系统性偏高或偏低。这种 误差也属于工作态度、水平、技术等的问题。应尽量避免。
随机误差:偶然性误差
遵循了随机原则的原则,由偶然因素引起样本结构不能 完全代表总体结构而产生的误差。偶然误差不可避免,即 使没有登记误差和系统性误差,仍会存在误差。 虽然不 可避免,但可以估计和控制。偶然误差总和等于0。
抽样方法
样本数目与样本容量有关,也与抽样方法有关,样本容 量既定,则样本数目取决于抽样的方法。
抽样方式不同
重复抽样 不重复抽样
样本要求不同
考虑顺序抽样 不考虑顺序抽样
以上结合为四种抽样方法:考虑顺序的重复抽样、考虑 顺序的不重复抽样、不考虑顺序的重复抽样和不考虑顺序 的不重复抽样。
不同抽样方法的样本可能数目
代表性误差: 用部分去推断总体产生的误差。(一般不可避免)
第二节 基本概念及理论依据
n 样本容量(样本中单位数)
x 样本变量
k 样本数
xi 第i个样本的均值(i 1,2,,k)
p 样本成数 S 样本标准差
x 变量总体抽样平均误差 p 属性总体抽样平均误差
x 变量总体抽样极限误差 p 属性总体抽样极限误差
▼抽样总体(样本)特征的描述
抽样总体(样本)特征也是通过均值和标准差来描述的。
不是确定的、唯一的,因此抽样指标也不是确定的、唯一 的,是样本变量的函数,是随机变量。
变量总体: n
xi
x i1 n
n
(xi x)2
S i1 n
S 2称为样本方差
对于分组资料采用加权的计算公式。(见第三章)
属性总体:
1)独立同分布大数定律:
2)贝努力大数定律:
中心极限定律:证明了多个随机变量和的分布趋近于正 态分布。抽样平均数就是一种随机变量。
1)独立同分布中心极限定律:
2)德莫佛—拉普拉斯中心极限定律:
第三节 抽样平均误差
➢抽样误差的概念和理解
抽样误差:来源于登记性误差和代表性误差
登记性误差
调查误差或工作误差,指在调查、编辑、编码、汇总 过程中由于观察、测量、登记、计算上的差错或被调查 者提供虚假资料而引起的误差。