当前位置:
文档之家› 深圳大学高数课件—统计学原理第六章抽样调查
深圳大学高数课件—统计学原理第六章抽样调查
实际中常常采用抽样调查。
一、全及总体和抽样总体 例如:在100万户居民中,随机抽取1000户 居民进行家庭收支情况调查,其中的100万户 居民就是全及总体,而被抽中的1000户居民 则构成抽样总体。
二、全及指标和抽样指标 根据全及总体各个单位的标志值或标志特征 计算的,反映总体某种属性的综合指标。
对于变量总体,也能计算总体成数
假定总体各个单位的标志值 X1 , X2 , ……, XN
I a , X 1 , I a , X 2 ,, I a , X N
P
I a , X 1 I a , X 2 I a , X N N 取值大于a 具备某种特征的单位数 P N
t称为概率度,是以抽样平均误差 为尺度来衡量的相对误差界限。
t
x
x
P x X Δx tμ x
近似服从 正态分布
xX P t μx xX P t t μx
t t
P x X Δx tμ x
例
t t
当可信程度为68.27%时,抽样极限误差等于抽 样平均误差的1倍(t=1); 当可信程度为95.45%时,抽样极限误差等于抽 样平均误差的2倍(t=2); 当可信程度为99.73%时,抽样极限误差等于抽 样平均误差的3倍(t=3);
P x X Δx tμ x
所有可能出现的样本指标与总体指标 的平均离差——抽样平均误差。
Ex X
2
若共有K个可能样本,每个样本被抽 中的概率都是1/K
x X Ex X K
2
2
所有可能出现的样本指标与总体指标 的平均离差——抽样平均误差。
抽样平均误差的作用:
1. 可说明样本指标的代表性大小。
变量总体各个单位的标志值X1 ,X2 ,……,XN
未知
X1 X N 总体平均数 X N
总体方差
2
X
N i 1
i
X
2
N
属性总体
具备某种特征的单位数 总体成数 P N 不具备某特征的单位数 Q N
N1 N N N1 N
对于变量总体,计算总体平均数; 对于属性总体,计算总体成数。
缺点:过程受主观意识影响 样本代表性没有保证
抽样调查的特点: (一)目的:由样本推断总体
总 体
样 本
抽样调查的特点: (二)抽样时遵循随机原则
选择样本有确定的程序 访问员没有权利自己去选择被访问的对象 (三)抽样时产生的抽样误差可以计算, 并且可以加以控制。
抽样调查的适用范围
有些事物在测量或试验时具有破坏性, 不可能进行全面调查。 汽车安全性的测试 食品卫生检查 种子的发芽情况 总体数目比较多 抽样调查节省人力、物力、财力,而且 比较灵活。
t t
P x x X x x t t
1.计算样本平均数; 2.计算抽样平均误差; 3.计算抽样极限误差; 4.确定置信区间;
P277
例题
某机械厂日产某种产品8000件,现采用纯随机 不重复抽样方式(按重复抽样公式计算),从中抽 取400件进行观察,其中有380件为一级品,试以 95.45%的可靠程度推断全部产品的一级品率及一 级品数量的范围。
抽样调查的适用范围
有些情况下,抽样调查的结果比全面调 查要准确。 登记性误差 统计误差 尽量避免
代表性误差
不可避免
第二节 抽样调查的基本概念及理论依据
全及总体,简称总体:所要认识对象的全体。 总体:在同一性质基础上结合起来的许多 个别单位所形成的整体。 研究某城市教师的收入水平, 该城市的全部教师构成了总体。 研究某高校教学设备的完好情况,
n
在重复抽样条件下,抽样平均误差与样 本容量的平方根成反比。
为了增强样本平均数对总体平均数的 代表性,应尽可能增大样本容量。
不重复抽样条件下抽样平均数的抽样平均误差
记第i次抽取结果为xi, x1 , , xn 同分布
x
E x E x
2
n
N -n N -1
样本平均数的标准差
误差小,则样本指标代表性高;
2.计算样本指标和总体指标差异范围的依据。
重复抽样条件下抽样平均数的抽样平均误差
记第i次抽取结果为xi
x1 , , xn 独立同分布
E x X
x
E x E x
2
n
样本平均数的标准差
重复抽样条件下抽样平均数的抽样平均误差
x
计算抽样平均误差时 和P都是全及指标, 一般未知,通常采取如下方法解决:
1.用过去调查所得的资料。 2.用样本方差的资料代替总体方差。
3.用小规模调查资料。
影响抽样平均误差的因素
(一) 全及总体标志变异程度。——正比关系 (二)抽样单位数目的多少。——反比关系 (三)抽样的组织方式。
x
n
以一定的可靠程度保证抽样误差不超过某一 给定的界限(即抽样极限误差)。
P x X x 0.95 x
P x X x x 0.95
置信区间
P x x X x x 0.95
3.可信程度
x X x t x
样本
性别 人数 n1 男 女 n-n1
抽样成数的抽样平均误差 品质标志
性别 人数 N1 男 N-N1 女
数量标志
是非标志 性别 1 男 0 女 人数 N1 N-N1
总体平均数=总体成数=P 样本平均数=样本成数=p 总体方差=PQ
抽样成数的抽样平均误差 重复抽样条件下抽样平均数的抽样平均误差
x
抽样调查
广义的概念:抽取一部分单位进行观察。
分为随机抽样和非随机抽样
随机原则:是指在抽样时排除主观意识抽取调 查单位,使每个单位都有一定的机会被抽中。
狭义的概念:随机抽样
非随机抽样: 典型抽样 方便抽样 样本限于总体中易于抽到的一部分 “街头拦人法” 滚雪球抽样……
非随机抽样: 优点:方便快速 典型抽样 方便抽样 样本限于总体中易于抽到的一部分 “街头拦人法” 滚雪球抽样……
P329 单项选择题
1 2 3
第三节
抽样平均误差
统计数字与客观实际数量之间的偏离 称为统计误差。
登记误差 统计误差 代表性误差
X 1 1.00 X 2 2.00 X 3 3.00 X 4 4.00
各个环节上的工作 不准确而带来的。
X 1 1.52
X 2.50
415 .03 根据这一系数,再来修正工资总额,则: 年报工资总额 3218 .1 (1 0.248 %) 3226 .09(万元)
(二)区间估计
1.区间估计的意义 根据样本指标和抽样误差去推断全 及指标的可能范围,它能说清楚估计的 准确程度和把握程度。
2.抽样极限误差
抽样误差范围,是变动的抽样指标与确定的全 及指标之间的离差的可能范围。
假定属性总体各个单位的标志特征 男, 男, ……, 女 X1=1 , X2=1, ……, XN=0
X1 X 2 X N 1 1 0 总体平均数 N N 具备某种特征的单位数 总体成数 N
计算总体成数可以看做计算总体平均数。
全及指标
总体平均数
X1 X N X N 具备某种特征的单位数 总体成数 P N N
两种抽样方式下抽样平均误差的比较
重复抽样 不重复抽样
N -n x x n n N -1 结论1:不重复抽样平均误差小于重复抽 样平均误差。
结论2:当抽样比例n/N很小时,利用重复 抽样平均误差计算公式。
抽样成数的抽样平均误差
E p P
2
总体
性别 人数 N1 男 女 N-N1
x1 1.00 x2 3.00
登记误差 统计误差 系统性误差 代表性误差 随机误差
系统性误差是由破坏随机原则而产生的。
系统性误差无法计算,应设法避免。
登记误差 统计误差 系统性误差 代表性误差 随机误差
抽样误差
随机误差指遵循了随机原则后样本指标 和总体指标之间的差别。 x X
该校教学设备构成了全及总体。
数量指标
研究某城市教师的收入水平,
变量总体
该城市的全部教师构成了总体。
品质指标
研究某高校教学设备的完好情况,
属性总体
该校教学设备构成了全及总体。
根据总体中所包含的单位个数,可以分为有
限总体和无限总体。
实际中所面临的常常是有限总体(N)。
理论上可以对有限总体采取全面调查,
任何抽样误差因素。即用x直接代表X,用p 直接代表P。
例
在全部产品中,抽取100件进行仔细检查,得 到平均重量x 1002克,合格率p 98%,我们直接推 断全部产品的平均重量X 1002克,合格率P 98%。
估计出总体的平均指标, 如何推断总体的总量指标?
1.直接换算法
抽样平均数(成数)×总体单位数=总体标志总量
x
择P329 1 2 3 6 判析题: 1 2
7
3
8 14
4
第四节 全及指标的推断
一、抽样推断要求 抽样推断就是按照已经抽定的样本指标来 估计总体指标,或其所在的区间范围。
对抽样指标的评价准则 无偏性 一致性 有效性
二、抽样推断的方法 (一)点估计
就是由样本指标直接代替全及指标,不考虑
总体方差
2
X