当前位置：文档之家› 深圳大学高数课件—统计学原理第六章抽样调查

深圳大学高数课件—统计学原理第六章抽样调查

实际中常常采用抽样调查。
一、全及总体和抽样总体例如：在100万户居民中，随机抽取1000户居民进行家庭收支情况调查，其中的100万户居民就是全及总体，而被抽中的1000户居民则构成抽样总体。
二、全及指标和抽样指标根据全及总体各个单位的标志值或标志特征计算的，反映总体某种属性的综合指标。
对于变量总体，也能计算总体成数
假定总体各个单位的标志值 X1 , X2 , ……, XN
I a , X 1 , I a , X 2 ,, I a , X N
P
I a , X 1 I a , X 2 I a , X N N 取值大于a 具备某种特征的单位数 P N
t称为概率度，是以抽样平均误差为尺度来衡量的相对误差界限。
t
x
x
P x X Δx tμ x

近似服从正态分布
xX P t μx xX P t t μx
t t
P x X Δx tμ x
例

t t
当可信程度为68.27%时，抽样极限误差等于抽样平均误差的1倍(t=1); 当可信程度为95.45%时，抽样极限误差等于抽样平均误差的2倍(t=2); 当可信程度为99.73%时，抽样极限误差等于抽样平均误差的3倍(t=3);
P x X Δx tμ x
所有可能出现的样本指标与总体指标的平均离差——抽样平均误差。
Ex X
2
若共有K个可能样本，每个样本被抽中的概率都是1/K
x X Ex X K
2
2
所有可能出现的样本指标与总体指标的平均离差——抽样平均误差。
抽样平均误差的作用：
1. 可说明样本指标的代表性大小。
变量总体各个单位的标志值X1 ,X2 ,……,XN
未知
X1 X N 总体平均数 X N
总体方差

2
X
N i 1
i
X
2
N
属性总体
具备某种特征的单位数总体成数 P N 不具备某特征的单位数 Q N
N1 N N N1 N
对于变量总体，计算总体平均数；对于属性总体，计算总体成数。
缺点：过程受主观意识影响样本代表性没有保证
抽样调查的特点：（一）目的：由样本推断总体
总体
样本
抽样调查的特点：（二）抽样时遵循随机原则
选择样本有确定的程序访问员没有权利自己去选择被访问的对象（三）抽样时产生的抽样误差可以计算，并且可以加以控制。
抽样调查的适用范围
有些事物在测量或试验时具有破坏性，不可能进行全面调查。汽车安全性的测试食品卫生检查种子的发芽情况总体数目比较多抽样调查节省人力、物力、财力，而且比较灵活。

t t
P x x X x x t t
1.计算样本平均数； 2.计算抽样平均误差； 3.计算抽样极限误差； 4.确定置信区间；
P277
例题
某机械厂日产某种产品8000件，现采用纯随机不重复抽样方式(按重复抽样公式计算)，从中抽取400件进行观察，其中有380件为一级品，试以 95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。
抽样调查的适用范围
有些情况下，抽样调查的结果比全面调查要准确。登记性误差统计误差尽量避免
代表性误差
不可避免
第二节抽样调查的基本概念及理论依据
全及总体，简称总体：所要认识对象的全体。总体：在同一性质基础上结合起来的许多个别单位所形成的整体。研究某城市教师的收入水平，该城市的全部教师构成了总体。研究某高校教学设备的完好情况，
n
在重复抽样条件下，抽样平均误差与样本容量的平方根成反比。
为了增强样本平均数对总体平均数的代表性，应尽可能增大样本容量。
不重复抽样条件下抽样平均数的抽样平均误差
记第i次抽取结果为xi， x1 , , xn 同分布
x
E x E x
2

n
N -n N -1
样本平均数的标准差
误差小，则样本指标代表性高；
2.计算样本指标和总体指标差异范围的依据。
重复抽样条件下抽样平均数的抽样平均误差
记第i次抽取结果为xi
x1 , , xn 独立同分布
E x X
x
E x E x
2

n
样本平均数的标准差
重复抽样条件下抽样平均数的抽样平均误差
x

计算抽样平均误差时和P都是全及指标，一般未知，通常采取如下方法解决：
1.用过去调查所得的资料。 2.用样本方差的资料代替总体方差。
3.用小规模调查资料。
影响抽样平均误差的因素
（一）全及总体标志变异程度。——正比关系（二）抽样单位数目的多少。——反比关系（三）抽样的组织方式。
x

n
以一定的可靠程度保证抽样误差不超过某一给定的界限（即抽样极限误差）。
P x X x 0.95 x
P x X x x 0.95

置信区间
P x x X x x 0.95
3.可信程度
x X x t x
样本
性别人数 n1 男女 n-n1
抽样成数的抽样平均误差品质标志
性别人数 N1 男 N-N1 女
数量标志
是非标志性别 1 男 0 女人数 N1 N-N1
总体平均数=总体成数=P 样本平均数=样本成数=p 总体方差=PQ
抽样成数的抽样平均误差重复抽样条件下抽样平均数的抽样平均误差
x
抽样调查
广义的概念：抽取一部分单位进行观察。
分为随机抽样和非随机抽样
随机原则：是指在抽样时排除主观意识抽取调查单位，使每个单位都有一定的机会被抽中。
狭义的概念：随机抽样
非随机抽样：典型抽样方便抽样样本限于总体中易于抽到的一部分 “街头拦人法” 滚雪球抽样……
非随机抽样：优点：方便快速典型抽样方便抽样样本限于总体中易于抽到的一部分 “街头拦人法” 滚雪球抽样……
P329 单项选择题
1 2 3
第三节
抽样平均误差
统计数字与客观实际数量之间的偏离称为统计误差。
登记误差统计误差代表性误差
X 1 1.00 X 2 2.00 X 3 3.00 X 4 4.00
各个环节上的工作不准确而带来的。
X 1 1.52
X 2.50
415 .03 根据这一系数，再来修正工资总额，则：年报工资总额 3218 .1 (1 0.248 %) 3226 .09(万元)
(二)区间估计
1.区间估计的意义根据样本指标和抽样误差去推断全及指标的可能范围，它能说清楚估计的准确程度和把握程度。
2.抽样极限误差
抽样误差范围，是变动的抽样指标与确定的全及指标之间的离差的可能范围。
假定属性总体各个单位的标志特征男, 男, ……, 女 X1=1 , X2=1, ……, XN=0
X1 X 2 X N 1 1 0 总体平均数 N N 具备某种特征的单位数总体成数 N
计算总体成数可以看做计算总体平均数。
全及指标
总体平均数
X1 X N X N 具备某种特征的单位数总体成数 P N N
两种抽样方式下抽样平均误差的比较
重复抽样不重复抽样
N -n x x n n N -1 结论1：不重复抽样平均误差小于重复抽样平均误差。
结论2：当抽样比例n/N很小时，利用重复抽样平均误差计算公式。

抽样成数的抽样平均误差
E p P
2
总体
性别人数 N1 男女 N-N1
x1 1.00 x2 3.00
登记误差统计误差系统性误差代表性误差随机误差
系统性误差是由破坏随机原则而产生的。
系统性误差无法计算，应设法避免。
登记误差统计误差系统性误差代表性误差随机误差
抽样误差
随机误差指遵循了随机原则后样本指标和总体指标之间的差别。 x X
该校教学设备构成了全及总体。
数量指标
研究某城市教师的收入水平，
变量总体
该城市的全部教师构成了总体。
品质指标
研究某高校教学设备的完好情况，
属性总体
该校教学设备构成了全及总体。
根据总体中所包含的单位个数，可以分为有
限总体和无限总体。
实际中所面临的常常是有限总体（N）。
理论上可以对有限总体采取全面调查，
任何抽样误差因素。即用x直接代表X，用p 直接代表P。
例
在全部产品中，抽取100件进行仔细检查，得到平均重量x 1002克，合格率p 98%，我们直接推断全部产品的平均重量X 1002克，合格率P 98%。
估计出总体的平均指标，如何推断总体的总量指标？
1.直接换算法
抽样平均数(成数)×总体单位数=总体标志总量
x
择P329 1 2 3 6 判析题： 1 2
7
3
8 14
4
第四节全及指标的推断
一、抽样推断要求抽样推断就是按照已经抽定的样本指标来估计总体指标，或其所在的区间范围。
对抽样指标的评价准则无偏性一致性有效性
二、抽样推断的方法 (一)点估计
就是由样本指标直接代替全及指标，不考虑
总体方差

2
X

e商务文档

深圳大学高数课件—统计学原理第六章抽样调查

相关文档推荐：