当前位置:文档之家› 统计学第八章 抽样推断

统计学第八章 抽样推断



重置抽样和不重置抽样,二者造成误差 大小是不一样的。但当样本单位数只占 总体单位数的一个很小比例时,二者事 实上差别不大。因此,此时重置(复) 抽样结果可当不重置(复)抽样结果。 对带有破坏性的推断不适合重置抽样。
五、抽样推断的组织形式



㈠纯随机抽样——简单随机抽样 纯随机抽样是对总体所有单位,在抽取样本 前不进行任何的分组、排队,完全按纯随机 原则抽取一定的单位进行调查,别无其它限 制性措施存在。 抽样推断原理就是以纯随机抽样为基础阐述 的,它是最简单、最基本的抽样组织形式。 纯随机抽样适用于均匀总体且单位数较少的 情况。
三、抽样推断的作用
★ 降低调查成本,比全面调查节约人财物和时间; ☆ 对无法进行全面调查或没必要进行全面调查的现
象可采用抽样推断;
★ 抽样推断可对普查结果进行检查和修正;
☆ 抽样推断可以用于工业生产过程的质量控制;
★ 利用抽样推断可以对某些总体的假设进行检验。
四.抽样推断中的基本概念
(一)总体和样本
X
P
x4 p4
x2
p
2
x3
p
3
抽样平均误差μ(续1)


抽样平均误差是指所有可能样本的样本指 标与总体指标的平均离差。 由于标准差是反映平均离差程度的重要指 标。因此,通常用抽样平均数的标准差或 抽样成数的标准差作为衡量其抽样误差一 般水平的尺度。其理论公式为:
x
(x X ) M
2
P
(三)抽样方法(续1)


2.不重置抽样(不重复抽样)从总体中每次 抽取一个单位进行观察,登记后不再放回 总体中,依此直至抽取n 个单位。 不重置抽样的特点:
⑴ ⑵ ⑶ ⑷ n次抽取实质上等于一次同时抽取n个单位; n次抽取相互不独立; 总体单位在各次被抽中的概率不同; 总体单位不会被重复抽中。
(三)抽样方法(续2)
t
常用概率度与置信概率
《正态分布概率表》(摘录)
概率度t 1.00 1.64 1.96 2.00 2.58 3.00 置信概率F(t) 0.6827 0.9000 0.9500 0.9545 0.9900 0.9973 百分比% 68.27 90.00 95.00 95.45 99.00 99.73
㈡类型抽样——分层抽样
★ 类型抽样是先将总体按某个主要标志进行 分组,再从各组中按纯随机抽样方式抽取 样本单位。
N2
n2 n1
n3
N1
N3
㈡类型抽样——分层抽样(续1)

类型抽样适用总体内部差异较大的抽样。能使样本结 构趋于总体结构,提高样本代表性,从而改善抽样效 果。
实施类型抽样的前提:能找到正确的分类依据,则分 类确能够提高样本代表性。若分类依据选择不当,则 分类对提高样本代表性无益。 分类抽样的思想实质:分类的目的是控制偶然性的影 响以提高样本的代表性。

抽样极限误差△(续1)

抽样极限误差是在一定的概率保证程度 下,用样本指标对总体指标进行估计时 的最大可能误差。
抽样极限误差的计算公式



抽样极限误差以抽样平均误差为标准来衡 量。它是t倍的抽样平均误差。 t为概率度,表示抽样极限误差为抽样平均 误差的若干倍,其对应的概率即为总体指 标落在一定区 间的可能性。 其计算公式为:
2.不重复抽样条件下

p

p (1 P ) n
(1
n N
)
抽样(平均)误差的影响因素
总体 方差

2
样本容量n
影响 因素
抽样方法
抽样 组织形式
抽样平均误差μ(续4)


若抽样比很小时,则修正系数(1-n/N)接近 于1。在不重复抽样时,可采用重复抽样的 计算公式,对平均误差影响不大。实际工作 中,即使采用不重复抽样方法也往往采用重 复抽样公式计算抽样平均误差。 抽样平均误差 2 的基本公式可 n n 概括为:

抽样误差是指样本指标与总体指标的偏差。即使 排除人为因素造成的误差,因采用抽样仍不可避 免的误差。

用抽样指标来估计总体指标,总要发生误差,两 者完全相等的情况几乎不可能,问题是对这个误 差要有一个科学的判断。抽样误差的计算就成为 是抽样推断的关键问题。
二、抽样平均误差μ
xm
p
m
x1
p1
x5
p5
抽样估计 必要样本容量的确定
获取总体指标数值的两种途径
全面调查
抽样调查
总体 指标 数值
导例——啤酒质量的判断
啤酒是人们的主要饮品,那么啤酒质量如何?为维护消 费者权益并引导其选购,质检部门必须对啤酒进行质量评 价。这种检查可有两种方法:一是对每一瓶啤酒进行全面 检查;二是抽样推断,即随机抽取若干瓶进行检查,以此 来推断啤酒质量情况。 全面调查可以准确反映研究对象的数值特征,但需投 入大量人财物和时间;而现实中还有许多事物不能或不适 合进行全面调查,如瓶装啤酒及包装食品等的质量检查, 带有破坏性。有些即使没有破坏性也不适合全面调查,如 居民收入及支出调查、体检(抽血)等 。
㈠纯随机抽样——简单随机抽样



纯随机抽样的具体做法主要有摇号法、抽 签法和随机数表法。 最初人们是先把个体编号。做这件事是用 一个封闭的容器,其中有大小质地一样的 分别标有0—9的10个球,使用的是这种机 械装置。现在,一般计算机上都配有产生 这种“随机数”的程序,可以在瞬间完成 这个抽样过程。在日常应用中也可以使用 随机数表来进行。 在实践中,根据情况和目的不同,对简单 随机抽样方式常常会做些变更。
总体指标
总体平均数 X

样本指标
样本平均数 x

N
X

XF F
N0 N

n
x

xf f
n0 n
总体成数
P
N1 N
或Q
样本成数
p
n1 n
或q
总体方差

2
样本方差
2
s
2

2 x 2 p


(X X ) N
sx
2
2

(x x) n
2


(x x) f
《统计学》课件
第八章
抽样推断
制作人: 胡 宝 臣
教学目的与要求
通过本章学习,了解抽样推断的概 念、特点和作用;掌握抽样误差和样本 容量的计算;熟练掌握区间估计;能够 确定必要的样本容量。
教学重点与难点
重点:抽样估计和必要样本容量的计算 难点:抽样误差的概念及其计算
本章主要内容
1 2 3 4
抽样推断的一般问题 抽样误差
三、抽样极限误差△

抽样误差是个随机变量,不能期望总体平均数(或成数) 落在一定区间内是个必然事件。因此,在抽样估计时,不 但要考虑抽样误差的可能范围有多大,还必须考虑落在这 个范围的概率有多大,前者是估计的精确度问题,后者是 估计的可靠性问题,两者紧密联系不可分开。 样本指标与总体指标之间的最大可能误差有多大,总体指 标落在这个范围的可能性又有多大?理论证明,直接用抽 样平均误差对总体指标推断的可靠性只有68.27%,可靠性 既低又不能满足不同研究对象对不同可靠程度的要求。这 就需要研究与抽样可靠程度紧密联系的极限误差问题。


㈡类型抽样——分层抽样(续2)
⑴等数分配:当各组规模相当时分配相同单位数。 ⑵等比例分配:按照各类型组的单位数占总体单位 数的比例来确定从各类中抽取的样本单位数。 ⑶不等比例分配(最优分配比例抽样):在划分的 各类型差异较大时用该法决定在各类型中抽取的 样本单位数。单位数多、差异大的组,多抽;单 位数少、差异小的组,少抽。采用这种方法从各 类中抽取的样 n i N i i / N i i 本单位数为:



㈣等距抽样——机械抽样


等距抽样是先将总体单位按某一标志顺序排队,再按固定顺 序和相等距离(间隔k)抽取样本单位。 按无关标志排序,抽样的随机性与纯随机抽样基本相同(如学
号,门牌号等)。

按有关标志排序,类似于类型抽样,只不过分类更细、组数 更多,每个组(段)内只抽取一个样本单位而已。(如职称从
琳琅满目的包装食品饮料的质量检查?
第一节 抽样推断的一般问题
一、抽样推断的概念

抽样推断是以概率论和数理统计为理 论基础,按照随机原则从调查对象总 体中抽取部分单位形成样本,用样本 指标对总体指标进行推断的一种统计 方法。
抽样推断基本流程图
研究 总体
在一定可靠 程度下对总 体指标进行 区间估计

㈢整群抽样——集团抽样

简单随机化抽样方法,从统计学的观点来看是一个 健全的方法,但在具体工作中,要严格按此实行, 则比较困难。尤其是在规模很大的问题中,困难倒 不在于如何实行这个抽样程序,而是在于总体中个 体可能很分散,因而抽出的样本也可能很分散,这 样,在以后对抽出的个体进行调查时,就会带来很 大的工作量。因此,在实际工作中,往往不能不在 基本遵循随机原则的考虑下,做适当变通。其中一 种常用的变通方法是整群抽样又称集团抽样。
2

f
PQ P (1 P )
s p pq p (1 p )
(三)抽样方法


1.重置抽样(重复抽样)从总体中每次抽取 一个单位进行观察,登记后再放回总体中参 加下一次抽样,直至抽取n 个单位。 重置抽样的特点:
⑴n次抽取相互独立,互不影响; ⑵每次抽取总体单位数保持不变; ⑶总体单位在各次抽样中被抽中的概率相同; ⑷总体单位有被重复抽中的可能。


总体(全及总体)是指要推断的研究对象全部单位组 成的整体。总体单位数用N 表示。 样本(抽样总体)是指从总体中随机抽取的那部分单 位的集合体。 样本单位数(样本容量)用 n 表示。 n≥30为大样本,n<30为小样本。 注意:在研究目的确定的情况下,总体是唯一确 定的。样本是随机的。
相关主题