05第五章抽样推断
1. 在点估计的基础上,给出总体参数估计的一个估 计区间,该区间由样本统计量加减估计误差而得 到
2. 根据样本统计量的抽样分布能够对样本统计量与 总体参数的接近程度给出一个概率度量 比如是,95某%班级平均置分信数区在间75~85之样间(本点,统估计计置量)信水平
置信下限
置信上限
2021/1/2
第五章 抽样推断
2021/1/2
第五章 抽样推断
35
置信区间的表述
(confidence interval)
1. 当抽取了一个具体的样本,用该样本所构造的区间是一 个特定的常数区间,我们无法知道这个样本所产生的区 间是否包含总体参数的真值,因为它可能是包含总体均 值的区间中的一个,也可能是未包含总体均值的那一个
2. 一个特定的区间总是“包含”或“绝对不包含”参数的 真值,不存在“以多大的概率包含总体参数”的问题
总体参数和样本统计量的计算公式
总体参数
X X1 X2 XN N
样本统计量
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
2021/1/2
第五章 抽样推断
10
1.3 抽样推断的基本条件
2021/1/2
第五章 抽样推断
22
2.2 点估计
优良估计量的三个标准: 1.无偏性: (unbiasedness)
E (统计量) = 总体参数
样本平均数 — E x x X
样本成数 — E p p P
2021/1/2
第五章 抽样推断
23
2.2 点估计
优良估计量的三个标准:
2.一致性:(consistency)
2. 统计学家在某种程度上确信这个区间会包含真正的总体 参数,所以给它取名为置信区间
3. 如果用某种方法构造的所有区间中有95%的区间包含总 体参数的真值,5%的区间不包含总体参数的真值,那么, 用该方法构造的区间称为置信水平为95%的置信区间。 同样,其他置信水平的区间也可以用类似的方式进行表 述
第五章
抽样推断
第一节 抽样推断及其特点 第二节 总体参数估计 第三节 假设检验概述
2021/1/2
第五章 抽样推断
1
统计名言
不象其他科学,统计从来不打算使自 己完美无缺,统计意味着你永远不需 要确定无疑
—— Gudmund R.Iversen
2021/1/2
第五章 抽样推断
2
参数估计在统计方法中的地位
公式 x x 2
n
作用
反映样本的 离散程度
S 2 x
x x2
n1
推断总体
2021/1/2
第五章 抽样推断
28
2.2 点估计
总体参数的点估计:
原则优 缺:点总: 体参数估计值就取统
计量11..的简 无值单 法明 提了 供; 误差情况;
2. 2.
能 估 X 提 计 x供 的具 可体 靠 Pˆ 估 程 p度 计无 值。
置信区间的表述
(confidence interval)
1. 使用一个较大的置信水平会得到一个比较宽的置信区间, 而使用一个较大的样本则会得到一个较准确(较窄)的区间。 直观地说,较宽的区间会有更大的可能性包含参数
2. 但实际应用中,过宽的区间往往没有实际意义 比如,天气预报说“在一年内会下一场雨”,虽然这很 有把握,但有什么意义呢?另一方面,要求过于准确 (过窄)的区间同样不一定有意义,因为过窄的区间虽 然看上去很准确,但把握性就会降低,除非无限制增 加样本量,而现实中样本量总是有限的
3. 区间估计总是要给结论留点儿余地
2021/1/2
第五章 抽样推断
38
置信区间与置信水平的关系
均值的抽样分布
x
/2
1 –
/2
x
x
(1 - ) % 区间包含了 % 的区间未包含
2021/1/2
第五章 抽样推断
39
2.3 区间估计
1. 区间的确定:
ΔΔ
x
1. 区间的中心
2. — 统计量的值,如x 、:p 2. 区间的半径 Δ 3. — 允许(极限)误差。
2021/1/2
第五章 抽样推断
4
大学生每周上网花多少时间?
回答类别 3小时以下 3~6小时 6~9小时 9~12小时 12小时以上
合计
人数(人) 32 35 33 29 71 200
频率(%) 16 17.5 16.5 14.5 35.5 100
平均上网时间为8.58小时,标准差为0.69小时。全校学生 每周的平均上网时间是多少?每周上网时间在12小时以 上的学生比例是多少?你做出估计的理论依据是什么?
抽样推断的基本条件
1. 选择统计量—优良估计量。 2. 合适的允许误差—精确性。 3. 可接受的置信度—可靠性。
精确性和可靠性是一对矛盾。要根据问 题的性质和研究的需要在二者间权衡。
2021/1/2
第五章 抽样推断
11
1.4 抽样推断的误差 统计误差的分类
登记性误差
可消除
统计误差
代表性误差
系统误差 抽样误差
2021/1/2
第五章 抽样推断
19
2.1 总体参数估计概述
总体参数估计就是以样本统计量来估 计总体参数。
参数估计要求:
1. 精确性—适当的极限误差范围; 2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2021/1/2
第五章 抽样推断
20
2.2 点估计(point estimate)
2021/1/2
第五章 抽样推断
可消除 可控制
12
1.4 抽样推断的误差
抽样误差
1. 抽样实际误差:
对某一样本而言,由随机因素引起的 样本统计量与总体参数在数量上的差异 就是抽样实际误差。
xX
2021/1/2
第五章 抽样推断
13
1.4 抽样推断的误差
2. 抽样平均(标准)误差:
抽样平均误差是抽样平均数的标准差,它 反映样本平均数(样本成数)与总体平均数 (总体成数)之间的平均差异程度。
抽样推断的方法: —总体参数的估计 —总体参数的假设检验。
2021/1/2
第五章 抽样推断
7
1.1 抽样推断及其特点 抽样推断的特点
1. 抽样推断必须遵循随机原则。 2. 对抽样误差可以事先加以计算和控制。 3. 具有经济性、时效性,应用广泛的特点。 4. 可对全面调查的结果进行检验和修正。
2021/1/2
σ 2 优良估计量 σ 2 其他估计量
σ 2 x σ 2 c
2021/1/2
第五章 抽样推断
26
2.2 点估计 总体参数
优良估计量
2X
2 P
2021/1/2
S 2 x x x 2 n1
2 p p1 p
第五章 抽样推断
27
2.2 点估计
样本方差
符号 2 x
第五章 抽样推断
8
1.2 总体参数和样本统计量
பைடு நூலகம்
含义
总体参数与样本统计量的比较
总体参数
样本统计量
总体的指标
样本的指标
性 质 唯一、常量
不唯一、随机变量
特点 未知
易求
常 见 X、P、 X
x、p、S x
目 的 利用样本统计量推断总体参数
2021/1/2
第五章 抽样推断
9
1.2
总体参数和样本统 x计 量x-x2 n
2021/1/2
第五章 抽样推断
34
置信区间的表述
(confidence interval)
1. 总体参数的真值是固定的,而用样本构造的区间则是不 固定的,因此置信区间是一个随机区间,它会因样本的 不同而变化,而且不是所有的区间都包含总体参数
2. 实际估计时往往只抽取一个样本,此时所构造的是与该 样本相联系的一定置信水平(比如95%)下的置信区间。 我们只能希望这个区间是大量包含总体参数真值的区间 中的一个,但它也可能是少数几个不包含参数真值的区 间中的一个
X
x
n
p
P 1 P
n
2021/1/2
第五章 抽样推断
14
1.4 抽样推断的误差
总体标准差和成数的确定:
总体变化不大,采用过去总体指标数值做代 替;
用样本标准差σ(x) 或样本成数 p 替代; 对于成数,可取 P = 0.5;如果有多个 P 值,
取其最接近 0.5 的P 做替代。
2021/1/2
第五章 抽样推断
15
1.4 抽样推断的误差
3. 抽样极限(允许)误差
是样本统计量与被估计的总体参数之 绝对离差的最大允许值,常用Δ表示,可 简称为极限误差或允许误差。
xX x
;
pP p
2021/1/2
第五章 抽样推断
16
1.4 抽样推断的误差
Δ和μ的关系:
Z
Z
Z —概率度,Z 表示以抽样平均误差为标 准单位对极限误差的度量值。由Z 确定的概率 保证程度F(Z)—置信度。
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。
常用的点估计量有:
Xˆ x Pˆ p ˆ 2 S 2 ( x x )2
n1
2021/1/2
第五章 抽样推断
21
估计量与估计值
(estimator & estimated value)
2021/1/2
第五章 抽样推断