当前位置:
文档之家› 第五章 统计推断 PPT课件
第五章 统计推断 PPT课件
(点估计)
置信区间
置信下限 ˆ 1
置信上限 ˆ 2
一般地,如果将构造置信区间的步骤重复多次, 置信区间中包含总体参数真值的次数所占的比率, 称为置信水平(概率保证程度)。
即区间包含总体参数真实值的可信度.
通常用1- 表置信水平,其中称为显著性水平。 比较常用的置信水平:90%,95%和99%。
第五章 统计推断
第一节 总体参数估计 第二节 总体参数检验
统计推断在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
大学生每周上网花多少时间?
为了解学生每周上网花费的时间,某校4名 本科生对全校部分本科生做了问卷调查。调 查的对象为本校在校本科生,调查内容包括 上网时间、途径、支出、目的、关心的校园 网内容,以及学生对收费的态度,包括收费 方式、价格等。
例如,抽取了1000个样本,根据每一个样本均构 造了一个置信区间,这1000个置信区间中,有95% 的区间包含了总体参数的真值,而5%的置信区间则 没有包含。这里,95%这个值被称为置信水平(或置 信度)。
两个需要注意的问题
如果用某种方法构造的所有区间中有95%的 区间包含总体参数的真值,5%的区间不包含 总体参数的真值,那么,用该方法构造的区 间称为置信水平为95%的置信区间。
点估计完全正确的概率通常为0。因此, 我们更多的是考虑用样本统计量去估计总 体参数的范围 区间估计。
(一)总体参数的区间估计概述
1.基本概念
(1)区间估计:在点估计的基础上,给出总体参数 估计的一个范围,并给出区间估计成立的概率值。
p(1 2 ) 1 样本统计量
P(X )
均值的抽样分布
B
A
中位数的抽样分布
X
一致性(consistency)
一致性:随着样本容量(n)的增大,点估计量 的值越来越接近被估计的总体参数。
若对于任意ε >0,有 limP ˆ 1 n 较大的样本容量 P(X ) B
较小的样本容量
A
X
例题
1.对某企业的产品进行抽样检验,设抽出100件产 品,其中不合格产品5件,试估计该企业产品的 合格率是多少?
置信区间是一个随机区间,它会因样本的不 同而不同,而且不是所有的区间都包含参数 真值。
2.区间估计的基本原理
(1)区间估计的三个要素 点估计值、允许的抽样误差范围Δ 、置信水
平(概率保证程度) F(z) 。 点估计值:一般为样本平均数或样本成数p 允许误差范围(抽样极限误差) :Δ (x±Δ)
就是置信区间
置信水平:F(z)= 1-
(2)基本原理
P( x X x ) 1
P( x X
xX
x) P( x
x ) F(x ) F(z)
x
x
为抽样平均误差,
Z
x
称为概率度。
x
x
F(z)、 z、Δ、μ之间的关系
给定置信 水平F(z)
2. 男 性 成 人 的 身 高 X 服 从 正 态 分 布 X~N(, )2 ,
其中 , 2 是未知参数,现随机测量12名成人男 性的身高(单位:米)如下: 1.80,1.68,1.85,1.60,1.67,1.75,1.78, 1.62,1.76,1.70,1.79,1.69,试求
的点估计值 , 2
2.统计推断的基本内容有两个: (1)参数估计(利用样本指标来推断估计未知的总
体指标。) (2)假设检验(先对总体参数做一个假设,然后利
用样本资料检验这个假设是否成立。)
参数估计:
以样本估计量来估计总体参数。
参数估计的分类:
点估计 区间估计
二、点估计(point estimator)
无偏性:估计量的数学期望等于被估计的 总体参数。
若 E(ˆ) ,则称ˆ为 的无偏估计量
P( x )
无偏
A
有偏
x,s2,p
都是无偏估计量
C
x
有效性(efficiency)
有效性:一个方差较小的无偏估计量称 为一个更有效的估计量。
若ˆ1 ˆ2,则称 ˆ1为比 ˆ2更有效的估计量
z Δ = z *μ
样本 μ 和总体参数的点估计值
若重置抽样:
n
给定误差 范围Δ
Δ/μ= z
ቤተ መጻሕፍቲ ባይዱ
F(z)
2.区间估计的特点
(1)指出总体被估计参数的上限和下限, 即指出总体参数的可能范围,而不是直接 给出总体参数的估计值。
(2)指出置信区间包含总体参数的可信度 有多大。
(3)缩小估计区间(准确性)与提高置信 度(可靠性)是矛盾的。
问卷调查由调查员直接到宿舍发放并当场回 收。对四个年级中每年级各发60份问卷,其 中男、女生各30份。共收回有效问卷共200 份。其中有关上网时间方面的数据整理如下:
大学生每周上网花多少时间?
回答类别 3小时以下 3~6小时 6~9小时 9~12小时 12小时以上
合计
人数(人) 32 35 33 29 71 200
1.定义
点估计又称定值估计,它是直接以样本统计量 作为总体参数的估计量,以样本统计量的取值 作为总体参数的估计值。
2.常用的总体参数的点估计
X x x,
n
2 s2
(x x)2 ,
n 1
P p n1 n
重点注意
3.点估计量优良与否的评价标准
(三个)
无偏性(unbiasedness)
(二)平均数的区间估计 总体方差(2 )已知或未知
频率(%) 16 17.5 16.5 14.5 35.5 100
平均上网时间为8.58小时,标准差为0.69小时。全
校学生每周的平均上网时间是多少?每周上网时间 在12小时以上的学生比例是多少?你做出估计的理 论依据是什么?
第一节 总体参数估计
一、统计推断概述
1.统计推断:根据样本的观察结果以及样本统 计量的抽样分布,对总体的数量特征作出具有一 定可靠程度的估计和判断。
1.解:通过样本的合格率来估计企业产品的合 格率。样本合格率p=95/100=95%,我们估计 该企业产品的合格率是95%。
P=p=95%
2.解: x 1.80 1.68
12
12
(xi x)2
2 s2 i1
n 1
1.69 1.72(米)
三.区间估计 (interval estimator)