当前位置:文档之家› 第3章参数估计

第3章参数估计


Lower Bound Upper Bound
5 - 35
5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis
25袋食品的重量
112.5
101.0
103.0
102.0
100.5
102.6
107.5
95.0
108.8
115.6
100.0
123.5
102.0
101.6
102.2
116.6
95.4
97.8
108.6
105.0
136.8
5 - 23
102.8
101.5
98.4
93.3
x 105.36
x z 2
n
希望根据所给的样本确定一个随机区间, 使其
包含参数真值的概率达到指定的要求。
2.区间估计
重复抽样 不重复抽样
5-5
区间估计 (Interval Estimate)
1. 在点估计的基础上,给出总体参数估计的一个估计 区间,该区间由样本统计量加减估计误差而得到
2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
问卷调查由调查员直接到宿舍发放并当场回收。对四 个年级中每年级各发60份问卷,其中男、女生各 30份。共收回有效问卷共200份。其中有关上网时 间方面的数据经整理如下表所示
5-3
大学生每周上网花多少时间?
回答类别 3小时以下 3~6小时 6~9小时 9~12小时 12小时以上
合计
人数(人) 32 35 33 29 71 200
1450
1480
1510
1520
1480
1490
1530
1510
1460
1460
1470
1470
5 - 25
x 1490
s 24.77
x t 2
s 1490 2.131 24.77
n
16
149013.2
1476.8,1503.2
5 - 26
总体均值的区间估计
【例3】一家保险公司收集到由66个投保人组成的随 机样本,得到每个投保人的年龄(单位:周岁)数据如 下表。试建立投保人年龄90%的置信区间
区间估计 Analyze Descriptive Statistics Explore
5 - 30
Spread vs.Level with Levene Test:输出散布——层 次图,包括回归直线斜率及方差齐次性的Levene 检验。若无分组变量,此选项无效。
None:不生成散布——层次图; Power estimation:转换幂值估计,表示对每一组 数据产生一个中位数范围的自然对数与四分位数 范围的自然对数的散点图; Transformed:对原始数据进行转换,有:三次 方(Cube)、平方(Square)、平方根(1/Square root) 取对数(Logarithm)。
5 - 11
置信区间与置信水平的关系
均值的抽样分布
x
/2
1 –
/2
x x
(1 - ) % 区间包含了 % 的区间未包含
5 - 12
区间估计的种类
均值 方差已知
方差未知
一个总体 方差
区间 估计
比率
均值差 两个总体
方差比
5 - 13
一个总体参数的区间估计
总体参数 均值 比例 方差
5 - 14
第3章 参数估计
参数估计在统计方法中的地位
• 统计方法
描述统计
推断统计
参数估计 假设检验
5-2
大学生每周上网花多少时间?
为了解学生每周上网花费的时间,中国人民大学公共 管理学院的4名本科生对全校部分本科生做了问卷 调查。调查的对象为中国人民大学在校本科生,调 查内容包括上网时间、途径、支出、目的、关心的 校园网内容,以及学生对收费的态度,包括收费方 式、价格等
105.36 1.96
10 25
105.36 3.92
101.44,109.28
5 - 24
【例2】已知某种灯泡的寿命服从正态分布,现从一 批灯泡中随机抽取16只,测得其使用寿命(单位:h) 如下。建立该批灯泡平均使用寿命95%的置信区间
16灯泡使用寿命的数据
1510
1520
1480
1500
符号表示
2
样本统计量
x p s2
一个总体方差已知时均值的区间估计
• 需要的定义: 若 X 服从标准正态分布,则满足下式:
P( X < -za)﹦或 P( X ﹥za)﹦ 的z或-z叫标准正态分布的单侧上分位点。
z
5 - 15
z
• 若 X 服从标准正态分布,则满足体参数在一定置信水平下的 估计区间
2. 统计学家在某种程度上确信这个区间会包含真正的总 体参数,所以给它取名为置信区间
3. 总体参数的真值是固定的,而用样本构造的区间则是 不固定的,因此置信区间是一个随机区间,它会因样 本的不同而变化,而且不是所有的区间都包含总体参 数。我们只能希望这个区间是大量包含总体参数真值 的区间中的一个,但它也可能是少数几个不包含参数 真值的区间中的一个。
Sn
5 - 21
自由度小于45时重复抽样条件下均值的两个
(1 )% 的单侧置信区间为:
x t (n 1)
s n
x t (n 1)
s n
自由度大于45时重复抽样条件下均值的两个
(1 )% 的单侧置信区间为:
x z
s n
x z
s n
5 - 22
【例1】一家食品生产企业以生产袋装食品为主,为 对产量质量进行监测,企业质检部门经常要进行抽 检,以分析每袋重量是否符合要求。现从某天生产 的一批食品中随机抽取了25袋,测得每袋重量如下 表所示。已知产品重量的分布服从正态分布,且总 体标准差为10克。试估计该批产品平均重量的置信 区间,置信水平为95%
176.2316
173.4236
174.0000
61.410
7.83647
158.00
190.00
32.00
9.00
-.081
.414
-.201
.809
5 - 34
gender 身高(厘米) 女生
De sc rip tiv es
Mean
95% Confidence Interval for Mean
频率(%) 16 17.5 16.5 14.5 35.5 100
平均上网时间为8.58小时,标准差为0.69小时。全 校学生每周的平均上网时间是多少?每周上网 时间在12小时以上的学生比例是多少?
5-4
大致判断出总体分布的类型后,用样本参数
推断总体分布的相应参数。
均值 方差
1.点估计
不同样本算得的 的估计值不同,因此 还
Lower Bound Upper Bound
男生
5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Mean 95% Confidence Interval for Mean
均值的标准误差(抽样平均误差)
重复抽样(放回) X
n
不重复抽样
Nn
X n N 1
均值的标准误差又称为抽样平均误差或均值 标准误差、标准误差。
5 - 20
一个总体方差未知时均值的区间估计
• 需要的定义:
t (n)
t (n)
• 需要的定理:
若随机变量 X~ N (, 2 )则有如下定理成立: T X ~ t(n 1)
的z/2叫标准正态分布
的双侧上分位点。
z
z
2
2
5 - 16
• 需要的定理:
若随机变量 X ~ N(, 2)则有如下定理成立:
重复抽样条件下:
Z X n

N (0,1)
不重复抽样条件下:
Z X ~ N(0,1) n Nn N 1
5 - 17
重复抽样条件下均值的单侧区间估计:
• 因为 X 服从标准正态分布,所以:
2 n
P(
X
2
n﹥z)﹦或
P(
X 2 n
﹤﹣z)﹦
重复抽样条件下均值的双侧区间估计: • 因为 X 服从标准正态分布,所以:
2 n
P(
X 2 n
﹥z/2)﹦
5 - 18
重复抽样条件下均值的置信区间:
单侧置信区间
x z
n
x z
n
双侧置信区间:
x z 2
n
x z 2
n
5 - 19
5-9
点估计值
置信区间的表述
(95%的置信区间)
☺ 我没有抓住参数!
从均值为185的总体中抽出n=10的20个样本构造出的20个置信区间
5 - 10
置信区间的表述
(Confidence Interval)
1. 使用一个较大的置信水平会得到一个比较宽的置信区间, 而使用一个较大的样本则会得到一个较准确(较窄)的区间。 直观地说,较宽的区间会有更大的可能性包含参数
1. 将构造置信区间的步骤重复很多次,置 信区间包含总体参数真值的次数所占的 比例,也称置信度
2. 表示为 (1 -
为是总体参数未在区间内的比例
3. 常用的置信水平值有 99%, 95%, 90%
相关主题