当前位置:
文档之家› 概率论与数理统计73置信区间
概率论与数理统计73置信区间
我们选取未知参P数(的 某个 )估 1计量 ?^,①根据置信水平1- , 可以
找到一个正数 , 使得 P(|ˆ | ) 1 ,
只要知^道 的概率分布就可以确定 . 分布的分位数 ②
由不等式 |ˆ | 可以解出 :ˆ ˆ ③
这个不等式就是我们所求的置信区间 ( , ) .
对于给定的置信水平, 根据估计量U 的分布, 确定
置信区间的方法.
一、 置信区间的概念
定义4
设 是总体 X 的待估参数, X1, X2, …, Xn
是取自总体 X 的样本, 对给定值 0 < < 1, 若统计量 (X1, X 2 , , X n)
和 ( X1, X 2 , , X n ) 满足
P ( ) 1 ,
则称随机区间 ( , )为 的置信水平为1- 的双侧置信区间 . 和
X
1 n
n i 1
Xi
1. 寻找未知参数 的一个^良好的点估计量 (X1, X2, …, Xn );
确定待估参数估计^ 量函数 U( ) 的分布 ; 2. 对于给定的置信水平 1- , 由概率 P(
|U
|
U
x
X / n
) ,
~
N (0,1)
查表求出分布的分位数
x
,
(u/2 )
1
2
P( |U | u /2 )
一致性 参数的点估计是用样本算得的一个值去估计未知参数. 使用 起来把握不大. 点估计值仅仅是未知参数的一个近似值, 它没有 反映出这个近似值的误差范围. 而区间估计正好弥补了点估计 的这个缺陷. 为了使估计的结论更可信, 需要引入区间估计.
§7.3 单个正态总体均值与方差的置信区间
譬如,在估计湖中鱼数的问题中, 若我们根据一个实际样本 得到鱼数 N 的极大似然估计为 1000 条.
X
1 n
n i 1
Xi
是 的无偏估计量,
由抽样分布定理知
X─ ~ N( , 2/n),
U
故可用
─
X
作为
EX
X / n
~ N(0, 1),
的一个估计量,
对给定的置信度 1- ,
有了分布就可求出U 取值于任意区间的概率
按标准正态分布的双侧 分位数的定义
即令
(u/2 )
1
2
,
查正态分布表可得 u/
评选标准 无偏性 —— 估计量的期望值等于未知参数的真值.
• 样本 k 阶原点矩是总体 k 阶原点矩 的无偏估计量 ;
• 样本方差 S 2 是总体方差 2 的无偏估计量 ;
• 无偏估计量的函数未必是无偏估计量
有效性 —— 方差更小的无偏估计量.
• 在 的所有线性无偏估计量中, 样本均值 X─ 是最有效的.
湖中鱼数的真值
习惯上把置信水平记作 1- , 这里 是一个很小的正数.
置信水平的大小是根据实际需要选定的. 例如, 通常可取置信 水平 = 0.95 或 0.9 等等.
根据一个实际样本, 由给定的置信水平1- , 我们求出一个的 区间 ( , ), 使 P ( ) 1 , 如何寻找这种区间?
P 2,
(
|U |
②
u /2 ) ,
由分布求分位数
| X / n
| u /2
X
n
u / 2
X
n
u / 2
③ 由u/2确
定置信区间
即得置信区间( X
n
u / 2
,
X
n
u / 2 ) ,
简记为
X
n
u 2
求置信区间首先要明确问题:
是求什么参数的置信区间? 置信水平 1- 是多少?
一般步骤如下:
但实际上, N 的真值可能大于 1000 条, 也 可能小于1000条.
一个可以想到的估计办法是:若我们能给
出一个区间,并告诉人们该区间包含未知参数 N的可靠度 (也称置 信系数).
也就是说,给出一个区间,使我们能以一定的可靠度相信区
间包含参数 µ。
[ •]
这里所说的“可靠程度”是用概率来度 量的, 称为置信概率,置信度或置信水平.
分别称为置信下限和置信上限.
置信度 置信概率
1) 和 为两个统计量(由样本完全确定的已知函数);
2)( , ) 是随机区间, 代入样本值所得的普通区间称为置信区 间的实现.
置信水平的概率意义: 置信水平为 0.95 是指 100 组样本值所得置信区间的实现
中, 约有95个能覆盖 , 而不是一个实现以 0.95 的概率覆盖了 .
我们选取未知参数的某个估计量 ^, 根据置信水平1- , 可以
找到一个正数 , 使得
P(|ˆ | ) 1 ,
只要知^道 的概率分布就可以确定 . 由不等式 |ˆ |
可以解出 :
ˆ ˆ
这个不等式就是我们所求的置信区间 ( , ) .
下面我们就来正式给出置信区间的定义, 并通过例子说明求
一个区间, 使得 U 取值于该区间的概率为置信水平.
(一) 单个正态总体置信区间的求法
设 X1, …, Xn 是总体 X ~ N( , 2)的样本, X ,─S2 分别是其样本
均值和样本方差, 求参数 、 2 的置信水平为1- 的置信区间.
1. 均值 的置信区间 (1)已知方差 2 时
① 确定未知参数的 估计量及其函数的分布
二、置信区间的求法 (一) 单个正态总体
1. 2.
(二) 两个正态总体12..
均值
((12))
已知方差 未知方差
2 2
方差 2
((12))
已知均值 未知均值
均值 1- 2
((12))
已知方差12,22 未知方差12,22,但相等!
方差
12/22
((12))
已知均值 未知均值
1, 1,
2 2
如何根据实际样本, 由给定的置信水平1- , 求出一个区间 ( , ), 使
3. 由分位数|U| x 确定置信区间 (─ ,─ )X. ( , ─ ) 就是 的 100(1- )% 的置信区间.
n
u / 2
X
n
u / 2
─
总体分布的形式是否已知,是怎样的类
(X
n
u / 2
,
X
n
u / 2 )
型,至关重要.
例1 某乡农民在联产承包责任制前人均纯收入 X(单
位:元), 且 X ~ N (µ, 252). 推行联产承包责任制后, 在该乡抽得
并非一个实现以 1- 的概率覆盖了
估计的可靠度:
估计要尽量可靠,
即
P( ─
<
<─
)=
1-
要尽可能大.
要求 以很大的可能被包含在置信区间内 .
要求估计尽量可靠.
估计的精度:
估计的精度要尽可能的高:即要求区间置信的长度尽可能短, 或能体现该要求的其它准则.
要求置信区间的长度尽可能短.
可靠度与精度是一对矛盾, 一般是在 保证可靠度的条件下尽可能提高精度.