当前位置:
文档之家› 北邮考研概率论与数理统计7.4区间估计(3)
北邮考研概率论与数理统计7.4区间估计(3)
n]
20
第21页
由 P(-1.75≤U≤2.33)=0.95
f (u)
1 . 75
2 .33
u
我们得到 均值 的置信水平为 0 . 95 的
置信区间为 [ X 1 . 75
n , X 2 . 33 n]
这个区间比前面一个要长一些.
21
第22页
类似地,我们可得到若干个不同的置信区间.
P ( L U ) 1
L , U 为 称
的1- 同等置信区间。
同等置信区间是把给定的置信水平1- 用足 了。常在总体为连续分布场合下可以实现。
2、置信区间的求法
第7页
2 例1 设X1,…Xn是取自 N ( , 2 ) 的样本, 已知, 求参数 的置信度为 1 的置信区间. 寻找未知参数的 解: 选 的点估计为 X 一个良好估计. X 取 Z ~N(0, 1) n 明确问题,是求什么参数的
2未知,则 的置信水平为1- 的置信区间为
x t
2
(9) s 10 , x t 2 (9) s 10
其中,x ,s 分别为样本均值和样本标准差。 这里用它来说明置信区间的含义。
若取 =0.10,则t0.05(9)=1.8331,上式化为
x 0.5797s,
x 0.5797s
第19页
1、需要指出的是,给定样本,给 定置信水平,置信区间也不是唯一的. 对同一个参数,我们可以构造许多置信区间.
注意
例如,设X1,…Xn是取自 N ( , ) 的样本,
2
2已 知 , 求参数 的置信水平为 0 . 95 的
置信区间. X 取枢轴量 U ~N(0, 1) n
19
第20页
由标准正态分布表,对任意a、b,我们可 以求得P( a<U<b)=0.95即可 . 例如,由 P(-1.96≤U≤1.96)=0.95
f (u)
0 .95
1 . 96 1 . 96
u
n , X 1 . 96
我们得到 均值 的置信水平为 0 . 95 的 置信区间为 [ X 1 . 96
X n
| Z 2 } 1
从中解得
P {X n Z 2 X
为什么 这样取?
n Z 2} 1
于是所求 的 置信区间为
(X Z 2 , X Z 2) n n
Z 2 也可简记为 X n
从例1解题的过程,我们归纳出求置 信区间的一般步骤如下: 1. 明确问题, 是求什么参数的置信区间? 置信水平 1 是多少? 2. 寻找参数 的一个良好的点估计 T (X1,X2,…Xn)
第9页
3. 寻找一个待估参数 和估计量T的函数 S(T, ),且其分布为已知. 称S(T, )为枢轴量.
a
0 .9 5
b b
u
u
0 .9 5
0
b
u
a =-b
23
第24页
注意
2 如 分 布 和 F分 布 , 在密度函数不对称时,
习惯上仍取对称的分位点来确定置信区间(如图).
24
第25页
我们可以得到未知参数的的任何置信 水平小于1的置信区间,并且置信水平越 高,相应的置信区间平均长度越长.
也就是说,要想得到的区间估计可 靠度高,区间长度就长,估计的精度就 差.这是一对矛盾.
2. 估计的精度要尽可能的高. 如要求区间
ˆL ,ˆU
可靠度与精度:
第17页
ˆ 长度 ˆ U L尽可能短,或能体现该要求的其 它准则.
可靠度与精度是一对矛盾,一般是在 保证可靠度的条件下尽可能提高精度.
17
第18页
附 录
1、置信区间是唯一的吗? 置信区间的可靠性和精度。 2、均匀分布的区间估计。
现假定 =15, 2 =4,则我们可以用随机模拟方法 由N(15,4)产生一个容量为10的样本,如下即是这 样一个样本: 14.85 13.01 13.50 14.93 16.97 13.80 17.9533 13.37 16.29 12.38 由该样本可以算得 x 14.7053, s 1.8438 从而得到 的一个区间估计为
可见,确定区间估计很关键的是要寻找 一个待估参数 和估计量T 的函数S(T, ), 且S(T, )的分布为已知, 不依赖于任何未知 参数 (这样我们才能确定一个大概率区间).
10
第11页
这里,我们主要讨论总体分布为正态的情形. 若样本容量很大,即使总体分布未知,应用中心极限 定理,可得总体的近似分布为正态分布,于是也可以 近似求得参数的区间估计. 教材上(7.5节)讨论了以下几种情形:
(n)
n
n (n) (n)
★
2 1 ★ 两个正态总体均值差 1 2 和方差比 2 2 的区间估计.
单个正态总体均值 和方差 2 的区间估计.
11
关于置信区间的构造有两点说明:
应选平均长度 E ˆ
ˆ L
第12页
满足置信度要求的a与b通常不唯一。若有可能,
U
达到最短的a与b,这在枢
轴量S=S(T,Ѳ)的分布为对称分布场合通常容易实现。
任意两个数a和b,只要它们的纵标包含 f(u)下95%的面积,就确定一个95%的置信 f (u) 区间. 0.95
a a a
0.95 0.95b buub0
u
我们总是希望置信区间尽可能短.
22
第23页
在概率密度为单峰且对称的情形,当a =-b时 求得的置信区间的长度为最短.
f (u)
0 .9 5
a a
置信区间?置信水平是多少?
寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.
有了分布,就可以求出 Z取值于任意区间的概率.
7
对于给定的置信水平(大概率), 根据Z的分布, 确定一个区间, 使得Z取值于该区间的概率为置信水平. 对给定的置信水平 使
第8页
1,
查正态分布表得
Z 2,
P {|
§7.4 区间估计
引言
第1页
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值,它没有反映出这个近似值的误 差范围,使用起来把握不大. 区间估计 正好弥补了点估计的这个缺陷 .
1
1、 区间估计的概念
第5页
定义1 设 是总体的一个参数,其参数空间为Θ, x1, x2 , …, xn是来自该总体的样本,对给定的一个 (0< <1),若有两个统计量 L L ( x1 , , xn ) 和 U U ( x , , x ),若对任意的 ∈Θ,有
P (ˆL ˆU ) 1 ,
L U L U
1
n
( 1)
则称随机区间( , )为 的置信水平 为1- 的置信区间,或简称( , )是 的1-置信区间.
L
和 U 分别称为 的(双侧)置信下限 和置信上限.
第6页
定义 沿用定义1的记号,如对给定的 (0< <1), 对任意的∈Θ,有
由图1可以 看出,这 100个区间 中有91个 包含参数 真值15, 另外9个不 包含参数 真值。 图1
的置信水平为0.90的置信区间
可见:置信水平1- 的含义是指在大量使用该 置信区间时,至少有100(1-)%的区间含有 。
注:置信区间
ˆ ,ˆ 1. 要求 以很大的可能被包含在区间 L U ˆ 内,就是说,概率P {ˆ L U } 要尽可能大. 即要求估计尽量可靠.
第14页
14.7053 0.5797 1.8438,
14.7053 0.5797 1.8438 13.6427, 15.7679
该区间包含 的真值--15。现重复这样的方法 100次,可以得到100个样本,也就得到100个 区 间,我们将这100个区间画在图1上。
第15页
实用中应在保证足够可靠的前提下, 尽量使得区间的长度短一些 .
25
第26页
2、例 设x1, x2 , …, xn是来自均匀总体U(0, )的 一个样本,试对给定的 (0< <1)给出 的 1- 同等置信区间。
解:(1)取x(n)作为枢轴量,其密度函数为
p(y; )= nyn , 0<y <1;
9
4. 对于给定的置信水平1 ,根据S(T , ) 的分布,确定常数a, b,使得 P(a ≤S(T, )≤b)= 1
第10页
5. 对“a≤S(T, )≤b”作等价变形,得到如下 形式: ˆ ˆ
P{ L U } 1 则ˆL ,ˆU 就是 的100(1 )%的置信区间.
(2)x(n) / 的分布函数为F(y)=yn, 0<y <1,故
P(c≤x(n)/ ≤d)= d n-cn,
因此我们可以适当地选择c和d满足d n-cn=1-
第27页
(3)利用不等式变形可容易地给出 的1同等置信区间为[x(n) /d,x(n) /c],该区间 1 1 Ex 的平均长度为 。不难看出, c d n n 在0≤c<d≤1及d -c =1- 的条件下,当 1 1 d=1, c= 时, c d 取得最小值,这 说明 x , x 是 的置信水平1- 为 最短置信区间。
ˆ ˆ 尽可能短的a与b, 实际中,选平均长度 E U L
这往往很难实现,因此,常这样选择 a与b,使得 两个尾部概率各为 /2,即P(S<a)=P(S>b)= /2, 这样的置信区间称为等尾置信区间。这是在S的分 布为偏态分布场合常采用的方法。