当前位置:
文档之家› 置信区间(详细定义及计算)-42
置信区间(详细定义及计算)-42
x 1250 1 [0 15 510 25] 1259
s2
1
5 [(1250 1259)2
(1275 1259)2 ]
570
5 1
4
s2 5
28.5 5.339
n 1 4
查表
t0.01 (4) t0.005(4) 4.6041
0.01
[X
S n
t
2
(n
1)]
则所求μ的置信2区间为
[13 1.96 0.3 , 13 1.96 0.3] 2
2
2
得到μ的一个区间估计为
. [12.706,13.294]
注:该区间不一定包含μ. 13
0.05 可以取标准正态分布上
α分位点-z0.04 和 z0.01 ,则又有
0.04
X
P{ z0.04 P{X
n
2 z0.01}
n
z0.01 X
16
已知某种油漆的干燥时间X(单位:小时)
服从正态分布
X ~ N ( ,1), 其中μ未知,现在抽取
25个样品做试验,
得数据后计算得
x
1 25
n k 1
xk
6
取 0.05 (1 0.95),
求μ的置信区间。
解 z z0.025 1.96 n 25 x 6
2
[x
n
z
2
]
[6
1 5
其含义是:
若反复抽样多次,每个样本值(n =16) 按公式
(x 1.96 , x 1.96 ) 即 ( x 0.49) 确定一个区间。
4
4
10
(x 0.49, x 0.49) 确定一个区间。
在这么多的区间内包含μ的占0.95,
不包含μ的占0.05。
本题中 (4.71, 5.69),属于那些包含μ的区间的可信
解:已知 x 1 (115
0 7, n 9,
120 110 )
0.05. 115.
由样本值算得:
9
查正态分布表得临界值 Z 1.96,由此得置信区间:
[X
n
z 2 ,
X
n
2
z 2 ]
115 1.96 7 / 9 , 115 1.96 7 / 9 110.43 , 119.57
3
设 是总体X的 一个未知参数,
若存在随机区间
[1,2 ], 对于给定的 0 1,
若满足 P{1 2} 1
则称区间 是[1,2 ]
的置信水平(置信度)为
的置信区间.
和 分别称为置信下限和置信上限
1
2
1
(双侧置信区间).
1 为置信度,
为显著水平.
4
置信水平的大小是根据实际需要选定的.
t
2
(n
1),
X
S n
t
2
(n
1)]
[X
S n
t
2
(n
1)]
19
为了调查某地旅游者的消费额为X,
随机访问了
40名旅游者。
得平均消费额为
x 105 元,样本方差
s 2 282 设 X ~ N (, 2 )求该地旅游者的平均消费额
μ的置信区间。
0.05
解 本题是在σ2未知的条件下求正态总体参数μ的
2
2
2
(n 1)} 1
P{
(n
2
1)S 2 (n 1)
2
(n 1)
2 1
(n
S2 1)
}
1
2
2
则得到σ2随机区间
(n 1)S 2 (n 1)S 2
[
,
]
2
(n
1)
2 1
(n
1)
2
以 1 的概率包含未知方差σ2,
这就2是σ2的置信度为
1-α的置信区间。
24
某自动车床加工零件,抽查16个测得长度(毫米)
第七章
置信区间的概念
一、置信区间的概念 二 、数学期望的置信区间 三 、方差的置信区间
1
前面,我们讨论了参数点估计.
它是用样本算得的
一个值去估计未知参数.
但是点估计值仅仅是未知参数
的一个近似值,
它没有反映出这个近似值的误差范围,
使用起来把握不大.
范围通常用区间的形式给出的。
这种形式的估计称为区间估计. 也就是说,我们希望确定一个区间,
数学期望 和方差 的区间估计2 。 5
设 X1, X 2 , , X n 为总体
X , S 2 分别是样本均值和样本方差。
X ~ N (, 2 ) 的样本,
对于任意给定的α,
我们的任务是通过样本寻找一
个区间, 它以1-α的概率包含总体X的数学期望μ。
6
1、已知σ2时,μ的置信区间
设
X ~ N(, 2)
12.15 12.12 12.01 12.08 12.09 12.16 12.03 12.01
12.15 12.06 12.13 12.07 12.11 12.08 12.01 12.06
怎样估计该车床加工零件长度的方差。
( 0.05)
解 先求 x 12 1 [0.15 0.12 0.06] 12.075
X ~ N(, 2 )
EX DX 2
n
n
则随机变量
X
Z
~ N (0,1)
2
n
令
X
P{
2
z } 1
2
n
2
z
2
2
z
2
7
X
P{
2
z } 1
2
n
2
2
P{z 2
X 2
z 2} 1
z
z
n
2
2
P{
n
z
2
X
n
z
2}
1
P{X
n
z 2
X
n
z 2} 1
这就是说随机区间
[X
n
z 2 ,
(1 2 )
则称 [1,为2随] 机区间。
随机区间与常数区间
(a, b) 不同, 其长度与在数轴上
的位置与样本
X1, X 2 , , X n 有关。
当一旦获得样本值
x1 , x2 , xn 那么,
1( x1, x2 , xn ), 2 ( x1, x2 , xn ) 都是常数。
[1,2 ] 为常数区间。
16
σ2的估计值
s2 1 [(12.15 12.075)2 (12.06 12.075)2 ] 15
或
s2
1 n 1
n i 1
(xi
x)2
1
n
[
n 1 i1
xi 2
nx 2 ]
1 [152 122 16 7.52 ] 0.0024
10000 15
例如,通常可取显著水平
等. 0.025, 0.05, 0.1,
即取置信水平
1或0.95,00.9.等97. 5
根据一个实际样本,
由给定的置信水平,我们求出
一个尽可能小的区间
,使 [1,2 ]
P{1 2} 1
由于正态随机变量广泛存在,
特别是很多产品的
指标服从正态分布,
我们重点研究一个正态总体情形
1.96]
[6
0.392]
所求为 [5.608, 6.392].
17
已知幼儿身高
X ~ N (, 2 ), 现从5~6岁的幼儿
中随机地抽查了9人,其高度分别为:
115, 120, 131, 115, 109, 115, 115, 105, 110cm;
假设标准差 0 7,置信度为 95%;
试求总体均值 的置信区间。
[1259 24.58 , 1259 24.58] 21
为了估计一批钢索所能承受的平均张力(单位
kg/cm2), 随机选取了9个样本作试验,
由试验所得数据得
x 6720 s 2 282 设钢索所能承受的张力X,
X ~ N (, 2 ) 分别估计这批钢索所能承受的平均张力
的范围与所能承受的平均张力。
使我们能以比
较高的可靠程度相信它包含真参数值. 这里所说的“可靠程度”是用概率来度量的,
称为置信概率,置信度或置信水平.
习惯上把置信水平记作 的正数,称为显著水平。
1
,这里 是一个很小
2
两个统计量
若由总体X的样本 X1,X2,…Xn 确定的
1 1( X1, X 2 , , X n ),
2 2 ( X1, X 2, , X n )
这里有两个要求:
1. 要求 很大的可能被包含在区间 内,
[ˆ1,ˆ2 ]
就是说,概率 P{ˆ1 ˆ2} 要尽可能大.
即要求估计尽量可靠.
2. 估计的精度要尽可能的高.如要求区间长度 尽可能短,或能体现该要求的其它准则.
ˆ2 ˆ1
可靠度与精度是一对矛盾,
一般是在保证可靠度的
条件下尽可能提高精度.
12
设总体X ~ N(μ,0.09), 有一组样本值: 12.6,13.4,12.8,13.2, 求参数μ的置信度为0.95的置信区间.
解 μ的置信区间为
[X
z
2
0
n
,
X
z
2
0 ]
n
有 1-α= 0.95,σ0= 0.3,n = 4,
代入样本值算得
, x 13 z z0.025 1.96
2
~
2 (n 1)
2
2