当前位置:文档之家› 《应用统计学》第6章:置信区间估计

《应用统计学》第6章:置信区间估计

求解正态总体均值 的置信区间。
20
课堂练习2:
某车床加工的缸套外径尺寸 X~N( μ, σ 2 ),
下面是随机测得的10个加工后的缸套外径尺 寸(mm),
90.01,90.01,90.02,90.03,89.99
8x9.9980,.00819.97,S 2900.0.001,859302 .01,89.99
的样本, X 和 S2 分别为样本均值和样本方差。
可以证明:
t X ~
S/ n
t(n-1)
因此,对给定的置信度 1-,有
P{t /2 (n 1)
X
S/ n
t / 2 (n 1)}
1
即 P{X t /2(n 1)S / n X t /2(n 1)S / n} 1
由此可得 的置信度为 1- 的置信区间为
可用 Excel 的统计函数 TINV 返回 t (n)。 语法规则如下:
格式:TINV( 2 , n )
功能:返回 t (n)的值。
说明:TINV(, n )返回的是 t/2(n)的值。
17
4. 未知时总体均值 μ 的区间
估计
设总体 X~N( μ, σ 2 ), X1, X2, ···, Xn 为 X 的容量为 n
/2=0.025, n=10, 查表得 t0.025(9)=2.2622
d t /2(n 1)S / n 2.2622 196 .5 / 10 140.6
故所求 的 95% 置信区间为
(x d, x d) (1282.5, 1563.7)
可用 Excel 的【工具】→“数据分析”→“描述统 计”
第6章 置信区间估计
本章教学目标: (1) 单个正态总体均值和方差的区间估计。 (2) 总体比例的区间估计。 (3) 均值和比例置信区间估计中的样本容量
确定。 (4) 两个正态总体的均值差和方差比的区间
估计。 (5) 单侧置信区间估计。
1
区间估计
由于点估计存在误差,因此仅对总体参数作出点 估计是不够的,还需要了解估计的精度及其误差。
p 5 / 300 1.67%
d Z /2 p(1 p) / n
1.96 0.0167(1 0.0167) / 300 1.45%
该厂产品次品率的置信度为95%的置信区间为
( p d, p d) (0.22%, 3.12%)
22
案例思考题
国外民意调查机构在进行民意调查时,通 常要求在95%的置信度下将调查的允许误差 (即置信区间的 d 值)控制在3%以内。
18 (x d, x d) , d t /2(n 1)S / n
§6.2 总体比例的区间估计
设总体比例为 P, 则当 nP 和 n (1-P) 都大于5时, 样本成数 p 近似服从均值为 P,方差为 P (1-P)/n 的正态 分布。从而
pP
P(1 P) / n 近似服从 N (0, 1)
对给定的置信度1-,由
可用 Excel 的统计函数 CHIINV 2 (n) 返语回法规则如下:
格式:CHIINV ( , n )
功能:返回 2 (n) 的值。
7
2. 总体方差 2 的区间估计
设总体 X~N( μ, σ2 ), X1, X2, ···, Xn 为 X 的容量为n的样本,
X 和 S2 分别为样本均值和样本方差。 可以证明,
2 0.025
(9)
=
9135.22
(n-1)S2/
2 0.975
(9)
=
9196.52/2.7
=
358.82
故所求 2的置信区间为
(135.22,358.82)
9
课堂练习1
某车床加工的缸套外径尺寸 X ~ N(μ, σ 2),现 随机测得的 10 个加工后的某种缸套外径尺寸 (mm) 如下:
15
t 分布的右侧 分位点 t(n)
t(n)为 t 分布中满足下式的右侧 分位点: P{ t > t ( n ) }=
由给定的概率 ,可查表得到 t(n)。
由 t 分布的对称性,可得:t1-(n)=-t(n)。
f (x)
x
16
t1-(n) = - t(n) 0
t(n)
用 Excel 求 t /2(n)
⑴问为满足该调查精度要求,至少需要多 大的样本?
⑵如果要求置信度达到99%,调查误差仍 为3%,此时至少需要多大的样本?
23
案例思考题解答(1)
由 d Z /2 p(1 p) / n ,可得
n
Z2 / 2
p(1 d2
p)
本案例中,当 p 0.5时,p(1 p) 达到最大值,
故需要的样本容量至少为
Z X / n
~N(0,1)
/2
对给定的置信度1-, 有
f (x)
1-
/2
P{Z / 2
X
/
n
Z /2}
1
-z/2
0
z/2 x
由此可得 P{x Z /2 / n x Z /2 / n}1
从而的置信度为 1- 的置信区间为
( x Z /2 / n , x Z /2 / n )
为便于记忆和理解,将 的置信区间表示为如下形式:
解:由题意,要推断的是总体成数,
p =0.036,1-p = 0.964,d = 0.02,α = 0.05,
zαn/2=Zz20/ 2.0pd2(521=
1p).96
1.96 2
0.036 0.02 2
0.964
333 .3 (件)
故每次至少应抽查 334 件产品。
由此可知,在总体比例的区间估计问题中,要达 到30一定的精度要求,样本容量至少要在几百以上。
n
1.962 0.5 0.5 0.032
1067.1
1068(人)
24
案例思考题解答(2)
如果要求置信度达到99%,则 Z/2=Zn0.0025.=5725.502 .70503.,25 0.5 1841.8 1842(人)
25
§6.3 样本容量确定
前面的分析都是在给定的样本容量和样本 数据下求置信区间。但在实际应用中,应当 在随机抽样前就确定所需抽取的样本容量。
设 X~N(0, 1),Y~ 2(n), 且 X 与 Y 相互
独立, 则随机变量
t X
Y/n 服从自由度为 n 的 t 分布,记为 t~t(n)。
14
t 分布密度函数的图形
f (x) n = ∞,N (0, 1) n = 10 n=4 n=1
x 0
标准正态分布分布是 t 分布的极限分布。 当 n 很大时,t 分布近似于标准正态分布。
n
X
2 i
i 1
4
2 分布密度函数的图形
f (x)
n=1 n=4
n=10
o
x
5
2 (n)
2 分布的右侧 分位点
2 (n) 为 2分布中满足下式的的右侧 分位
点: P{ 2 2 (n) }
f (x)
o
x 2 (n)
由给定的概率 和自由度,可查表得到 2 (n)
6

Excel

2
(n)
(x d, x d) , d Z/2 / n
12其中 d 称为估计的允许误差。
用 Excel 求 Zα
可用 Excel 的统计函数 NORMSINV 返回 Z 。
语法规则如下:
格式:NORMSINV(1-)
功能: 返回 Z 的值。
说明: NORMSINV() 返回的是 Z1- 的
值。
13
3. t 分布
2.总体比例区间估计时样本容量的确定
由 d Z /2 p(1 p) / n ,可得
n
Z2/ 2 p(1 d2
p)
其中样本成数 p 同样可先通过小规模抽样 作出估计,也可根据其他信息估计,或取 0.5。
29
某企业要重新制【定产例品7抽】样检验的规范。
已知过去检验的次品率在3.6%左右,现要求 允许误差不超过2%,置信度为95%。问每次 至少应抽查多少产品?
2
(n 1)S 2
2

2 (n 1)

P{12 / 2 (n 1)
(n 1)S 2
2
2 / 2 (n 1)} 1
可得
P{ (n 1)S 2 2 (n 1)S 2 } 1
2/ 2 (n 1)
2 1
/
2
(n
1)
从而 2 的置信度为1-
的置信区间为:
f (x)
/2
1-
8
(n
2 /
1)S 2 2 (n 1)
d t /2 (n 1)S / n
可得 n t /2 (n 1)S 2 z /2 2 z /2S 2
d d d
其中总体标准差或样本标准差也是未知的,通 常可以先通过小规模抽样作出估计。
由于使用的是近似公式,可知实际采用的最低 样本容量应比计算结果稍大。
27
【例6】在例3 元件平均寿命的区间估计问题中,要
90.01,90.01,90.02,90.03,89.99
89.98,89.97,90.00,90.01,89.99
S 2 0.018532
(
)
求 σ 2 的置信度为 95% 的置信区间。
10
二. 总体均值μ的区间估计
1. 标准正态分布的右侧 分位点 Z
Z 是标准正态分布中满足下式的右侧分位点:



求 μ 的置信度为95%的置信区间;
21
【例4】某厂为了解产品的质量情况,随机抽取了300件产品 进行检验,其中有5件次品,求该厂产品次品率的置信度为 95%的置信区间。
相关主题