第7章_参数估计
(4500 3250) 1.96 2500 3600 25 25
= 1219.78 , 1280.62
(2) A- B置信度为99%的置信区间为
(4500 3250) 2.58 2500 3600 25 25
= 1209.7 ,1290.3
2)总体方差未知但相等 使用 t 分布统计量
t
x
t
2
sn1 n
,x
t
2
sn1 n
50 2.0639
8 ,50 2.0639 25
8 25
46.69,53.3
7.2.2 总体比例的区间估计
总体服从二项分布,样本量足够大,样
本比例的抽样分布可用正态分布近似时,对
总体比例的区间估计,使用统计量
z
p
1
n
~
N 0,1 ,
总体比例 p 的置信区间为 p Z 2
+1.65x
+ 2.58x
X
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
置信水平:
1. 置信区间中包含总体参数真值的次数所占 比例
2. 表示为 (1 -
– 为显著性水平,是总体参数未在区间内的 概率
3. 常用的显著性水平值有 99%, 95%, 90%
– 相应的 为0.01,0.05,0.10
解:已知 x=26, =6,n=100,1- = 0.95,Zα/2=1.96
x Z 2
n , x Z 2
n
26 1.96
6 ,26 1.96 100
6 100
24.824,27.176
2.正态总体、方差未知、小样本 用样本方差代替总体方差,这时用 t 统
计量进行估计。
t
x s
n
7.2.1 总体均值的区间估计
1.正态总体、方差已知,或非正态总体、大样本
总体服从正态分布,且总体方差(2)已知 如果不是正态分布,可以由正态分布来近似 (n≥30)
使用正态分布统计量
z
x n
~
N
0,1
进行估计
总体均值
在
1-
置信水平下的置信区间为
x
Z
2
n
;
如果方差未知,或总体不服从正态分布的情况下,只要满足大样
0.95,Z/2=1.96
pˆ Z 2
pˆ (1 pˆ ) n
0.7 1.96 0.7(1 0.7) 200
0.636, 0.764
7.2.3 总体方差的区间估计
对于正态总体方差的估计,可以用
2
=
n
1
2
s
2
~
2
n 1 统计量进行估计
总体方差在 1-α置信水平下的置信区
n 1 s2 n 1 s2
~
t
n
1
总体均值 在 1- 置信水平下的置信
区间
x
t
2
sn1 n
,
x
t
2
sn1 n
【例】从一个正态总体中抽取一个随机样本,n =
25 ,其均值x = 50 ,标准差 s = 8。 建立总体均值
的95%的置信区间。
解:已知X~N(,2),x=50, s=8, n=25, 1- =
0.95,t/2=2.0639。
x1 x2 z 2
s12 s22 n1 n2
86 78 z0.025
5.82 7.22
46 33
8 1.961.52
(2)小样本的估计 在两个样本都是小样本的情况下,为估
计两个总体的均值之差,需要做出以下假定
➢ 两个总体都服从正态分布 ➢ 两个随机样本独立的分别抽自两个总体
则两个样本均值之差必定服从正态分布
总 态分体布服。从试方求差分A-别为B的区A2=间25估00计和B2=3600的正
(1)置信度为95%
(2)置信度为99%
解:已知
XA~N(A,2500) XB ~N(B,3600)
xA=4500, xB=3250,
A2 =2500 B2 =3600
nA= nB =25
(1) A- B置信度为95%的置信区间为
7.3 两个总体参数的区间估计
7.3.1 两个总体均值之差的区间估计
总体1
1 1
2 2
总体2
抽取简单随机样 样本容量 n1 计算 X1
计算每一对样本 的X1-X2
抽取简单随机样 样本容量 n2 计算X2
所有可能样本 的X1-X2
1 2
抽样分布
1.两个总体均值之差的估计:独立样本
如果两个样本是从两个总体中独立抽取 的,即一个样本中的元素与另一个样本中的 元素相互独立,则称为独立样本
P1 P2
12
2 2
用于估计的 样本统计量
x pˆ
s2 x1 x2 pˆ1 pˆ2 s12 s22
7.1.2 点估计与区间估计
1.点估计 用样本统计量 $的某个取值直接作为总
体参数 的估计值。
例如: 用样本均值 x 作为总体未知均值 的估
计值就是一个点估计
点估计没有给出估计值接近总体未知参 数程度的信息
s12=16.63 s22=18.92 n1= n2=10 1212
自由度 f 为
2
16.36 18.92
f 10
10
17.9 18
16.36
10
2
1 9
18.92
10
2
1 9
1- 2置信度为95%的置信区间为
22.2 28.5 2.1009 16.36 18.92
2.区间估计
在点估计的基础上,给出总体参数估计 的一个区间范围,该区间通常由样本统计量 加减估计误差得到。对样本统计量与总体参 数的接近程度给出一个概率度量。
例如: 总体均值落在50~70之间,置信度为95%
置信区间
样本统计量 (点估计)
置信下限
置信上限
X = Zx
x_
- 2.58x
-1.65 x
本条件,可以用样本方差代替总体方差,即
x
Z
2
s n
【例】某种零件长度服从正态分布,从该批产品中 随机抽取9件,测得其平均长度为21.4 mm。已知总 体标准差0.15mm,试建立该种零件平均长度的置信 区间,给定置信水平为0.95。
解:已知X~N(,0.152),x=2.14, n=9, 1- = 0.95, Z/2=1.96
s22 n2
2
2
n1
s22
2 n2
n1 1
n2 1
两个总体均值之差1-2在1- 置信水平
下的置信区间为
x1 x2
t 2 (v)
s12 s22 n1 n2
【例】为比较两位银行职员为新顾客办理个
人结算账目的平均时间长度,分别给两位 职员随机安排了10位顾客,并记录下了为 每位顾客办理账单所需的时间(单位:分
X
2.有效性
对同一总体参数的两个无偏估计量,有 更小标准差的估计量更有效。
与其他估计量相比 ,样本均值是一个更 有效的估计量
均值的抽样分布
P(X )
B
中位数的抽样分布
A
X
3.一致性
随着样本量的增大,点估计量的值越来 越接近被估总体参数。
较小的样本容量
X
7.2 一个总体参数的区间估计
x1 x2 sp
1 2
11 n1 n2
: t n1 n2 2
s
2 p
n1 1 s12 n1 n2
n2 1 2
s22
两个总体均值之差1-2在1- 置信水平 下的置信区间为
x1 x2 t 2 n1 n2 2sp
11 n1 n2
【例】为比较两位银行职员为新顾客办理个
人结算账目的平均时间长度,分别给两位职 员随机安排了10位顾客,并记录下为每位顾 客办理账单所需的时间(单位:分钟),相 应的样本均值和方差分别为:x1=22.2, s12=16.63,x2=28.5,s22=18.92。假定每位职 员办理账单所需时间均服从正态分布,且方
本差值的标准差 sd 代替
(2)小样本 假定两个总体个观察之的配对差服从正态分布,
两个总体均值之差 1-2 在 1- 置信水平下的置信 区间为
d
t
2 n 1
sd n
7.3.2 两个总体比例之差的区间估计
1. 假定条件
▪ 两个总体是独立的 ▪ 两个总体服从二项分布 ▪ 可以用正态分布来近似
2. 两个总体比例之差P1-P2在1-置信水平下 的置信区间为
区间与置信水平
均值的抽样分布
x
/2
1 -
/2
X
x
(1 - ) % 区间包含了 % 的区间未包含
7.1.3 评价估计量的标准
1.无偏性 估计量抽样分布的数学期望等于被估计
的总体参数,E $ 。则称$为 的无偏估计量。
x, p, s2 分别是 , , 2 的无偏估计量
P( X )
无偏 有偏
A
C
水平下的置信区间为: x1 x2 z 2
s12 s22 n1 n2
某地区教育管理部门想估计两所中学的学生 高考时的英语平均分数之差,为此在两所学 校独立抽取两个随机样本,有关数据如下:
n1 46n2 33 x1 86x2 78 s1 5.8s2 7.2
建立两所学校高考英语平均分之 差95%的置信区间
钟),相应的样本均值和方差分别为: x1=22.2,s12=16.63,x2=28.5,s22=18.92 。假定每位职员办理账单所需时间均服从
正态分布,但方差不相等。试求两位职员 办理账单的服务时间之差的95%的区间估计 。