当前位置：文档之家› 《统计学》参数估计

《统计学》参数估计

总体均值的置信水平为1 的（双侧）置信区间都可以用(5.13)式进
行计算。
S
S
( X t (n 1) , X t (n 1) )
2
n
2
n
但是在自由度较大时(比如大于 30 或 50)，t 分布和标准正态分布极
为接近(见下图)，所以也可以用标准正态分布的分位数 z2 来近似 t 分布
的分位数 t (n 1) 。 2
.
可得
两个正态总体均值之差 1 2 的置信水平为1 的置信区间为
全及总体是唯一确定的，样本总体是不唯一确定的。
12
总体指标与样本指标
总体指标是根据全及总体各单位的标志值或标志表现计算的综合指标。
总体指标是唯一确定的。样本指标是根据样本总体各单位的标志值或标志表现计算的综合指标。样本指标不是唯一确定的，是一个随机变量。
13
重复抽样与不重复抽样
重复抽样是指从全及总体中抽取样本时，随机抽取一个样本单位，记录其有关标志表现以后，把它放回到全及总体中去，再从全及总体中随机抽取第二个样本单位，记录它的有关标志表现以后，再把它放回到全及总体中去，直到抽够所需的样本单位。这样每个单位可以有多次重复被抽中的机会。
影响抽样误差的因素 1．抽样单位数的多少； 2．总体被研究标志的变异程度； 3．抽样组织方式方法。
15
抽样误差与区间估计的基本思想
抽样平均误差就是抽样平均数（或抽样成数）的标准差。反映抽样平均数（或抽样成数）与总体平均数（或总体成数）的平均误差程度。
抽样平均误差的定义公式（理论公式）为：
(
x
X
其计算公式是：
u 平均数条件下：
t
x
x
z
u x
2
u 成数条件下：
t
p
p z up
2
18
单正态总体均值的区间估计(方差已知时)
设样本 X1,, Xn 来自正态总体 N (, 2 ) ，这里 2 已知，如何求总体均值
的置信水平为1 的置信区间?
枢轴量
Z X n
~
N (0, 1) ，有
P( X
2
n
2
n
S 2
1 n 1
n i 1
( xi
x)2
置信区间的观测值为
P122图5.4
s
s
(x t (n 1) , x t (n 1) )
2
n
2
n
21
【例 5.2】某饮料公司生的一种瓶装软饮料，其包装上标明净容量是 500ml，在市场上随机抽取了 25 瓶，测得到其平均容量为 499.5ml，标准差为 2.63ml。试求该公司生产的这种瓶装饮料的平均容量的置信水平为 99%的置信区间 (假定饮料的容量服从正态分布 N (, 2) )。
9
抽样推断的特点
１．根据部分实际资料对全部总体的数量特征做出估计；
2．按随机性原则从总体中抽选样本单位； 3．抽样推断的抽样误差可以事先计算并加以控制，但不能消灭。
10
抽样推断的作用
1．有些现象无法进行全面调查，为了测算其全面资料，必须采用抽样调查。
2．有些理论上可进行全面调查的现象，采用抽样调查可以达到事半功倍的效果。
【解】以表示瓶装饮料的平均容量，由已知可得，样本容量为n 25 ，
样本均值 x 499.5，样本标准差为 s 2.63 ，因为置信水平1 0.99 ，查
自由度为
n
1
24 的
t
分布表得分位数 t 2
(n
1)
t0.005 (24)
2.797
，所以
s
x t (n 1) 499.5 2.797 2.63/ 25 499.5 1.4712 498.03
3．可用于对全面调查的结果进行评价和校正。 4．可用于工业生产过程中的质量控制。
11
全及总体与样本总体
全及总体，简称总体，是指所要认识对象的全体。通常用N表示。
抽样总体，简称样本，是指从全及总体中随机抽取出来的那部分单位的集合体。通常用n表示。
一般来说，样本单位数达到或超过30称为大样本，而在30以下称为小样本。
n
z ) 1
2
即
P( X z
2
X z
n
2
n
)
1
，
总体均值的置信水平为1 的置信区间
(X z , X z )
2n
2n
置信区间的观测值
(x z
2
, x z
n
2
)
n
正态分布分位数见
x z 2n
教材P121图5.3
x
x z 2n 19
【例 5.1】某灯具生产厂家生产一种 60W 的灯泡，假设其寿命为随机变量 X，服从正态分布 N(,1296) 。现在从该厂生产的 60W 的灯泡中随机地抽取了 27 个产品进行测试，直到灯泡烧坏，测得它们的平均寿命为 1478 小时。请计算该厂 60W 灯泡的平均寿命的置信水平为 95%的置信区间。
【解】注意到两个总体的方差都已知 ; 因为 1 0.90 ，所以
1
/
2
0.95，所以查标准正态分布表得
z 2
z0.05
1.65
(若用软件计算为
1.6449)，因此， z 2
12
2 2
1.65
nm
62 42 15 8
3.4611，
x y z
2
2 1
n
2 2
13.0 18.5 16.4 14.8 19.4 17.3 23.2 24.9 20.8 19.3 18.8 23.1 15.2 19.9 19.1 18.1 25.1 16.8 20.4 17.4 25.2 23.1 15.3 19.4 16.0 21.7 15.2 21.3 21.5 16.8 15.6 17.6 设湖水中钠的含量为随机变量 X ，服从正态分布 N (, 2) ，求湖水钠的平均含量的
25
两正态总体均值之差的区间估计
设
X
1
,,
X
n
和
Y1
,
,
Ym
分别是从正态总体
N
(1
,
2 1
)
和
N
(
2
,
2 2
)
抽取的两个样本，
且相互独立，设 X 和Y 分别表示 X 和 Y 样本的样本均值，容易证明 X Y
是 1 2 的无偏估计。
1.
两个正态总体的方差
2 1
和
2 2
已知
Z X Y (1 2 ) ~ N (0, 1)
【解】问题实际上就是求总体均值(60W 灯泡的平均寿命)的置信区间，由已知得，总体方差 2 1296，样本容量为 n 27 ，样本均值 x 1478。
因为置信水平为1 0.95，所以查标准正态分布表可得 z z0.025 1.96 ， 2
x z
2
1478 1.96
n
1296 / 27 1478 13.58 1464.42 ，
95%置信区间。
【解】由已知可得，样本容量为 n 32, x 19.0688, s 3.2555 ，因为置
信水平 1 0.95 ，查自由度为 n 1 31 的 t 分布表得分位数
t 2 (n 1) t0.025(31) 2.04 ，所以
s
x t (n 1) 19.0688 2.04 3.2555 / 32 19.0688 1.1737 17.90
(X z S , X z S )
2
n
2
n
实际上，可以证明当样本容量
n
充分大时，枢轴量
t
X S
n
近似服从
标准正态分布，这也可以解释当 n 较大时，用标准正态分布的分位数 z 2
来近似 t 分布的分位数t (n 1) 的合理性。 2
23
t分布与标准正态分布的比较
24
【例 5.3】为研究某内陆湖的湖水的含盐量，随机地从该湖的 32 个取样点采了 32 个湖水样本，测得它们的含钠量(单位：ppm)分别为：
2
)
x
N
抽样平均误差的计算：
16
抽样误差与区间估计的基本思想
抽样平均数条件
抽样成数条件
重复
抽样
2
xn
P(1 P)
P
n
2
不重复
(1 n )
抽样 x n N
p(1 p) (1 n )
p
n
N
17
抽样误差与区间估计的基本思想
抽样极限误差是指样本指标和总体指标之间抽样误差的可能范围。又称为允许误差。
参第数五估章计
参数估计
南京财经大学统计学系
朱龙杰
1
本章内容
第一节统计推断的概念和作用第二节抽样推断的基本概念第三节正态总体均值的区间估计第四节一般总体均值的大样本区间估计第五节正态总体方差的区间估计第六节样本容量的确定
2
第一节统计推断的概念和作用
一、统计推断的概念二、统计推断的特点三、统计推断的作用
二、总体成数的大样本区间估计
6
第五节正态总体方差的区间估计一、单正态总体方差的区间估计二、两正态总体方差的区间估计
7
第六节样本容量的确定一、总体均值估计的必要样本容量二、总体成数估计的必要样本容量三、影响必要样本容量的因素
8
统计推断的概念
抽样推断是按照随机性原则从全部研究对象中抽取一部分单位进行观察，并依据所获得的数据对全部研究对象的数量特征做出具有一定可靠性的估计推断。

e商务文档

《统计学》参数估计

相关文档推荐：