当前位置:文档之家› 《统计学》参数估计

《统计学》参数估计


总体均值 的置信水平为1 的(双侧)置信区间都可以用(5.13)式进
行计算。
S
S
( X t (n 1) , X t (n 1) )
2
n
2
n
但是在自由度较大时(比如大于 30 或 50),t 分布和标准正态分布极
为接近(见下图),所以也可以用标准正态分布的分位数 z2 来近似 t 分布
的分位数 t (n 1) 。 2
.
可得
两个正态总体均值之差 1 2 的置信水平为1 的置信区间为
全及总体是唯一确定的,样本总体是不唯一确 定的。
12
总体指标与样本指标
总体指标是根据全及总体各单位的标志值 或标志表现计算的综合指标。
总体指标是唯一确定的。 样本指标是根据样本总体各单位的标志值 或标志表现计算的综合指标。 样本指标不是唯一确定的,是一个随机变 量。
13
重复抽样与不重复抽样
重复抽样是指从全及总体中抽取样本时,随机 抽取一个样本单位,记录其有关标志表现以后,把 它放回到全及总体中去,再从全及总体中随机抽取 第二个样本单位,记录它的有关标志表现以后,再 把它放回到全及总体中去,直到抽够所需的样本单 位。这样每个单位可以有多次重复被抽中的机会。
影响抽样误差的因素 1.抽样单位数的多少; 2.总体被研究标志的变异程度; 3.抽样组织方式方法。
15
抽样误差与区间估计的基本思想
抽样平均误差就是抽样平均数(或抽样成数)的 标准差。反映抽样平均数(或抽样成数)与总体平 均数(或总体成数)的平均误差程度。
抽样平均误差的定义公式(理论公式)为:
(
x
X
其计算公式是:
u 平均数条件下:
t
x
x
z
u x
2
u 成数条件下:
t
p
p z up
2
18
单正态总体均值的区间估计(方差已知时)
设样本 X1,, Xn 来自正态总体 N (, 2 ) ,这里 2 已知,如何求总体均值
的置信水平为1 的置信区间?
枢轴量
Z X n
~
N (0, 1) ,有
P( X
2
n
2
n
S 2
1 n 1
n i 1
( xi
x)2
置信区间的观测值为
P122图5.4
s
s
(x t (n 1) , x t (n 1) )
2
n
2
n
21
【例 5.2】某饮料公司生的一种瓶装软饮料,其包装上标明净容量是 500ml, 在市场上随机抽取了 25 瓶,测得到其平均容量为 499.5ml,标准差为 2.63ml。 试求该公司生产的这种瓶装饮料的平均容量的置信水平为 99%的置信区间 (假定饮料的容量服从正态分布 N (, 2) )。
9
抽样推断的特点
1.根据部分实际资料对全部总体的数量特征 做出估计;
2.按随机性原则从总体中抽选样本单位; 3.抽样推断的抽样误差可以事先计算并加以 控制,但不能消灭。
10
抽样推断的作用
1.有些现象无法进行全面调查,为了测算其 全面资料,必须采用抽样调查。
2.有些理论上可进行全面调查的现象,采用 抽样调查可以达到事半功倍的效果。
【解】以 表示瓶装饮料的平均容量,由已知可得,样本容量为n 25 ,
样本均值 x 499.5,样本标准差为 s 2.63 ,因为置信水平1 0.99 ,查
自由度为
n
1
24 的
t
分布表得分位数 t 2
(n
1)
t0.005 (24)
2.797
,所以
s
x t (n 1) 499.5 2.797 2.63/ 25 499.5 1.4712 498.03
3.可用于对全面调查的结果进行评价和校正。 4.可用于工业生产过程中的质量控制。
11
全及总体与样本总体
全及总体,简称总体,是指所要认识对象的全 体。通常用N表示。
抽样总体,简称样本,是指从全及总体中随机 抽取出来的那部分单位的集合体。通常用n表示。
一般来说,样本单位数达到或超过30称为大样 本,而在30以下称为小样本。
n
z ) 1
2

P( X z
2
X z
n
2
n
)
1

总体均值 的置信水平为1 的置信区间
(X z , X z )
2n
2n
置信区间的观测值
(x z
2
, x z
n
2
)
n
正态分布分位数见
x z 2n
教材P121图5.3
x
x z 2n 19
【例 5.1】某灯具生产厂家生产一种 60W 的灯泡,假设其寿命为随机变量 X,服从正态分布 N(,1296) 。现在从该厂生产的 60W 的灯泡中随机地抽取 了 27 个产品进行测试,直到灯泡烧坏,测得它们的平均寿命为 1478 小时。 请计算该厂 60W 灯泡的平均寿命的置信水平为 95%的置信区间。
【 解 】 注 意 到 两 个 总 体 的 方 差 都 已 知 ; 因 为 1 0.90 , 所 以
1
/
2
0.95,所以查标准正态分布表得
z 2
z0.05
1.65
(若用软件计算为
1.6449),因此, z 2
12
2 2
1.65
nm
62 42 15 8
3.4611,
x y z
2
2 1
n
2 2
13.0 18.5 16.4 14.8 19.4 17.3 23.2 24.9 20.8 19.3 18.8 23.1 15.2 19.9 19.1 18.1 25.1 16.8 20.4 17.4 25.2 23.1 15.3 19.4 16.0 21.7 15.2 21.3 21.5 16.8 15.6 17.6 设湖水中钠的含量为随机变量 X ,服从正态分布 N (, 2) ,求湖水钠的平均含量 的
25
两正态总体均值之差的区间估计

X
1
,,
X
n

Y1
,
,
Ym
分别是从正态总体
N
(1
,
2 1
)

N
(
2
,
2 2
)
抽取的两个样本,
且相互独立,设 X 和Y 分别表示 X 和 Y 样本的样本均值,容易证明 X Y
是 1 2 的无偏估计。
1.
两个正态总体的方差
2 1

2 2
已知
Z X Y (1 2 ) ~ N (0, 1)
【解】问题实际上就是求总体均值(60W 灯泡的平均寿命)的置信区间, 由已知得,总体方差 2 1296,样本容量为 n 27 ,样本均值 x 1478。
因为置信水平为1 0.95,所以查标准正态分布表可得 z z0.025 1.96 , 2
x z
2
1478 1.96
n
1296 / 27 1478 13.58 1464.42 ,
95%置信区间。
【解】由已知可得,样本容量为 n 32, x 19.0688, s 3.2555 ,因为置
信 水 平 1 0.95 , 查 自 由 度 为 n 1 31 的 t 分 布 表 得 分 位 数
t 2 (n 1) t0.025(31) 2.04 ,所以
s
x t (n 1) 19.0688 2.04 3.2555 / 32 19.0688 1.1737 17.90
(X z S , X z S )
2
n
2
n
实际上,可以证明当样本容量
n
充分大时,枢轴量
t
X S
n
近似服从
标准正态分布,这也可以解释当 n 较大时,用标准正态分布的分位数 z 2
来近似 t 分布的分位数t (n 1) 的合理性。 2
23
t分布与标准正态分布的比较
24
【例 5.3】为研究某内陆湖的湖水的含盐量,随机地从该湖的 32 个取样点采了 32 个湖 水样本,测得它们的含钠量(单位:ppm)分别为:
2
)
x
N
抽样平均误差的计算:
16
抽样误差与区间估计的基本思想
抽样平均数条件
抽样成数条件
重 复
抽样
2
xn
P(1 P)
P
n
2
不重复
(1 n )
抽样 x n N
p(1 p) (1 n )
p
n
N
17
抽样误差与区间估计的基本思想
抽样极限误差是指样本指标和总体指标之间抽样误 差的可能范围。又称为允许误差。
参第数五估章 计
参数估计
南京财经大学统计学系
朱龙杰
1
本章内容
第一节 统计推断的概念和作用 第二节 抽样推断的基本概念 第三节 正态总体均值的区间估计 第四节 一般总体均值的大样本区间估计 第五节 正态总体方差的区间估计 第六节 样本容量的确定
2
第一节 统计推断的概念和作用
一、统计推断的概念 二、统计推断的特点 三、统计推断的作用
二、总体成数的大样本区间估计
6
第五节 正态总体方差的区间估计 一、单正态总体方差的区间估计 二、两正态总体方差的区间估计
7
第六节 样本容量的确定 一、总体均值估计的必要样本容量 二、总体成数估计的必要样本容量 三、影响必要样本容量的因素
8
统计推断的概念
抽样推断是按照随机性原则从全部研究对象中抽 取一部分单位进行观察,并依据所获得的数据对全 部研究对象的数量特征做出具有一定可靠性的估计 推断。
相关主题