当前位置:文档之家› 第三章 参数估计

第三章 参数估计


(二)两个正态总体的抽样分布
定理 3-5
2 2 Y ~ N ( , X ~ N ( , ) 设 2 2 ) 是两个相 1 1 与
互独立的正态总体, 又设 X1 ,, X n1 和 Y1 ,, Yn2 分别是来自两 个总体 X 和 Y 的样本,其样本均值和样本方差分别为 X 、
Y 和 S12 、 S22 , 则有
解:因 n=16 为大样本,则由中心极限定理,其样本均 值 x 近似服从均值是 18、方差是 n 即
2
16 1 的正态分布, 64 4
1 x ~ N ( 18, ) 4
近似
故所求概率为
19 18 17 18 P(17 x 19) F (19) F (17) 12 12 (2) (2) 2(2) 1 0.9545
Sx S n
CV S 100% x
以上统计量分别刻画了样本的集中趋势和离散趋势, 并可 分别用于估计总体的相应参数。
第二节 抽样分布
统计学中把统计量分布通称为抽样分布 (sampling distribution)
一、常用统计分布
(一)分位数
定义 3-3 设随机变量 X 的分布函数为 F(x),对给定的实 数(0<<1),若实数 F满足 P{X> F}= 则称 F为随机变量 X 的分布的上侧 分位数。 若实数 F/2 满足 P{|X|> F/2}= 则称 F/2 为随机变量 X 的分布的双侧 分位数 (分位数也称 为临界值) 。

样本(sample) :从总体X中抽取的部分个体。
样本容量(sample size):样本中所含的个体数。
简单随机样本(简称样本)
定义 3-1 设 X1 , X 2 ,, X n 是来自总体 X 的样本。如果
X1 , X 2 ,, X n 相互独立, 而且每一个个体都与总体 X 具有相
同的分布,则称样本 X1 , X 2 ,, X n 为总体 X 的简单随机样本 (simple random sample) ,简称样本(sample) 。 由于样本 X1 , X 2 ,, X n 是从总体 X 中随机抽取的,因此 是 n 个随机变量;而在一次具体的抽样后,得到的是 n 个具 体的观测值 x1 , x2 ,, xn ,称为一组样本值。
1 F1 (n1 , n2 ) F 分布的分位数的性质: F (n2 , n1 )
由于附表 7 中只能查到较小的分位数 F (n1 , n2 ) 。利用 上述公式,就可求得较大如 0.9、0.95 等的 F 分布的分位数。
(一)单个正态总体的抽样分布
2 定理 3-1 设总体 X ~ N (, ) ,x1 , x2 ,, xn 为取自 X 的一
1
o
1
2
3
4
x
t 分布的密度曲线与标准正态曲线类似,是“钟形”曲线, 且随着 n 的增大逐渐趋向于标准正态分布 N(0,1)。 对于大样本 (n>30) 情形, t 分布可用标准正态分布近似。 对于给定的,称满足
t ( n )
P{T t (n)}
t ( x)dx
的数 t (n)为 t(n)分布的上侧分位数(或上侧临界值)。 t 分布的上侧分位数可从 t 分布表(附表 6)中查得。 对于较大值,可由 t 分布的对称性得到 t (n) t1 (n) 。 当 n>45 时,就用 N(0,1)的分位数 u来近似 t (n),即
其中 S
2 w为
S
2 2 S 1 与 2 的加权平均,即
2 2 ( n 1) S ( n 1) S 2 1 2 2 Sw 1 n1 n2 2
u ( X Y ) ( 1 2 )
( 1)

2 1
n1


2 2
~ N (0,1)
n2
S12 12 F 2 2 ~ F (n1 1, n2 1) ( 2) S2 2
2 2 2 ( 3) 当 1 时, 2
( X Y ) ( 1 2 ) T ~ t (n1 n2 2) 1 1 Sw n1 n2
2
( x)dx
u
2
( x)dx
的数 u/2 为标准正态分布的双侧分位数(双侧临界值) 。
(x)
2 -u 0
2
2
u
x
2
图 3-2
标准正态分布的双侧分位数
对常用的统计分布,可利用附录中的常用统计表查 得分位数的值。
(二)2分布
定义 3-4 设随机变量 X1 , X 2 ,, X n 相互独立,且都服从标准正态 分布 N(0,1),则称
2 均值是,方差为 n 的正态分布,即:
1 n 近似 2 x xi ~ N ( , ) n i 1 n
从而有
x u ~ N (0,1) / n
例3-2
例 3-2 从均值=18 和方差2=16 的总体中随机 抽取样本容量为 64 的样本,试求样本均值 x 落在 17 到 19 之间的概率。
F ( x)dx
o
F (n1 , n2 )

的数 F (n1 , n2 ) 为 F (n1 , n2 ) 分布的上侧分位数(或临界值)。 利用 F 分布表(附表 7)就可查得分位数 F (n1 , n2 ) 。
x
1 ~ F (n2 , n1 ) F ~ F ( n , n ) 1 2 ,则 F 若 。
2=X12 X 22 X n2
服从自由度为 n 的2(卡方)分布(Chi-square distribution) ,并记为 2 ~ 2 (n) 。
2 ( x)
0.20
0.16 0.12 0.08 0.02
n4
n 10
n 20
5
o
10
15
20
25
30
35
x
2 图 3-3 (n) 分布的密度曲线图
第三章 参 数 估 计
【学习目标】

1.理解总体、样本、统计量、点估计、区间估计概念

2.了解2分布、t分布、F分布及其特性、几个常用统
计量的抽样分布、估计量的优良性

3.掌握参数的点估计法,正态总体的均值和方差、二
项分布总体率的区间估计

4.(技能培养)学会用Excel计算2分布、t分布、F分 布的概率和临界值,求正态总体均值的区间估计
x x 1 u ~ N (0,1) n 12

x 1 P{0 x 2} P{2 2} (2) (2) 2(2) 1 0.9545 1/ 2
定理 3-2(中心极限定理 central limit theorem) 若总体 X 的均值和方差2 有限,则当样本容量 n 充分大 (n30)时,不管总体服从什么分布,其样本均值 x 近似服从
2 (n) 分布是不对称的偏态分布, 且随着 n 的增大趋于对称
的正态分布。
2 2 E n D 2n (n) 分布的数学期望与方差: ,
2
2 ( x)
2 2 ~ (n) ,对于给定的,称满足 设
P{ 2 2 (n)}

2 ( n)
F ( x)
1.0
0.8
0.6
(n1 10, n2 100)
(n1 10, n2 10)
0.4 0.2
(n1 3, n2 5)
o
1
2
3
4
x
F 分布的密度函数图是一条高峰偏向左侧的曲线。 对于给定的,称满足
F ( x)
P{F F (n1 , n2 )}
F ( n1 , n2 )
二、统计量
定义 3-2 设 x1 , x2 ,, xn 是来自总体 X 的样本。 如果
f ( x1 , x2 ,, xn ) 是 x1 , x2 ,, xn 的连续函数,而且不含任
何未知参数,则称样本函数 f ( x1 , x2 ,, xn ) 为统计量 (statistics) 。 根据定义,统计量完全依赖于样本 x1 , x2 ,, xn ,不 应含有分布的任何未知参数
案例3-1 (药品有效期)

要检验某药厂生产的一批药品是否符合质量标准,一
般是从这批药品中随机抽取一部分样品进行检验,并根据
样品的检验数据对该批药品的质量指标做出统计推断。

已知某批药品的有效期服从正态分布N(, 2),其中和 2未知。现从该批药品中随机抽取5个样品进行储存试验, 得到有效期分别为(单位:天)
有关概念

统计推断(statistical inference):利用样本数据来估计和
推断总体的统计规律性。统计推断包括抽样分布、参数估
计和假设检验等内容。

参数估计(parameter estimation): 运用样本对总体参数进行
估计。即根据样本信息,构造样本函数即统计量,来估计
总体中的未知参数,从而能够确定总体分布的具体形式或 有关统计规律。
t (n) u
(四)F分布
2 Y ~ (n2 ) ,且 X 与 定义 3-6 设随机变量 X ~ (n1 ) , X n1 F Y 相互独立,则称随机变量 Y n2
2
服从自由度为 (n1 , n2 ) 的 F 分布,记为 F ~ F (n1 , n2 ) 。其中 n1 称为第一自由度,n2 称为第二自由度。

估计量(estimate):用来估计总体未知参数的统计量。
第一节 统计量
一、总体与样本

总体(population):统计所要研究对象的全体。

个体(individual):总体中的每一个单元。
相关主题