当前位置：文档之家› 统计学第四章参数估计

统计学第四章参数估计

1.用于估计总体某一参数的随机变量 – 如样本均值，样本比例、样本中位数等 – 例如: 样本均值就是总体均值的一个估计量
– 如果样本均值 x = 3 ，则 3 就是对
总体均值的估计值
2、理论基础是抽样分布
二、判断估计量优良性原则
无偏性：估计量的数学期望等于被估计的总体参数
P( X )
无偏
有偏
A
=0.15mm，试建立该种零件平均长度的置信区间，给定置信水平为0.95。
解：已知Ｘ~N(，0.152)，x＝21.4, n=9, 1- = 0.95
Ｚ/2=1.96
总体均值的置信区间为：
x
Z
2
n
,
x
Z
2
n
21.4 1.96 0.15 ,21.4 1.96 0.15
9
9
21.302,21.498
2
2
如: P z 1 0.6826
P z 2 0.9545
1
2
2
z 0
z
2
2
在标准正态分布下，z 与1一一对应.
2
而在抽样分布N (
,
2 x
)下，由于x与的距离
是对
称的
，若x
为
中心,
距
离为
：z
2
x
,
则
:
z 2
ax
x
a
x
z 2
x
z 2
bx
x
b
x
z 2
x
2 x
1
2
2
x a
x
z
2
x
b
x
z
2
第四章参数估计
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
第一节：参数估计的一般问题第二节：一个总体参数的区间估计第三节：两个总体参数的区间估计第四节：样本容量的选择
第一节参数估计的一般问题
一、估计量与估计值
二、判断估计量的优良性原则
三、估计方法
一、估计量与估计值
但实际估计时，情况恰好相反。 x 是已知
的，而是未知的，也正是我们想要估
计的。由于 x 与的距离是对称的，
如果某个 x 落在的1.65倍标准差的
范围之内，那么反过来，也落在以 x
为中心、两侧1.65倍标准差的范围之内，这意味着，有90%的样本均值所构造的1.65倍标
准差的区间会包括。
n 1
: x
Z
2
n
Z
2
n
N n N 1
Z
2
n
（一）正态总体、方差已知（大、小样本）
总体均值在1- 置信水平下的
置
信区间为：
x Z 2
n
, x Z 2
n
例题1:
某种零件长度服从正态分布，从该批产品中随机抽取９件，测得其平均长
度为 21.4 mm 。已知总体标准差
“总体平均数可能落入样本平均数上、下多大范围内？”
“这个估计值的可靠程度是多少？”
解析过程:
(1)确定抽样分布
(2)抽样平均误差 x
n
(3)若用250克这个估计值估计总体平均数，其平
均误差 x 为0.8487。
(4)总体平均数在250±0.8487克之间的可信度为 68.26%。
总体平均数在250±2×0.8487克之间的可信度为 95.45%。
1.51
要求: (1)计算这一比值95%的置信区间; (2)得出上述结论时作了什么假设; (3)能否以95%的置信水平说明新酵
素的产出率提高了。
已知: x x 1.268, s 0.228 n
1 95%
1求 :
解 :由1 95%知Z 1.96
2
: x Z
2
S n
1.268
点估计
区间估计
估计方法——点估计
1、从总体中抽取一个样本，根据该样本的统计量对总体的未知参数作出一个数值点的估计例如: 用样本均值作为总体未知均值的估计值就是一个点估计
2、点估计没有给出估计值接近总体未知参数程度的信息,很难控制误差
3、点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等
置信度、显著性水平置信区间、置信限
置信度
1、置信度（置信系数）：总体未知参数落在所估计区间内的可信度(可靠度）
2 、置信度用1-α表示。置信度越大，估计区间内所包含总体参数的可信度越高。(α称为显著性水平：与总体参数存在显著差异的比例)
3 、常用的置信度有 99%, 95%, 90% 95.45%， 99.73%（事先给定的）
x
1
68.26% 80% 90% 95% 95.45% 99% 99.73%
Z
2
1 1.28 1.645 1.96 2 2.58
3
总体均值的置信区间
(大样本的估计方法) 1. 假定条件
– 总体服从正态分布,且总体方差（２）已知
– 如果不是正态分布，但为大样本 (n ≥ 30)
2. 使用正态分布统计量Ｚ
Z x ~ N (0,1) n
3. 总体均值在1- 置信水平下的置信区间
即当已知样本均值： x
对于给定的置信度1 就有 : 总体均值的置信区间为:
: x Z
2
n
x Z
2
n
, x Z
2
n
其中抽样极限误差为： Z
2
n
n 5% N n 5% N
: x
Z
2
n
N N
C
X
有效性：一个方差较小的无偏估计量称为一个更有效的估计量。如:与其他估计量相比，样本均值是一个更有效的估计量
P(X ) 均值的抽样分布
B
A
中位数的抽样分布
X
一致性：随着样本容量的增大，估计量越来越接近被估计的总体参数
较大的样本容量
P(X )
B
A
较小的样本容量
X
三、参数估计的方法
估计方法
理论基础：抽样分布
置信度的图示
均值的抽样分布:
x
x
-1.65 x
+1.65x
90%的样本
在电池寿命的例题中，若样本的平均使用寿命为198 ，标准差为30，以0.9的置信度建立总体均值的置信区间会如何？
置信度的图示
均值的抽样分布:
x s n 30 25 6
-1.65 x
+1.65x
置信区间与置信限
置信区间: 与一个“置信度”相联系的估
计值的取值范围。用 x 表示 x
置信限：与置信区间相联系的界限，包括上限和下限。
思考: 置信区间与置信度的关系? 置信度与估计的精度的关系？
第二节一个总体参数的估计
置信区间
均值
比例
大样本
小样本大大样样本本
方差
【引例】
某食品进出口公司向东南亚出口一批花生制品，管理人员从中抽取50包作为样本，计算其平均数为250克。另外，合同规定总体标准差为6克。分析: “这个估计量的平均误差是多少？”
2
S n
N N
n 1
分析：
大样本情形下，当方差未知时，用样本标准差代替总体标准差
例题5：
某药厂在生产过程中改换了一种新的酵素，测定了36批的产出率与理论产出率
的比值： 1.28 1.31 1.48 1.10 0.99 1.25 1.22 1.65 1.40 0.95 1.25 1.32 1.23 1.43 1.24 1.73 1.35 1.31 0.92 1.10 1.05 1.39 1.16 1.19 1.41 0.98 0.82 1.22 0.91 1.26 1.32 1.71 1.29 1.17 1.74
已知: 0.2, n 64 30
x 1.1,1 95%
求 : 1
2
?
1
解 :由1 95%知z 1.96
2
: x
z
2
n
1.1 1.96
0.2 64
1.051,1.149
2 1.051,1.149 1
应该拒收
2、方差未知
重复抽样
: x
Z
2
S n
不重复抽样 : x Z
2
n
不重复抽样
:
x
Z
2
n
N N
n 1
例题3：
某大学从该校学生中随机抽取 100 人，调查到他们平均每天参加体育锻炼的时间为26分钟。试以95％的置信水平估计该大学全体学生平均每天参加体育锻炼的时间（已知总体方差为 36）。
解：已知 x＝26, =6，n=100, 1- = 0.95，
信区间。
已知: N 1000, n 100 30
x
90%的样本
根据抽样分布理论得：抽样分布为正态分布，x 198
按90%的置信度区间半径应为 1.65 x ,即198 1.65 6
每一个可能样本都可以建立一个90%置信度的半径相同的区间
对置信度的理解
均值的抽样分布:
/2
1-
x
/2
x x
(1 - ) % 区间包含了， % 的区间未包含
置信度是表示多次抽样得到的区间中大概有多少
总体平均数在250±3×0.8487克之间的可信度为
99.73%。总结做区间估计的必要条件
影响区间宽度（半径）的因素
1. 总体数据的离散程度，用来测度
2.
样本容量，影响

e商务文档

统计学第四章参数估计

相关文档推荐：