当前位置：文档之家› 第5章抽样分布与参数估计

第5章抽样分布与参数估计

(1 5.5) 2 (2 5.5) 2 (10 5.5) 2 /10 2.87228
E(X) 5.5
x

n
2.87228 / 2 2.0310
5-22
【例】160 件电子元器件重量的均值为 5.02 克，标准差为 0.30 克，从中采用不放回方式随机抽取 64 件，试求：（1）样本平均数的期望值与方差；（2）总重量在 4.96 克与 5.00 克之间的概率。解：（1） E(X) 5.02克；
18 16 14 12 10 8 6 4 2 0 50-60 70-80
35% 30% 25% 20%
`
15% 10% 5% 0% 90-100
统计学
毛春元主讲
第五章抽样分布与参数估计

第一节抽样的基本概念与数学原理

第二节抽样分布
第三节参数估计
第四节样本容量的确定
第五节 EXCEL在参数估计中的应用
5-20
中心极限定理

正态分布的再生定理：相互独立的两个正态随机变量相加之和仍服从正态分布。中心极限定理：
2 X ~ N , n

大样本的平均数近似服从正态分布。
5-21
【例】计算例 5-2 中 10 名推销员平均的任职年限及其标准差，并与例 5-2 求得的样本平均数的期望值与方差作比较。解： (1 2+3+4+5+6+7+8+9+10)/10=5.5
N1 p x N
n1 P n
E ( P) p

P也是一个随机变量，利用样本平均数的分布性质结论，即有：
p 1 p p 1 p P n n n
5-17
不放回抽样分布

样本均值的分布性质：
E( X )
(X ) X

2 N n
X
n
E ( X ) X Xf 42(元) f
( X X )2 f 16(元2 ) (X ) f
2
5-15
放回抽样分布--样本平均数的分布

由概率论知，如果总体是正态分布的，则样本平均数的抽样分布是如下正态分布
N ( ,

2
n
)
这是一个非常重要的结论，有广泛的应用。（请参见中心极限定理。）
样本平均数 X 34 36 38 40 42 36 38 40 42 44 38 40 42 44 46
样本 46,34 46,38 46,42 46,46 46,50 50,34 50,38 50,42 50,46 50,50
样本平均数 X 40 42 44 46 48 42 44 46 48 50
5-14
放回抽样分布--样本平均数的分布
样本平均数 X 34 36 38 40 42 44 46 48 50 合计频数 1 2 3 4 5 4 3 2 1 25

验证了以下两个结论：
E( X )
2 2( X )
n

抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差，称为抽样平均误差，用表示。 X

放回抽样分布--样本平均数的分布

某班组5个工人的日工资为34、38、42、46、 50元。 = 42 2 = 32 现用放回抽样的方法从 5人中随机抽2个构成样本。共有52=25个样本。如右图。
样本 34,34 34,38 34,42 34,46 34,50 38,34 38,38 38,42 38,46 38,50 42,34 42,38 42,42 42,46 42,50
n N 1
样本成数的分布性质
E ( P) p
P
p 1 p N n n N 1
5-18
抽样分布总结
样本平均数的分布样本成数的分布
放回抽样
E( X )
X )
n
E ( P) p
p 1 p P n

(5.19)
式中被 1 和 2 框定的区间叫做置信区间。 i = 叫做抽
样极限误差，它可以反映抽样估计误差的最大范围。
5-28
X p P 2 s 2
X X
n 1
2
5-29

（三）估计量的优良标准
ˆ 1．无偏性。的数学期望值等于θ 。即有： E (5.17)
2. 有效性。又称最小方差性。
5-30
3. 一致性，一致性是指随着样本容量不断增大，样本统计量接近总体参数的可能性就越来越大，或者，对于任意给定的偏差控制水平，两者间偏差高于此控制水平的可能性越来越小，接近于 0。用公式表示就是：
5-6
总体
样本

参数

统计量平均数标准差、方差
X
、2
P
N
S、 S2
成数
单位数
P
n
( x x )2 s2 n 1 ( x x )2 f s2 f 1
5-7

（三）概率抽样及其组织形式所谓概率抽样，就是要求对总体的每一次观察（每一次抽取）都是一次随机试验，并且有和总体相同的分布。按这样的要求对总体观测（抽取）n次，可得到容量为n的样本。
Nn 。样本可能的个数是
5-11
2.不放回抽样。特点：第一，n 个单位的样本由 n 次试验结果构成。第二，每次试验结果不是独立的，上次中选情况影响下次抽选结果。第三，每个单位在多次(轮)试验中中选的机会是不等的。 N! 如果考虑顺序，其样本可能个数为； ( N n)! 如果不考虑顺序，其样本可能个数为
320 80% 400
(1 ) N n p
n N 1
P (1 P ) n 1 N N
80% 20% 400 1 1.932 400 6000
5-25
第三节参数估计
一、参数估计概述二、总体均值的估计三、总体比例的估计四、总体方差的估计
x
N n
2
0.3 （ 160-64) 0.02914克 = n N 1 64 (160-1)
5-23
（2）该问题可化为求样本平均数的观测值在 4.96 克 -5.0 克之间的概率。因为 X ~ N (5.02, 0.3 ) ,所以，可先将其进行标准变换，并利用上一章介绍的标准正态分布求解概率。即有：
N! 。 ( N n)! n!
5-12
二、抽样分布

抽样分布的概念：由样本统计量的全部可能取值和与之相应的概率（频率）组成的分配数列。（主要求出样本平均数的期望与方差）包括以下内容

放回抽样分布

样本平均数的分布样本成数的分布样本平均数的分布样本成数的分布
5-13

不放回抽样分布
5-2
第一节抽样的基本概念与数学原理

一、有关抽样的基本概念二、大数定理与中心极限定理
5-3
一、有关抽样的基本概念

（一）样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分单位的集合，这个集合的大小称为样本容量，一般用n表示，它表明一个样本中所包含的单位数。一般地，样本单位数大于30个的样本称为大样本，不超过30个的样本称为小样本。 2.样本个数。样本个数又称样本可能数目，它是指从一个总体中可能抽取多少个样本。
5-27

（二）点估计点估计，主要有矩估计法和最大似然估计法。矩估计法是用样本矩去估计总体矩（或是用样本矩的函数去估计总体矩的相应函数）的一种估计方法，由此获得的估计量称作矩估计量；最大似然估计法是把待估计的总体参数看作一个可以取不同数值的变量，计算当总体参数取上述不同数值的时候，发生我们当前所得到的样本观测值的不同概率，总体参数取哪一个数值的时候这种概率最大，便把这个数值作为对总体参数的估计结果。
5-8
【例 5-1】有 10 个同样的球，分别标有从 1 至 10 的号码。（1）从中有目的地抽出 5 号球；（2）从中随便地取一个球；（3）把 10 个球放在袋中，充分混匀，从中抽出一个球，抽取时，要求袋中各个球有相等的被抽中的概率。上述抽样方式是否属于概率抽样？
5-9
显然，（1）和（2）的抽取行为都不是随机试验。因而不属于概率抽样。只有（3）的抽取行为是随机试验。总体的分布可用表 5-1 的分布列来描述，而（3）的随机试验中所观测的随机变量也有与表 5-1 有相同的分布。所以，（3）的抽取行为是概率抽样。
当样本容量n 充分大时，可以用样本平均估计总体平均。
m lim p p 1 n n
当试验次数n充分大时，可以用频率代替概率。
大数定理的意义：个别现象受偶然因素影响，但是，对总体的大量观察后进行平均，就能使偶然因素的影响相互抵消，从而使总体平均数稳定下来，反映出事物变化的一般规律，这就是大数定理的意义。
5-16
放回抽样分布--样本成数的分布

总体成数p是指具有某种特征的单位在总体中的比重。成数是一个特殊平均数，设总体单位总数目是N，总体中有该特征的单位数是N1。设x是0、 1变量（总体单位有该特征，则x取1，否则取0），则有：

现从总体中抽出n个单位，如果其中有相应特征的单位数是n1，则样本成数是：
E( X )

e商务文档

第5章抽样分布与参数估计

相关文档推荐：

e商务文档

第5章 抽样分布与参数估计

相关文档推荐：

第5章抽样分布与参数估计