当前位置：文档之家› 第5章抽样分布与参数估计

第5章抽样分布与参数估计

频率 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10
（四）放回抽样与不放回抽样
1.放回抽样。放回抽样的具体做法是：从总体中抽出一个样本单位，记录其标志值后，又将其放回总体中继续参加下一轮单位的抽取。放回抽样的特点是：第一，n个单位的样本是由n次试验的结果构成的。第二，每次试验是独立的，即其试验的结果与前次、后次的结果无关。第三，每次试验是在相同条件下进行的，每个单位在多次试验中选中的机会 (概率)是相同的。在放回抽样中，样本可能的个数是Nn，N为总体单位数，n为样本容量。
抽样分布可能是精确地服从某种已知分布（所谓已知分布，例如我们在第四章介绍过的各种常见分布），也可能是以某种已知分布为极限分布。在实际应用中，后者更为多见。
例5-2
对某公司 10 名推销员用放回抽样方式抽取容量为 n=2
的样本（y1，y2），构造统计量 Y
n
( i1
yi
)
/
n
。10
名推
销员任职年限如表 5-2。
P(X )
1.0
1
0.01
1.5
2
0.02
2.0
3
0.03
2.5
4
0.04
3.0
5
0.05
3.5
6
0.06
4.0
7
0.07
4.5
8
0.08
5.0
9
0.09
5.5
10
0.10
6.0
9
0.09
6.5
8
0.08
7.0
7
0.07
7.5
6
0.06
8.0
5
0.05
8.5
4
0.04
9.0
3
0.03
9.5
2
0.02
N 1
N
的修正系数。由于该系数在0，1之间，因此，不放回抽样的标准差比放回抽样小。当N远大于n时，修正系数近似1，修正与否对平均误差几乎没有影响，这时可以不考虑抽样方式差异，都按放回抽样处理。
（二）样本平均数的分布规律
当总体 X 服从正态分布时，根据正态分布的再生定
理，样本平均数服从正态分布，即
被6 抽
6,1 (3.5)
6,2 (4)
6,3 (4.5)
6,4 (5)
6,5 (5.5)
6,6 (6)
6,7 (6.5)
6,8 (7)
6,9 6,10 (7.5) (8)
中7 的人8 员
9
7,1 (4) 8,1 (4.5) 9,1 (5)
7,2 (4.5) 8,2 (5) 9,2 (5.5)
7,3 (5) 8,3 (5.5) 9,3 (6)
表5-3 10人中有放回抽二人的全部可能样本
第二次抽取可能被抽中的人员
1
2
3
4
5
6
7
8
9
10
1
1,1 (1)
1,2 (1.5)
1,3 (2)
1,4 (2.5)
1,5 (3)
1,6 (3.5)
1,7 (4)
1,8 (4.5)
1,9 (5)
1,10 (5.5)
2 第
2,1 (1.5)
2,2 (2)
2,3 (2.5)
解：显然，（1）和（2）的抽取行为都不是随机试验。因而不属于概率抽样。只有（3）的抽取行为是随机试验。总体的分布可用表5-1的分布列来描述，而（3）的随机试验中所观测的随机变量也有与表51有相同的分布。所以，（3）的抽取行为是概率抽样。
表5-1 10个球号码的分布
号码 1 2 3 4 5 6 7 8 9 10
样本是从总体中抽出的部分单位的集合，这个集合的大小称为样本容量，一般用n表示，它表明一个样本中所包含的单位数。
一般地，样本单位数大于30个的样本称为大样本，不超过30个的样本称为小样本。 2.样本个数。样本个数又称样本可能数目，它是指从一个总体中可能抽取多少个样本。
（二）总体参数与样本统计量 1.总体参数
个总体抽取容量为 n 的样本，则当 n 趋于无穷大时，
样本平均数 X 近似服从正态分布，其平均数 E( X ) 仍
为，其标准差为。 X
中心极限定理告诉我们无论总体服从何种分布，只要它的平均数与标准差客观存在，我们就可以通过增大
样本容量 n 的方式，保证样本平均数 X 近似服从正态分布。样本容量 n 越大，样本平均数的分布就越接近正态分布。
10.0
1
0.01
合计
100
1.00
利用表5-4的资料，可以计算出样本平均数的期望值与方差。
E( X ) XP( X ) 5.50 V ( X ) E( X 2 ) [E( X )]2 X 2P( X ) [ XP( X )]2
34.375 (5.5)2 4.125
x V (X ) 4.125 2.0310
4,2 (3)
4,3 (3.5)
4,4 (4)
4,5 (4.5)
4,6 (5)
4,7 (5.5)
பைடு நூலகம்
4,8 (6)
4,9 4,10 (6.5) (7)
可5 能
5,1 (3)
5,2 (3.5)
5,3 (4)
5,4 (4.5)
5,5 (5)
5,6 (5.5)
5,7 (6)
5,8 (6.5)
5,9 (7)
5,10 (7.5)
X
~
N
(
,
2 X
)。
当总体不服从正态分布时，根据中心极限定理，只要
样本容量 n 足够大，样本平均数 X 仍近似地服从正
态分布
N
(
,
2 X
)
。
一般来说，当总体分布接近正态
分布时，所需的样本容量 n 可以较小，反之则需要较
大的样本容量。通常将样本单位数不少于 30 的称为
大样本。
例5-4
160件电子元器件重量的均值为5.02克，标准差为 0.30克，从中采用不放回方式随机抽取64件，试求：（1）样本平均数的期望值与方差；（2）总重量在 4.96克与5.00克之间的概率。
等的。如果考虑顺序，其样本可能个数为 N! ； (N n)!
如果不考虑顺序，其样本可能个数为 N! 。 (N n)!n!
（五）抽样分布
从总体中可以随机地抽取许多样本，由每一个样本都可以计算样本统计量的观测值，所有可能的样本观测值及其所对应的概率便是所谓的抽样分布。因此，抽样分布也可以称为样本统计量的概率分布。
E(Xn)
2 x
D(
X1
X2
n
Xn
)
1 n2
D( X1 )
D( X 2 )
D(
X
n
)
2
n
x
n
例5-3
计算例5-2中10名推销员平均的任职年限及其标准差，并与例5-2求得的样本平均数的期望值与方差作比较。
解： = (1+2+3+4+5+6+7+8+9+10)/10=5.5
(1 5.5)2 (2 5.5)2 (10 5.5)2 /10 2.87228
解：
（1）E( X ) 5.02克
x
2
n
N N
n 1
0.3 64
（160-64) 0.02914克 (160-1)
（2）该问题可化为求样本平均数的观测值在4.96 克——5.0克之间的概率。因为 X ~ N(5.02,0.32) ,所以，可先将其进行标准变换，并利用上一章介绍的标准正态分布求解概率。即有：
二、大数定理与中心极限定理
（一）大数定理独立同分布的随机变量 X1，X2，…,Xn，…，并且有
数学期望 EXi 及方差 V Xi 2 ，
(i=1,2,…)。则对任意的正数 ε，有：
lim
n
p
1 n
n
Xi
i 1
1
大数定理表明：尽管个别现象受偶然因素影响，有
各自不同的表现。但是，对总体的大量观察后进行
从正态分布的再生定理可以看出，只要总体变量服从正态分布，则从中抽取的样本，不管n是多少，样本平均数都服从正态分布。但是在客观实际中，总体并非都是正态分布。对于从非正态分布的总体中抽取的样本平均数的分布问题，需要由中心极限定理来解决。
（三）中心极限定理
1. 样本平均数的中心极限定理如果变量 X 的分布具有期望值和标准差，从这
2. 样本比例的中心极限定理
从任一总体比例为、方差为 (1 ) 的（0，1）分布总体中，抽取容量为 n 的样本，其样本比例 P
的分布会随着 n 的增大而趋近于平均数为，标
准差为 p 的正态分布。
第二节抽样分布
一样本平均数的抽样分布二样本比率的抽样分布
一、样本平均数的抽样分布
2.不放回抽样。每次从总体抽取一个单位，记录其标志值后不放回原总体，不参加下一轮抽样。下一次继续从总体中余下的单位中抽取。特点是：第一，n 个单位的样本由 n 次试验结果构成，但由于每次抽出不放回，所以实质上相当于从总体中同时抽取 n 个样本单位。第二，每次试验结果不是独立的，上次中选情况影响下次抽选结果。第三，每个单位在多次(轮)试验中中选的机会是不
（一）样本平均数的期望值与方差在放回抽样的情形下，设从总体中抽出的样本为
x1 , x2 ,, xn ，其是相互独立的，并且与总体服从
同一分布。设总体均值为，方差为 2 ，则可推
导出样本平均数的期望值与方差、标准差分别为：

e商务文档

第5章抽样分布与参数估计

相关文档推荐：

e商务文档

第5章 抽样分布与参数估计

相关文档推荐：

第5章抽样分布与参数估计