当前位置:
文档之家› 抽样检验-第五章抽样推断 精品
抽样检验-第五章抽样推断 精品
M Nn
考虑顺序的不重复抽样的样本可能数目:
M PNn (NN!n)!
*
不考虑顺序的重复抽样的可能样本数目:
M
CNn
n 1
(N n 1)! n!(N 1)!
不考虑顺序的不重复抽样的可能样本数目:
客观现象中常 见的
M
CNn
N! n(! N n)!
*
4.参数和统计量 参数:根据总体中各单位的变量值计算的、反映总体 数量特征的特征值。主要有总体均值、成数或比例、方 差。
一个任 意分布 的总体
当样本容量足 够大时(n > 30) ,样本均 值的抽样分布 逐渐趋于正态 分布
x
X*
X 的分布趋于正态分布的过程
*
样本均值的抽样分布与总体分布的关系
总体分布
正态分布
样本均值的抽样分布
正态分布
非正态分布
大样本
小样本
正态分布
非正态分布
*
(二)样本成数(比例)的抽样分布
总体(或样本)中具有某种属性的单位与全部单位总数
将所有可能样本的样本均值根据其取值形成概率分
布,即可得到样本均值的抽样分布,它是推断总体均值 的理论基础。
*
【例】设一个总体,总体单位数N=4。4 个单位某一标 志值的取值分别为x1=1、x2=2、x3=3 、x4=4 。总体的 均值、方差及分布如下:
总体分布
.3
.2
.1 0
1
234
均值和方差
N
n
大数定律已经证明了:样本平均数和样本成数都满 足一致性:
lim p x X 1
nN
lim p p P 1
nN
*
5.3.3 区间估计
1、定义:在点估计的基础上,指出总体参数的上限和 下限,即指出总体参数可能存在的区间范围,并指出总 体参数落在这一区间的置信水平。
P{ˆ ˆ } 1
x
n
' x
1• 1
4n 2 n 2
n
2 2
n
2
80% • 2
1 0.64
2 • 2
1.56n
n 1.56(倍) n
*
5.3 参数估计
5.3.1 抽样推断的内容 5.3.2 点估计 5.3.3 区间估计
*
5.3.1 抽样推断的内容
1、参数估计 依据所获得的样本数据,对总体的数量特征进行估计的推断方 法称为参数估计,即根据样本统计量来估计总体参数。 参数估计包括的内容:如确定估计值,确定估计的优良标准; 确定估计值和被估计参数之间的误差范围以及在一定误差范围内 所作推断的可靠性程度等。 2、假设检验 先对总体的数量特征作某种假设,再根据样本数据对所作假设 进行检验。 假设检验包括的内容:确定原假设与备择假设;选择检验统计 量;确定显著性水平;做出决策。
ˆ 无偏 2
A
有偏
B
ˆ 1
总体参数
E(x) X E( p) P
ˆ
*
有效性:对同一总体参数的两个无偏估计量,有更小 标准差的估计量更有效。
P(ˆ) ˆ的1 抽样分布 B
1 比 2 更有效
A
ˆ2 的抽样分布
ˆ
*
一致性:随着样本容量的增大,估计量的值越来越 接近被估计的总体参数。
lim p 1
*
5.1.2 抽样推断的基本范畴
1.抽样框和抽样单位 (1)总体和样本 总体也称母体,是所要研究的全部单位组成的整体。 一般用N表示总体包括的总体单位数。 样本又称子样,它是从总体中随机抽取出来的一部分 单位组成的整体。一般用n表示样本包括的总体单位数。 作为推断对象的总体是确定的,而且是唯一的;作为 观察对象的样本不是确定的,也不是唯一的。
E(x)
E[
n
xi i1 ]
n
1 n
n i 1
E(xi )
1 .nX n
X
n
V
(x
)
V[
xi
i 1
n
]
1 n2
n i 1
V
(xi )
1 n2
n 2
2
n
x
2
nn
*
P(x) 总体分布
.3 P ( X ) 抽样分布
.3
.2
.2
.1
.1
0 1
23
X= 2.5 σ2 =1.25
x0
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0
之比:
不同性别的人数与全部人数之比
合格品(或不合格品) 与全部产品总数之比
总体比例表示为 P N0 或 1 P N1
N
N
样本比例表示为
p n0 或 1 p n1
n
n
*
样本比例的抽样分布
容量相同的所有可能样本的样本比例的概率分布,当
样本容量很大时,样本比例的抽样分布可用正态分布
近似。
样本比例的数学期望:E( p) P
*
3.样本容量和样本可能数目 样本容量:一个样本所包含的总体单位数,用n表示 ,当样本容量大于等于30时称为大样本,小于30时称为 小样本。 样本可能数目:指按一定抽样方法和一定样本容量 从总体中抽取样本时,所有可能的样本个数,一般用M 表示。
*
样本可能数目的计算
考虑顺序的重复抽样的样本可能数目:
*
(2)抽样框: 抽样框是包括全部总体单位的框架,以此代表总体,用 来从中抽取样本单位,具体表现形式有总体单位(或其集 合)的名单或目录、地图、时间等。 (3)抽样单位: 抽样单位是构成抽样框的基本要素,它可以是总体单位 也可以是总体单位的集合。
*
2.重复抽样和不重复抽样 重复抽样,也叫回置抽样/放回抽样,是指从总体的 N个单位中抽取一个容量为n的样本,每次抽出一个单位 后,再将其放回总体中参加下一次抽取,这样连续抽n次 即得到一个样本 。 不重复抽样,也叫不回置抽样/不放回抽样,是指抽 中单位不再放回总体中,下一个样本单位只能从余下的 抽样单位中抽取。
x
n
x
xf f
xp p
S 2 (xi x )2 (xi x )2 fi
n
fi
*
5.1.3 抽样分布 (sampling distribution)
样本统计量的概率分布; 随机变量是样本统计量:
样本均值, 样本比例,样本方差等
结果来自容量相同的所有可能样本; 提供了样本统计量的分布特征,是进行推断的
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
*
2.样本均值的数字特征
E(x) x 1.0 1.5 ... 4.0 2.5 X
M
16
x 2
(x X )2 M
(1.0 2.5)2 ... (4.0 2.5)2
2
0.625
16
n
*
证明:
x
2
nn
p
(2)不重复抽样条件下
2
n
P(1 P ) n
x
2 Nn
() n N 1
p
P(1 P) N n n N 1
*
在总体单位数很大的情况下,可近似表示为:
x
2 (Nn)
nN
2 (1 n )
nN
p
P(1 P )(1 n )
n
N
*
抽样推断的标准误差
(standard error)
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
*
计算出各样本的均值,并给出样本均值的抽样分布:
16个样本的均值(x)
第一个 观察值
第二个观察值
1
2
3
4
1
1.0 1.5 2.0 2.5
2
1.5 2.0 2.5 3.0
3
2.0 2.5 3.0 3.5
4
2.5 3.0 3.5 4.0
.3 P (x ) .2 .1 0
样本比例的方差
重复抽样:
2 P
P(1 n
P)
不重复抽样:
2 P
P(1 n
P)
N N
n 1
*
棣莫弗-拉普拉斯:X n~b(n, p), 0 p 1,则
lim
n
P
X
n np npq
x
1
2
x t2
e 2 dt.
定理表明,当n充分大时,二项分布可用正态 分布来近似。
*
5.2 抽样误差
*
5.1.1 抽样推断的概念和特点
1、概念
抽样推断是在抽样调查的基础上,根据样本的情况来推断总体特 征的一种统计分析方法。
2、抽样推断的特点
按照随机原则抽取样本单位(样品); 根据对样本的调查对总体做出推断; 抽样误差可以事先计算并加以控制。
3、抽样推断的适用场合
无法进行全面调查时; 进行全面调查有困难或不必要时;
5.2.1 抽样误差 5.2.2 抽样平均误差
*
5.2.1 抽样误差
1、概念 抽样误差是指由于随机抽样的偶然因素使样本单位不足 以代表总体单位,而引起的样本统计量和总体参数之间
的绝对离差。( x X , p P )
2、影响因素 总体单位标志值的离散程度; 样本容量的大小(n); 抽样方法(重复抽样/不重复抽样); 抽样调查的组织方式(简单随机抽样/分层抽样/等距 抽样/整群抽样)。
*
5.2.2 抽样平均误差(标准误)
1、所有可能样本统计量与总体参数的平均离差。 2、理论计算公式为:
(x X )2
x
M
上式可以变换为:
p