当前位置:
文档之家› 抽样推断中比例估计的几种方法及比较
抽样推断中比例估计的几种方法及比较
t n-t
已有:
P
(T=k|S)
=
CkCN-k
N+t-n
Σ t n-t CkCN-k
k=t
k=t, t+1, …, N+t-n。
Σ Σ Σ Σ 与第二种情况类似, P T=
N+1 n
t
|S
取到最大
值。
Σ Σ 得: T^4=
N+1 t n
Σ Σ 相应的P^4=
N+1 n
t
/N≈
t n
=p。
3.5 基于模型、 频率学派、 矩估计
服从一定的概率分布。
在只知道总体单元数为N, 没有其他信息的情
况下, T的先验分布为离散均匀分布:
P
(T=k)
=
1 N+1
,
k=0,
1,
2,
…,
N。
这等价于的先验分布也为离散均匀分布:
≈ ≈ P
P=
k N
=
1 N+1
,
k=0,
1,
2,
…,
N。
注: 这不同于 [0, 1] 之间的连续均匀分布。
事件S为 “样本中具有该特征的个数为t”
可见: 基于设计的理念认为总体取值是确定的, 立足于抽样设计, 考察在一定的抽样设计下, 如何 用随机样本去推断确定总体; 基于模型的理念认为 总体取值是随机的, 立足于总体之上 “超总体” 的 模型假定, 考察在一定的模型假定下, 如何用得到 的量去推断未得的量以及未知的参数。
值得注意的是, 两种理念下, 估计量本身的内 涵就不一样, 对估计量期望或方差的解释也不一样。
。
根据全概率公式, 还有:
乙b t t
n-t
P (a≤θ≤b, S) = a Cnθ (1-θ) dθ。
所以, 条件概率:
P
(a≤θ≤b|S)
=
(a≤θ≤b, P (S)
S)
btt
n-t
乙 乙 =
a Cnθ (1-θ)
1tt
dθ
n-t
=
(n+1)
t
Cn
bt
n-t
θ (1-θ) dθ
a
乙0Cnθ (1-θ) dθ
所以, θ 的后验分布密度为:
tt
n-t
f (θ|S) = (n+1) Cnθ (1-θ) 。
根据后验分布进行推断, 以该后验分布的期望
在不放回简单随机抽样下, 采用的简单模型是:
≈1 具有该特征
Yi= 0 不具有
, i=1,2,…,N,
抽样推断中比例估计的几种方法及比较
N
Σ 则 T= Yi; P=T/N i=1
并且, Yi 看作随机变量, 独立同分布, 服从两 点分布:
P (Yi=1) =θ; P (Yi=0) =1-θ。 并有: T 服从二项分布 T~B (N-θ)
作者简介: 艾小青 (1982 年生), 湖南人, 北京工业大学经管学院讲师, 研究方向: 应用统计。
1 引言 在简单随机抽样下, 如何利用样本去估计总体 比例, 本文通过这个简单的问题, 揭示了两大抽样 理念 “基于设计和基于模型”, 两大统计学派 “频率 学派和贝叶斯学派” 和两种主要估计方法 “矩估计 和极大似然估计” 在抽样推断中的应用及特点。 比例相当于目标变量取值为 0 或 1 的均值, 总 体单元数为 N, 总体中具有某特征的个数为 T, 比 例为 P=T/N。 在样本量为的不放回简单随机抽样下, 设样本中具有该特征的个数为 t, 样本比例为 p=t/n。 如何估计总体比例 P 呢, 这个问题看似简单, 却能 带来有益的思考和丰富的信息。 2 相关概念 2.1 抽样中的两种理念 抽样中有两种理念: 基于设计和基于模型。 基于设计: 传统上把总体取值视为固定的, 样 本是随机的, 其随机性是由抽样导致, 并用随机样
本去推断确定总体。 基于模型: 存在一个超总体 (模型), 总体只是
超总体的一个实现 (模型生成), 可见总体取值即是 随机的, 抽样也是随机的, 样本具有双重随机性。 在一定的模型假设下, 揭示样本单元与非样本单元 的联系, 再通过样本数据估计 (也可以说是预测) 非样本数据, 进而得到基于模型下的估计。
可见: PT (t) 随着T的增大先增后减, 在
≤ ≤ T=
N+1 n
t
时达到最大值。
≤ ≤ 得: T^2=
N+1 n
t
,
≤ ≤ 相应的P^2=
N+1 n
t
/N≈
t n
=p。
3.3 基于设计、 贝叶斯学派、 矩估计
总体中具有某特征的个数T有确定的唯一的值,
但却是未知的。 对于参数T, 在我们的主观判断中,
贝叶斯学派: 样本视为固定而参数视为随机,
着眼点在参数空间, 针对参数的分布, 并且遵循的
模式为参数的先验分布 (主观意义) 通过样本信息
加入而改进得参数的后验分布。
两种学派建立在各自的逻辑体系上, 其优劣难
以比较, 取决于具体应用的情况。
2.3 估计中的两种主要方法
估计有两种主要方法: 矩估计和极大似然估计。
t n-t
T=k下,
事件S的概率为P
(S|T=k)
=
CkCN-k
n
,
CN
- 30 -
根据全概率公式, 事件S的概率为:
N
P (S) =ΣP (T=k) P (S|T=k) k=0
N+t-n
Σ =
1
k = t N+1
t n-t
CkCN-k
n
=
N+t-n
Σ 1 n
t n-t
CkCN-k 。
CN N+1CN k = t
的估计也可作为 P 的估计。
抽取样本 S, 得到样本数据, 即得到 i∈S 中随
机变量 Yi 的值, 但得不到 i埸S 中随机变量 Yi 的值。i,
i=1
i∈S
i埸S
Σ Σ 其中 Yi 已知。 Yi 待估计。
i∈S
i埸S
从样本 S 中得到参数 θ 的最小二乘估计是
Σ p=y= Yi/n。 i埸S 中随机变量 Yi 的期望都为 θ, 则 i∈S
得:
P^ 6=
t n
=p,
相 应 的T^ 6=Np。
3.7 基于模型、 贝叶斯学派、 矩估计
模型为: Yi 独立同分布:
P (Yi=1) =θ; P (Yi=0) =1-θ。 在没有其他信息的情况下, 模型参数 θ 的先验
分布为 [0, 1] 之间的连续均匀分布:
θ~R (0, 1), 即 θ 的先验分布概率密度为 1。
T的后验分布为:
P
(T=k|S)
=P
(T=k) P
P (S|T=k) (S)
t n-t
=
CkCN-k
N+t-n
,
Σ t n-t CkCN-k
k=t
k=t, t+1, …, N+t-n
根据后验分布进行推断, 以该后验分布的期望
作为T的估计:
N+t-n
Σ Σ E (T|S) =
t n-t
kCkCN-k
T*P
PT (t) 达到最大值。
PT (t) PT-1 (t)
t n-t
t
n-t
=
CTCN-T
n
/
CT-1
CN-
n
(T-1)
CN
CN
=
T (N-T+1-n+t) (T-t) (N-T+1)
,
PT (t) ≥PT-1 (t) 的充要条件是:
T (N-T+1-n+t) ≥(T-t) (N-T+1)
解得: T≤ N+1 t。 n
矩估计的理论根据是大数定律, 也联系了最小
二乘法的思想, 用各阶样本矩估计相应的总体矩
(或参数)。
极大似然估计的思想简单而深刻: 产生结果
(样本特征) 的原因 (参数) 可能有多个, 找出最有
可能的原因, 该参数下, 出现该样本特征的概率最
大。
极大似然估计一般优于矩估计, 其渐进方差最
小, 但在非参数领域极大似然估计基本不适用。
, i=1,2,…,N。
Ii 为随机变量 , 在 不 放 回 简 单 随 机 抽 样 下 , 有
ΣΣ ΣΣ N
N
E
(Ii)
=
n N
,
所以:
E
(y)
=E
IiYi/n
i=1
= E (Ii)
i=1
N
Σ Yi/n=
n N
i
=
1
Yi/n=Y。
即: E (p) =P。
得: P^ 1=p, 也有 T^ 1=Np。
Σ i埸S 中 Yi 的最优线性无偏估计都为 y= Yii/n=t/n=p。 i∈S
Σ Σ Σ 所以:
T^ = Yi+
i∈S
(N-n)
i
∈
S
Yi/n=
N n
i
∈
S
Yi=Np。
并且: E (T-T) =0。 得: T^ 5=Np, 相应的 P^ 5=p。
3.6 基于模型、 频率学派, 极大似然估计
样本中有特定的 t 个单元具备某特征, 有特定
的 n-t 个单元不具备。
这是已经观测到的事件 S。
并有: P (S) =θt (1-θ) n-t。
把 P ( S) 看 作 关 于 θ 的 函 数 , 坠P ( S) /坠θ =0
时, P (S) =max。
解得:
θ=
t n
。
- 31 -
抽样推断中比例估计的几种方法及比较