当前位置:文档之家› 《抽样技术》第四章-比率估计量

《抽样技术》第四章-比率估计量



N 2 1 f n
s
2 y

Rˆ 2sx2

2 Rˆ s yx
其中syx

1 n 1
n i1

yi

y xi

x

是yi与xi的样本协方
差,它是Syx的无偏估计。

V


1 nX
f
2
S
2 y

R
2
S
2 x

2RS yx
可估计为
s22
nh n
N h Sdh
L
NhSdh
h1
❖ 在实际应用中,常常采用近似公式
nh n
Nh
L
Xh
Nh Xh

h1
nh n
Nh X h
L
NhXh
h1
本的结论。
§4.5 从一个样本估计方差

V YˆR

N 2 1
f


N i1
Yi

RXi 2

n N 1


n yi Rˆxi 2
N
Yi RXi 2
❖ 习惯上取 i1
作为 i1
的样本估
n 1
N 1
计值,它是有偏的。
§4.7 机抽样的大样本中,如
Sx X cv xi 2 Sy Y 2cv yi
则比率估计量YˆR 比用由简单扩充得的估计量 Yˆ Ny 有较小的方差。
§4.8 分层随机抽样中的比率估计量
❖ 一、分别比率估计量 ❖ 二、组合比率估计量 ❖ 三、分别估计量与组合估计量的比较 ❖ 四、采用比率估计量时的最优分配


1 nX
f
2

N
Yi

RX
i
2

i1

N 1


❖ 上述中括号中的式子也可表达为
N
Yi RXi 2
i1
N 1

S
2 y

R
2
S
2 x

2 RS yx

S
2 y

R
2
S
2 x

2RSySx
❖ 作为一条工作规则,如样本容量n≥30,而且大到足
以使 cv x 0.1, cv y 0.1 ,则就可应用上述大样
的1−α置信区间分别为:
Y : YˆR u 2s YˆR
Y : yR u 2s yR
R : Rˆ u 2s Rˆ
❖ 小样本情形下需假定 x, y 近似服从二元正态分布。
例4.1
❖ 交通运输统计中有三个重要的指标,即运量、周转 量与平均运距,其中平均运距是总周转量除以运量 所得的商。为估计公路载货汽车的平均运距,在总 体中用简单随机抽样抽取32辆货车,记录每辆车在 一个月内的运量 xi(单位吨)与周转量yi (单位吨公里) ,如下表所示,试估计平均运距R并给出它90%的 置信区间。
一、分别比率估计量
YˆRs

L h1
yh xh
Xh

L h1
yh xh
Xh
其中yh, xh是第h层样本的总值,Xh是第h层Xhi的总值

❖ 定理4 设在每层抽取一个独立的简单随机样本,而 且各层的样本容量都是大的,则
V YˆRs

L
N
2 h
1 fh
h1
二、组合比率估计量
L
L
Yˆst Nh yh , Xˆ st Nhxh
h1
h1
❖ 组合比率估计量
YˆRc

Yˆst Xˆ st
X

yst xst
X

Rˆc X
其中yst Yˆst N , xst Xˆ st N是从一个分层样本求得 总体均值的估计值。
❖ 定理5 若总的样本容量n是大的,则


1 nx
f
2
s
2 y

Rˆ 2sx2

2 Rˆ s yx
当 X 已知时,也可估计为
s12

1 f nX 2
s
2 y

Rˆ 2sx2

2 Rˆ s yx
§4.6 置信区间
❖ 当n很大时,即n 30, cv x 0.1, cv y 0.1,Y , Y , R
V YˆRc
L Nh2 1 fh
h1
nh
S
2 yh

R
2S
2 xh

2RhS yhSxh
其估计量为
s2 YˆRc

L
N
2 h
1 fh
h1
nh
s
2 yh

Rˆc2sx2h

2 Rˆc s yxh
三、分别估计量与组合估计量的比较
❖ 1.偏差的比较 分别估计量的偏差相对较大,组合估计量的偏差相 对较小。
❖ 2.方差的比较 分别估计量的方差相对较小,组合估计量的方差相 对较大。
❖ 3.所需样本容量的大小 分别估计量的方差公式只有当各层nh都足够大时, 才能使用。组合估计量的方差公式只需总的n足够大 即可使用。
❖ 若各层Rh大致相同,则建议采用组合估计量,否则 建议采用分别估计量。
❖ 若每一层都有一个大样本(或小样本),则建议采 用分别估计量(或组合估计量)。
§4.2 比率的估计
❖ 在住户调查中,要估计每个成年女子化妆品的平均 费用。令
Xi——第i个家庭的成年女子数 Yi——第i个家庭成年女子化妆品的总费用 i=1,2,⋯,N
每个成年女子化妆品的平均费用为
N
总的费用 R 总的成年女子数
Yi
i1 N
Xi

Y X
Y X
i1
则相应的样本估计量是
❖ 作为一条工作规则,若 B 0.1 (即 B 0.1),
则偏差的影响是可以略而不计的。
二、使用有偏估计量的两种原因
❖ ⑴ 在一些最平常的问题中,特别是在比率的 估计中,比较方便而又合适的估计量都是有 偏的;
❖ ⑵即使就概率抽样中的那些无偏估计量来说 ,计量的误差和无回答也会使我们从数据中 计算得的数值产生偏差。
§4.1 偏差和它的影响
❖ 一、有偏估计 ❖ 二、使用有偏估计量的两种原因
一、有偏估计
❖ 设 ˆ是θ的有偏估计,即E ˆ m ,B m , 称为ˆ 的偏差。记V ˆ 2 ,则 MSE ˆ V ˆ B2 2 B2



比率估计量 YˆR

y x
X,
yR

y x
X,


y x
是一致估
计。
❖ ⑵ YˆR , yR , Rˆ是有偏估计;当n很大时,它们是近似无 偏的。
❖ ⑶ 当n很大时,Rˆ y : N , 。
x
❖ 定理2 总体总值Y,总体均值 Y,以及总体比率
R=Y/X的比率估计量分别是
YˆR

《抽样技术》第四章
王学民 编
第四章 比率估计量
❖ §4.1 偏差和它的影响 ❖ §4.2 比率的估计 ❖ §4.3 比率估计量 ❖ §4.4 比率估计量的近似方差 ❖ §4.5 从一个样本估计方差 ❖ §4.6 置信区间 ❖ §4.7 比率估计量与单元均值的比较 ❖ §4.8 分层随机抽样中的比率估计量

V


1 nX
f
2
Yi RXi 2
i1
N 1

1 nX
f
2
S
2 y

R
2
S
2 x

2 RS yx

1 nX
f
2
S
2 y

R
2
S
2 x

2RSySx
其中
Syx

1 N 1
N i1
Xi X
Yi Y
称为有限总体的协方差,
Syx
y x
X,
yR

y x
X,
Rˆ y x
对一个容量为n的简单随机样本(n很大)有
V
YˆR

N 2 1
f


N i1
Yi

RX i 2

n N 1


V

yR


1
n
f

N
Yi

RX
i
2

i1

N 1


V
SxSy
N
Xi X Yi Y
i1
N

Xi

X
2
N
Yi

Y
2
i1
i1
称为有限总体的相关系数。

1
N 1
N i1
Yi

RX i
2

1 N 1
N i1
Yi
Y

R Xi

X
2

1 N 1
N i1
Yi
Y
2

R2 Xi
四、采用比率估计量时的最优分配
V
相关主题