当前位置:
文档之家› 抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样
抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样
N
X
2
n
N
1
i 1
(Y i R X i )
2
定理 的方差为:
Y 2.7:对于简单随机抽样,n较大时, R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1
推论 2.12:对于简单随机抽样,n较大时, Y y 的方差为:
n N
n N
【例2.1】
设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为个:
1,2
1,3 1,4 1,5
2,3
2,4 2,5
3,4
3,5
4,5
【例2.2】
设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取2个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
i
Y X
Y X
r
n
yi xi
i 1
y x
i 1
i 1
简单估计量
1 Y y n
n
yi
y1 y 2 y n n
i 1
N Y Ny n
n
yi
i 1
a 1 P p n n
n
yi y Y
i 1
ˆ R
【例2.5】
根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
2.4 回归估计量及其性质
属于简单估计量,不属于比率估计量。
引理 的期望为:
2.3:对于简单随机抽样,n较大时, R r
E (R) E r R
(1) 不是无偏的; (2)但在某种条件下,R 是近似无偏的。
R
定理 2.6:对于简单随机抽样,n较大时, 的期望为: E ( y ) X R Y
n n N N
n N
符号
Y 1 N
大写符号表示总体的标志值, 用小写符号表示样本的标志值
样
y 1
总 体
本
Y
i 1
N
i
Y1 Y 2 Y N N
n
n
yi
y1 y 2 y n n
i 1
Y
Y
i 1
N
i
Y1 Y 2 Y N
是总体协方差
S yx
的无偏估计。
2.3 比率估计量及其性质
主要变量 Y 与Y有关的辅助变量 X
辅助变量必须与主要变量高度相关 辅助变量与主要变量之间的相关关系整体上相当 稳定 辅助变量的总体总值或总体均值必须是已知的, 或是容易获得的 辅助变量的信息质量更好,或信息更容易取得即 调查成本更低。 比率估计量一般用来估计主要 变量的总体总值和总体均值
5 4
6 6
7 6
8 15
9 0
10 8
yi
y
1
n
n
yi
50 10
5
s
2
i 1
n 1
1
n
( yi y)
2
172 9
19 . 1111
i 1
ˆ Y y 5
vy 1 f n s
2
1 0 .1 10
1 9 .1 1 1 1 1 .7 2
co v( y , x ) 1 f n
1 N
N
S yx
式中, S
yx
Y 1
i 1
i
Y
X
i
X
为总体协方差。
定理 2.4:简单随机抽样的方差
s
2
y n 1
i 1
1
n
i
y
2
是总体方差
S
2
的无偏估计。
推论 2.7:对于简单随机抽样,
1 f 2 V (Y ) v ( y ) s n
ˆ ) V (r ) 1 1 f (S 2 2 RSS R 2 S 2 ) V (R x x 2 X n ˆ ) 1 f (S 2 2 RSS R 2S 2 ) V ( yR ) V ( XR x x n 2 1 f 2 2 2 V (Y R ) N (S 2 RSS x R S x ) n
Yi Y
2
i 1
定理2.2:对于简单随机抽样,y 的方差
V
y
1 f n
S
2
评价调查成功 与否的重要指标
其中, 1
f
称为有限总体校正系数。(未入样率)
估计量的方差 V y 是衡量估计量精度的 度量。影响估计量方差的因素主要是样本量n, 未入样率 1-f和总体方差 。2 S
在简单随机抽样的条件下,只有通过加大 样本量来提高估计量的精度。
推论 为: 推论 为:
Y 2.4:对于简单随机抽样, N y
的方差
2 1 f 2 V (Y ) N S n
2.5:对于简单随机抽样, P p
的方差
1 f 1 V (P) N P (1 P ) n N 1
比率估计、回归估计需要有足够的样本量才能 保证估计的有效性。
有偏估计:当样本量足够大时,估计的偏倚趋于0。
符号定义
总体均值的比率估计量:
y 1 YR y R X XR x N
总体总值的比率估计量:
y YR N YR N y R X XR x
R
第2章 简单随机抽样(SRS)
2.1定义与符号
抽样总体
样本容量
简单随机抽样也称为纯随机抽样。 从含有 N 个单元的总体中抽取 n 个单元组成 样本,如果抽样是不放回的,则所有可能的样 本有 C 个,若每个样本被抽中的概率相同,都 为 1 C ,这种抽样方法就是简单随机抽样。 称 n N 为抽样比,记为 f 。
N N 1
引理2.2 从总体规模为N的总体中抽取一个样本量为n 的简单随机样本,若对总体中的每个单元 Y i ,引进 a Y a 随机变量 a i(Y i 入样, i 1 ; i 不入样, i 0 ),则
E (ai ) V (ai ) n N n N n N N n N ( N 1) (1 n N ) f (1 f ) N 1 ( i , j 1, 2, ...., N ; i j ) f (1 f ) ( i 1, 2, ...., N ) f ( i 1, 2, ...., N )
cov( a i , a j )
定理 2.1:对于简单随机抽样,作为 的简单估计, y 是无偏的,即 Y
E (Y ) E y Y
Y
始终成立。
推论 为: 推论 为:
E (Y ) E N y N Y Y
Y 2.1:对于简单随机抽样, N y
R R
V ( yR )
1 f n N
1
1
i 1
N
(Yi R X i )
2
设:
S yx SS x
是Y和X的总体相关系数 Y的相对方差(变异系数)
SS x YX
C
2
S Y
2 2
C yx
S yx YX
2 2
Y与X的相对协方差
Cx
2
Sx X
X的相对方差(变异系数)
定义2.1 从总体的N个单元中,一次整批抽取n个单元 ,使任何一个单元被抽中的概率都相等,任何n个不同 单元组成的组合被抽中的概率也都相等,这种抽样称为 简单随机抽样。 定义2.2 从总体的N个单元中,逐个不放回地抽取单元 ,每次抽取到尚未入样的任何一个单元的概率都相等, 直到抽足n个单元为止,这样所得的n个单元组成一个简 单随机样本。 定义2.3 按照从总体的N个单元中抽取n个单元的所有 可能不同的组合构造所有可能的 C 个样本,从 C 个样 本随机抽取1个样本,使每个样本被抽到的概率都等于 1 C , 这种抽样称为简单随机抽样。
2
X x
2 2
1 f n
2 ˆ ˆ2 2 ( s 2 R s xy R s x )
【例2.4】
在20世纪90年代初的一项工资研究中,人们发现IT行 业中,从业者的现薪与起薪之间相关系数 高达0.88, 已知某IT企业474名员工的平均起薪为17016.00/年, 现根据对100个简单随机抽样方式选出的员工现薪的调 查结果,估计该企业员工的现薪平均水平。
的期望
2.2:对于简单随机抽样, P p
的期望
E (P) E p P
2.3:对于简单随机抽样,n较大时, r R
推论 的期望为:
E (R) E r R
对于有限总体的方差定义 :
2
1 N
Y
i 1
N
i
Y
2
S
2
N
1
1
N
是 V ( y ) 的无偏估计。
推论 2.8:
V (Y ) v ( N y ) N
2
(1 f ) n
s
2
是 V (Y ) 的无偏估计。
推论 2.9:对于简单随机抽样,