当前位置：文档之家› 抽样调查理论与方法金勇进(第二版)-第2章-简单随机抽样

抽样调查理论与方法金勇进(第二版)-第2章-简单随机抽样

N
X
2
n
N
1
i 1
(Y i R X i )
2
定理的方差为：

Y 2.7：对于简单随机抽样，n较大时， R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1

推论 2.12：对于简单随机抽样，n较大时， Y y 的方差为：
n N
n N
【例2.1】

设总体有5个单元（1、2、3、4、5），按不放回简单随机抽样的方式抽取2个单元，则所有可能的样本为个：
1，2
1，3 1，4 1，5
2，3
2，4 2，5
3，4
3，5
4，5
【例2.2】

设总体有5个单元（1、2、3、4、5），按放回简单随机抽样的方式抽取2个单元，则所有可能的样本为25个（考虑样本单元的顺序）：
i
Y X

Y X
r

n
yi xi
i 1
y x
i 1

i 1
简单估计量
1 Y y n

n
yi
y1 y 2 y n n
i 1
N Y Ny n

n
yi
i 1
a 1 P p n n

n
yi y Y
i 1
ˆ R

【例2.5】

根据例【2.4】的数据和结果，比较两种思路下对应的方差估计结果。
2.4 回归估计量及其性质
属于简单估计量，不属于比率估计量。

引理的期望为：
2.3：对于简单随机抽样，n较大时， R r
E (R) E r R
（1）不是无偏的；（2）但在某种条件下，R 是近似无偏的。
R
定理 2.6：对于简单随机抽样，n较大时，的期望为： E ( y ) X R Y
n n N N
n N
符号
Y 1 N

大写符号表示总体的标志值，用小写符号表示样本的标志值
样
y 1
总体
本
Y
i 1
N
i

Y1 Y 2 Y N N
n
n
yi
y1 y 2 y n n
i 1
Y
Y
i 1
N
i
Y1 Y 2 Y N
是总体协方差
S yx
的无偏估计。
2.3 比率估计量及其性质

主要变量 Y 与Y有关的辅助变量 X

辅助变量必须与主要变量高度相关辅助变量与主要变量之间的相关关系整体上相当稳定辅助变量的总体总值或总体均值必须是已知的，或是容易获得的辅助变量的信息质量更好，或信息更容易取得即调查成本更低。比率估计量一般用来估计主要变量的总体总值和总体均值
5 4
6 6
7 6
8 15
9 0
10 8
yi
y
1
n
n
yi
50 10
5
s
2

i 1
n 1
1
n
( yi y)
2

172 9
19 . 1111
i 1
ˆ Y y 5
vy 1 f n s
2
1 0 .1 10
1 9 .1 1 1 1 1 .7 2
co v( y , x ) 1 f n
1 N
N
S yx
式中， S
yx

Y 1
i 1
i
Y
X
i
X
为总体协方差。

定理 2.4：简单随机抽样的方差
s
2
y n 1
i 1
1
n
i
y
2
是总体方差
S
2
的无偏估计。

推论 2.7：对于简单随机抽样，
1 f 2 V (Y ) v ( y ) s n
ˆ ) V (r ) 1 1 f (S 2 2 RSS R 2 S 2 ) V (R x x 2 X n ˆ ) 1 f (S 2 2 RSS R 2S 2 ) V ( yR ) V ( XR x x n 2 1 f 2 2 2 V (Y R ) N (S 2 RSS x R S x ) n
Yi Y

2
i 1

定理2.2：对于简单随机抽样，y 的方差
V
y
1 f n
S
2
评价调查成功与否的重要指标
其中， 1
f
称为有限总体校正系数。（未入样率）

估计量的方差 V y 是衡量估计量精度的度量。影响估计量方差的因素主要是样本量n，未入样率 1-f和总体方差。2 S
在简单随机抽样的条件下，只有通过加大样本量来提高估计量的精度。

推论为：推论为：
Y 2.4：对于简单随机抽样， N y
的方差
2 1 f 2 V (Y ) N S n

2.5：对于简单随机抽样， P p
的方差
1 f 1 V (P) N P (1 P ) n N 1

比率估计、回归估计需要有足够的样本量才能保证估计的有效性。

有偏估计：当样本量足够大时，估计的偏倚趋于0。
符号定义
总体均值的比率估计量：
y 1 YR y R X XR x N
总体总值的比率估计量：
y YR N YR N y R X XR x
R
第2章简单随机抽样（SRS）
2.1定义与符号
抽样总体

样本容量

简单随机抽样也称为纯随机抽样。从含有 N 个单元的总体中抽取 n 个单元组成样本，如果抽样是不放回的，则所有可能的样本有 C 个，若每个样本被抽中的概率相同，都为 1 C ，这种抽样方法就是简单随机抽样。称 n N 为抽样比，记为 f 。
N N 1

引理2.2 从总体规模为N的总体中抽取一个样本量为n 的简单随机样本，若对总体中的每个单元 Y i ，引进 a Y a 随机变量 a i（Y i 入样， i 1 ； i 不入样， i 0 ），则
E (ai ) V (ai ) n N n N n N N n N ( N 1) (1 n N ) f (1 f ) N 1 ( i , j 1, 2, ...., N ; i j ) f (1 f ) ( i 1, 2, ...., N ) f ( i 1, 2, ...., N )
cov( a i , a j )

定理 2.1：对于简单随机抽样，作为的简单估计， y 是无偏的，即 Y
E (Y ) E y Y
Y
始终成立。

推论为：推论为：
E (Y ) E N y N Y Y
Y 2.1：对于简单随机抽样， N y
R R
V ( yR )
1 f n N
1
1
i 1
N
(Yi R X i )
2
设：

S yx SS x
是Y和X的总体相关系数 Y的相对方差（变异系数）
SS x YX
C
2

S Y
2 2
C yx
S yx YX
2 2
Y与X的相对协方差
Cx
2
Sx X
X的相对方差（变异系数）

定义2.1 从总体的N个单元中，一次整批抽取n个单元，使任何一个单元被抽中的概率都相等，任何n个不同单元组成的组合被抽中的概率也都相等，这种抽样称为简单随机抽样。定义2.2 从总体的N个单元中，逐个不放回地抽取单元，每次抽取到尚未入样的任何一个单元的概率都相等，直到抽足n个单元为止，这样所得的n个单元组成一个简单随机样本。定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组合构造所有可能的 C 个样本，从 C 个样本随机抽取1个样本，使每个样本被抽到的概率都等于 1 C ，这种抽样称为简单随机抽样。
2
X x
2 2
1 f n
2 ˆ ˆ2 2 ( s 2 R s xy R s x )
【例2.4】

在20世纪90年代初的一项工资研究中，人们发现IT行业中，从业者的现薪与起薪之间相关系数高达0.88，已知某IT企业474名员工的平均起薪为17016.00/年，现根据对100个简单随机抽样方式选出的员工现薪的调查结果，估计该企业员工的现薪平均水平。
的期望

2.2：对于简单随机抽样， P p
的期望
E (P) E p P
2.3：对于简单随机抽样，n较大时， r R

推论的期望为：
E (R) E r R

对于有限总体的方差定义：

2

1 N
Y
i 1
N
i
Y

2
S
2
N
1
1
N
是 V ( y ) 的无偏估计。

推论 2.8：
V (Y ) v ( N y ) N
2
(1 f ) n
s
2
是 V (Y ) 的无偏估计。

推论 2.9：对于简单随机抽样，

e商务文档

抽样调查理论与方法金勇进(第二版)-第2章-简单随机抽样

相关文档推荐：

e商务文档

抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样

相关文档推荐：

抽样调查理论与方法金勇进(第二版)-第2章-简单随机抽样