当前位置:文档之家› 简单随机抽样

简单随机抽样


[ p z 2 v( p), p z 2 v( p)] [0.2846,0.4154]
2.3 比率估计量及其性质
当存在与我们调查的主要变量高度相关 的所谓其他辅助变量的有效信息,且这些 辅助变量的信息质量较好时,利用这些信 息无疑将有助于提高估计的精度。
主要变量为Y,另一个与Y有关的辅助变量 为X,对简单随机抽样的一个样本中的每 一个单元获得了Y和X的调查值yi和xi,而X 的总体总值是已知的。
总体比例的简单估计
性质1. E(Pˆ) E( p) P
性质2.V (Pˆ) 1 f S 2 1 f 1 NP(1 P)
n
n N 1
证明:S 2
1 N -1
N i 1
(Yi
Y )2
1 N -1
N i 1
(Yi 2
2YYi
Y
2)
1 N -1
N i 1
Yi 2
NY
2
1 (NP NP2 ) 1 NP(1 P)
[P z 2
1 f n
1 N 1
Np(1
p),
P
z
2
1 f 1 Np(1 p)] n N 1
2.4 某大学有10000名本科生,现欲估计在暑期间参加
了各类英语培训的学生所占的比例。随机抽取了200名
学生进行调查,得到p 0.35。试估计该大学所有本科
生中暑假参加培训班的比例的95%的置信区间。
解:利用去年化肥总产量X 2135,今年化肥总产量 Y的估计值为
YˆR
XRˆ
X
y x
2135 22 25
2426.14.
引理2.3 对于简单随机抽样,n较大时, =; 二是说在某种条件下, 是近似无偏的。
总体总值的置信区间
总体总值Y的1的置信区间为 [Ny z 2 V (Ny), Ny z 2 V (Ny)].
若V (Ny) N 2 1 f S 2中S 2是未知的,则V (Ny)替换为 n
v(Ny) N 2 1 f s2 n
2.5 研究某小区家庭用于文化方面的支出,N 200,
现抽取一个容量为20的样本,调查结果如下
若V ( y) 1 f S 2中S 2是未知的,则V ( y)替换为 n
v(y) 1 f s2 n
总体总值的简单估计
N
总体总值 Y Yi NY 的简单估计量为 i 1
Yˆ Ny
N n
n i 1
yi
性质1:Ny是Y的无偏估计,即 E(Ny) Y.
性质2: V (Ny) N 2 1 f S 2. n
200,150,170,150,160,130,140,100,110,140,
150,160,180,130,150,100,180,100,170,120.
估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间
解:该小区平均的文化支出Y的估计值为
Yˆ =y
1 20
20 i 1
yi
2890 20
总体比例的简单估计
"0 1"变换
令 Yi
1, 若总体中第i个单元具有所研究的特征 0, 若总体中第i个单元不具有所研究的特征
N
则总体中具有这种特征的单元总数A Yi Y.
总体中具有这种特征的比例记为 i1
P= A N =Y
总体比例P的简单估计量为
Pˆ = p a
n= 1 n
n i 1
yi
y
第2章 简单随机抽样(SRS)
2.1 定义及其抽选方法 2.2 简单估计量及其性质 2.3 比率估计量及其性质 2.4 回归估计量及其性质 2.5 简单随机抽样的实施
总体均值的简单估计
总体均值 Y
1 N
N
Yi 的简单估计量为样本均值,即
i 1

y
1 n
n i 1
yi
性质1: y是Y的无偏估计, 即 E( y) Y
在实际抽样调查中,这样的辅助变量一般有以下几种常 见情况:
(1)同一个变量的上期调查结果,往往隐含着当期与上期的 变化不会太大的假设;
(2)与主要变量之间整体上存在某种比值关系,即隐含着两 者比值关系的变化不会太大的假设。
辅助变量的选择
辅助变量必须与主要变量高度相关; 辅助变量与主要变量之间的相关关系整体上相
N -1
N -1
总体比例的简单估计
P的1-置信区间[Pˆ z 2 V (Pˆ), Pˆ z 2 V (Pˆ)]
因为V (Pˆ) 1 f 1 NP(1 P)中P是未知的,用
v(Pˆ) 1 f
1
n N 1 Np(1 p)来代替,这样置信区间为
n N 1
[Pˆ z 2 v(Pˆ), Pˆ z 2 v(Pˆ)]
144.5
样本方差计算为
s2= 1 19
20 i 1
( yi
y)2
826.0256
v( y) 1 f s2 1 20 200 826.0256 37.1712
n
20
又z 2 z0.025 1.96, 因而Y的95%置信区间为
[y z0.025 v(y), y z0.025 v(y)] [132.55,156.45]
当稳定; 辅助变量的总体总值必须是已知的,或是容易获
得的; 辅助变量的信息质量更好,或信息更容易取得即
调查成本更低。
主要变量的总体均值 的比率估计量
主要变量的总体总值Y的比率估计量
只有 属于估计量,而且是简单估计量,也就是说这些比率 估计量都是简单估计量 的线性组合。
习题2.8 某地区对本地100家化肥生产企业的尿素产量 进行调查。已知去年的总产量为2135吨,抽取10家 企业调查今年的产量,得到y 25,这些企业去年的 产量均值为x 22。试估计今年该地区化肥总产量。
解:据题意知,N 10000,n 200, f n 0.02. N
该大学所有本科生中参加培训班的比例P的估计值为 Pˆ =p 0.35.
v(Pˆ) v( p) 1 f N p(1 p) 1 f p(1 p) 0.001115,
n N 1
n
v( p) 0.03339.
又z 2 z0.025 1.96,因而P的95%的置信区间为
性质2:V ( y) 1 f S 2,其中,f n 称为入样比,
n
N
S 2
1 N -1
n i 1
(Yi
Y
)2是总体方差
总体均值的置信区间
根据中心极限定理,当 n 较大时
y E( y ) y Y 近似服从正态分布 V(y) V(y)
因此,Y 的1 的置信区间为
[ y z 2 V ( y), y z 2 V (y)].
相关主题