多阶段抽样一、 单选题1. 两阶(段)抽样中,对于一个估计量θˆ的均值可以表示为(A )。
A.)]ˆ([)ˆ(21θθE E E =B.)]ˆ([)ˆ(12θθE E E = C. )]ˆ()ˆ([21)ˆ(21θθθE E E -= D. )]ˆ()ˆ([21)ˆ(21θθθE E E +=2. 在多阶段抽样中,当初级单元大小相等时,第一阶段抽样通常采用(B )。
A.系统抽样 B.简单随机抽样 C.不等概率抽样 D.非概率抽样3.初级单元大小不等的多阶段抽样中,无偏估计量成为自加权的条件是(C )。
A.第一阶段每个单元被抽中的概率相等 B.第二阶段每个单元被抽中的概率相等 C.最终阶段每个单元被抽中的概率相等 D.最终阶段每个单元被抽中的概率不等4.在初级单元大小相等的二阶段抽样中,当抽取次级单元的数量相等时,二阶段抽样的方差与整群抽样方差以及分层抽样方差之间的关系通常为(C )。
A.二阶段抽样的方差<整群抽样的方差<分层抽样的方差 B. 二阶段抽样的方差>整群抽样的方差>分层抽样的方差 C. 分层抽样的方差<二阶段抽样的方差<整群抽样的方差 D. 分层抽样的方差>二阶段抽样的方差>整群抽样的方差 二、多选题1.二阶段抽样中,初级单元大小不等时,一般可采用下面方法(AC )。
A.通过分层,将大小近似的初级单元分到一层,然后采用分层二阶段抽样B.可按初级单元大小相等的方法处理C.考虑用不等概率的抽样方法抽取初级单元D.采用简单随机抽样抽取初级单元但改变估计量的形式E.近似看成初级单元大小相等2.确定样本量时需要考虑的因素有(AB )。
A.调查的费用 B.调查要求的精度 C.调查的时间 D.调查的技术E.调查的目的3.初级单元大小不等时,下面关于二阶段抽样总体总和Y 的估计的说法正确的有(ABCD )。
A.可以采用放回的抽样方式,按不等概率抽取初级单元,此时可得总体总和Y 的估计量∑∑====n i ii i n i i i HH z y M n z Y n Y 111ˆ1ˆ B.采用不放回抽样方式,按简单随机抽样抽取初级单元,此时有∑∑====ni i ni i i uY n Ny M nN Y 11ˆˆC. 采用不放回抽样方式,按简单随机抽样抽取初级单元,此时∑∑===n i ini iR MY M Y 110ˆˆD. 采用不放回抽样方式,按不等概率抽样,此时有∑∑====n i ii n i ii i HT Y y M Y 11ˆˆππE.可以采用放回的抽样方式,按简单随机抽样抽取初级单元,此时有i ni iy MnN Y∑==1ˆ4.多阶段抽样相对于简单随机抽样的优点有(ACDE )。
A.实施方便B.每个基本单元的调查费用比较低C.能够充分发挥抽样的效率D.节省人力、物力E.可以分级准备抽样框5.二阶段抽样中,关于总体比例P 的表达可以为(AE )A. Y P =B. ∑==ni iP NP 11C. ∑==ni iY MN P 11D. ∑==ni i A M P 11E. 三、计算题1. 对某商店上月销售额根据发票进行抽样估计,若该商店上月共用了18本发票,现用随机方法抽取了4本发票,每本发票有200张,从抽中的发票本中,每本分别随机抽取了40张发票,经过整理取得数据如下:发票调查情况2. 欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水账,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水账。
调查的结果如下表:对5家企业的调查结果要求根据这些数据推算100家企业改指标的总量,并给出估计的95%置信区间。
3. 某部委对所属企事业单位就一项改革方案进行抽样调查,采用二阶抽样。
先在全部1250 N 个单位(平均每个单位职工人数M =250)中按简单随机抽样抽取n=350个单位,然后对抽中的每个单位再按简单随机抽样抽取m=8个职工进行调查。
样本单位中赞成此项改革方案人数为k 的单位频数k n (k=0,1,…,8),及赞成比例k p 列在下表中,试估计该部委全体职工赞成该项方案的比例p ,给出估计两的方差估计。
4. 欲调查某个新小区居民户家庭装潢聘请专业装潢公司的比例。
我们在15个单元中随机抽取了5个的单元,每个单元有12户,在这5个单元中分别随机抽取了4户居民并进行了调查,对这20户的调查结果如下表:要求根据这些数据推算居民家庭装潢聘请专业装潢公司的比例。
5. 某县农村共有14个乡509个村,在实现小康的进程中欲计算该县农村的恩格尔系数,即居民户的食品支出占总支出的比例。
首先要调查全县的食品总支出,现采用了二阶抽样,第一阶段先在14个乡中,按村的数目多少进行pps 抽样,共抽了5个乡,第二阶段在抽样中的乡中随机的抽取6个村做调查,然后对抽中的村做全面调查,取得数据如下:要求估计全县的食品支出总金额及估计的标准误差。
6. 某服装联合企业,下面有90个缝纫厂,共有缝纫机4500台,据反映由于机器经常出现故障影响生产,管理部门拟用抽样方法调查上月每台机器因故障而停工的平均小时数,现采用二阶段抽样,第一阶段按简单随机抽样抽取10个工厂,第二阶段在抽中的工厂中抽20%的机器做样本,根据样本机器得如下数据:样本机器调查结果要求估计上月每台机器平均的停工时间和由于停工引起的总时间损失,并计算相对标准差。
7. 某小区拥有10座高层建筑,每座高层建筑拥有的楼层数如下表所示:每座高层建筑拥有的楼层数有的楼层数成比例的不等概率抽样抽取5座建筑,第二阶段按简单随机抽样对每座建筑抽取两个楼层。
对10个楼层居民人数的调查结果如下,请对小区总居民数进行估计,并给出估计的精度。
(95%的置信度)200间,每间住6位同学。
学生会的同学运用二阶段抽样设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取了3位同学分别进行单独访问,两个阶段的抽样都是简单随机抽样,调查的结果如下:试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。
9. 上题中,学生会对女生勤工俭学月收入的一项调查中,根据以往同类问题的调查,宿舍的标准差为1s =326元,宿舍内同学之间的标准差为2s =188元。
以一位同学进行调查来计算,调查每个宿舍的时间1c 为10分钟,调查每一学生的时间2c 为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间是0c 为4小时,如果总的时间控制在8个小时内,则最优的样本宿舍和样本学生数为多少?10. 苗圃职工用二阶抽样方法估计树苗的平均高度,该苗圃共有N=50块地,先从中抽 0(1)若两阶抽样都是简单随机的,调查结果用加权平均数∑==ni i i y M n M N Y 10)1(ˆ来估计总体均值,求估计值)1(ˆY,并计算)ˆ()1(Yv ;(2) 抽样方法同(1),但估计量不加权,即用∑==ni i y n Y1)2(1ˆ,求估计值并计算)ˆ()2(Y v(3) 抽样方法不变,使用比估计,即∑∑=iii My M Y)3(ˆ,求估计值及其标准误差)ˆ()3(Yv(4) 讨论上述三种方法的适用条件11. 省卫生部门对32个城市的饮食业采用二阶抽样方法检查卫生合格情况,第一阶抽样从32个城市中简单随机抽取4个城市,第二阶抽样在每个抽中的城市用同样方法抽取一要求估计这32个城市不合卫生要求的饮食店所占的比例及95%的置信区间。
12. 某城市共有六家医院,欲估计住院病人中长期住院病人所占的比例。
现从这六家医院根据病床的多少采用放回按规模大小成比例的抽样方法抽取3个医院,再从抽中的医院中用简单随机抽样抽取10%的病人,调查长期住院病人(住院一个月以上)所占的比例.其数据如下:要求估计住院在一个月以上病人占总住院病人的比例及其95%的置信区间.13. 为估计一本英语字典的总字条效.先从26个字母中用放回的PPS 抽样方法抽出10个字母,在抽中的字母中又不放回地抽取2页进行计数,其样本数据如下:用汉森一赫维茨估计量估计该字典的总字数和它的相对标准差,并估计它的设计效应deff 。
14. 估计一个地区的每一住户平均消费支出,拟采用二阶抽样设计,第一阶抽村,第二阶抽户,都采用简单随机抽样。
为了设计这一调查先作了一试调查获得以下信息:(a)50=Y ,(b)村与村之间的方差5.8521=S ,(c)村内户与户之间的方差5.3622=S ,(d)调查每个村的费用91=c 元,(e)调查每一住户的费用12=c 元,(f)调查的组成管理费用为10000=c 元。
若总的调查费用C T =10000元。
请计算最忧的样本村数和每村的样本住户数。
15.班中每班抽选5个孩。
.假设抽中的班级为B 和C 班.在B 班中用简单随机抽样抽5个小孩,他们平均吃糖果数为3,5,4,5,3;在C 班中抽选的5个孩子其吃糖果数为4,6,4,4,3。
要求:(1) 估计全幼儿园平均每人每天吃糖果数; (2) 计算抽样标准误.16. 假设总体初级单元的大小均为M 。
为了估计总体均值Y (按次级单元),采用如下的二阶抽样法,先随机地抽取n 个初级单元,然后从每个初级单元中抽取一个次级单元。
记 M S S S U22212-=其中∑=--=N i i Y Y N S 1221)(11 ∑∑==--=N i Mj i ij Y Y M N S 11222)()1(1 试证:若02>u S ,则上述简单随机样本比直接从全体次级单元中抽取的样本量为n 的简单随机样本更有效,如果n /N 忽略不计,则两组样本同样有效。
17. 对于各级单元大小相等情形的三阶抽样,若每阶抽样都是简单随机的,根据9.5.1中的记号,证明233222212111)(S mkf S m f S s E -+-+= 23322221)(S kf S s E -+= 2323)(S s E =四、简答题1. 什么是多阶段抽样?多阶段抽样有哪些优点?2. 能否举例说明多阶段抽样在实际生活中有哪些应用?3. 多阶抽样与单阶抽样的关系;4.二阶抽样与整群抽样和分层抽样的关系。
五、设计题某学校欲调查学生每月的零用钱数量。
假设该学校共有18个班级,每个班级都有60个学生。
请你设计一个调查方案,并说明你是如何确定样本量的。