抽样技术期末试卷一、选择题(每题2分,共20分)1.抽样调查的根本功能是( )A. 获取样本资料B. 计算样本资料 C . 推断总体数量特征 D. 节约费用2.概率抽样与非概率抽样的根本区别是( )A.是否能保证总体中每个单位都有完全相同的概率被抽中B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中C.是否能减少调查误差D.是否能计算和控制抽样误差3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( )A.所考虑的抽样设计比简单随机抽样效率低B.所考虑的抽样设计比简单随机抽样效率高C.所考虑的抽样设计与简单随机抽样效率相同D.以上皆对4.优良估计量的标准是()A.无偏性、充分性和一致性B.无偏性、一致性和有效性C. 无误差性、一致性和有效性D. 无误差性、无偏性和有效性4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。
试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.496.抽样标准误差的大小与下列哪个因素无关( )A .样本容量B .抽样方式、方法C .概率保证程度D .估计量7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( )A.1B.0C.x yD.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θθ)ˆ(SE =∆ B.)ˆ(θtSE =∆ C.θθ)ˆ(tSE =∆D.tSE )ˆ(θ=∆9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( )关系A.正比例B.反比例C.负相关D.以上皆是10.能使)2(1)(222YX X Y lr S S S nf y V ββ-+-=达到极小值的β值为( )A.YXX Y S S S ⋅ B.2XYX S S C.2YYX S SD.XYX S S 2二、判断题(每题1分,共10分)1. 总体比率R 与总体比例P 两者是一样的概念,只是符号不同。
( )2.比估计量是有偏估计量。
( )3.分层抽样在划分层时,要求层内差异尽可能大,层间差异尽可能小。
( )4.对于同一总体,样本容量同抽样标准误差之间是正相关关系。
( )5.整群抽样设计总是比简单随机抽样效率低。
( )6.其他条件相同时,重复抽样的误差小于不重复抽样的误差。
( )7.设总体容量为N ,样本容量为n ,采用有顺序放回简单随机抽样,样本配合种数为n NC 。
( )8.一个调查单位只能对接与一个抽样单位。
( )9. 营业员从笼中抓取最靠近笼门的母鸡,该种抽样方式属于非概率抽样。
( ) 10. 当调查单位的抽样框不完整时,无法直接实施简单随机抽样。
( ) 三、计算题(共70分)1、为调查某5443户城镇居民服装消费情况,采用简单随机不重复抽样调查了36户进行调查,得到平均消费支出72.649=y 元,3048032=s 试根据此估计:(16分)(1)该地区居民服装消费支出总额,并给出置信水平为95%的置信区间。
(2)如果希望服装平均消费支出的相对误差限不超过5%,则样本量至少应为多少?2、某地区10000名群众,现欲估计在拥有本科学历及以上的群众所占的比例,随机不重复抽取了300名群众进行调查,得到25.0 p ,试估计该地区群众拥有本科以上学历的比例,并以正态分布近似给出其95%的置信区间。
(10分)3、对某地区171 980户居民家庭收入进行调查,以居民户为抽样单位,根据城镇和乡村将居民划为2层,每层按简单随机抽样抽取300户,经整理得如下数据: 层 h N h y h W h s城镇 23560 15180 0.137 2972 乡村 14842098560.8632546试根据此估计:(20分)(1)居民平均收入及其95%的置信区间。
(2)若是按比例分配和奈曼分配时,各层样本量分别应为多少?4、某居民小区共有600个单元,每个单元均居住15户,现以单元为群进行整群抽样,随机抽取8个单元,调查每户每周的食品支出费用,调查结果经整理,各单元样本均值和标准差如下表所示:i y 205 219 202 218 212 217 208 220i s30.6132.1429.6228.3625.8433.5934.2026.84试求:(14分)(1)该居民小区平均每户每周食品支出费用,并给出其置信水平为95%的置信区间。
(2)计算以单元为群的群内相关系数与设计效应5、某县有300个村,小麦播种面积为23 434亩。
全部村子按地势分为平原和山区两种类型,各按10%的抽样比抽样,调查亩产量,经整理得到下表结果,以大写字母表示总体数据,小写字母表示样本数据,Y 代表调查变量,为今年的总产量,X 代表辅助变量,为去年的总产量,相应的均值为平均亩产量。
类型 h N h W h y h xh X平原 102 0.34 583 561 568 山区 1980.66290274271试分别对全县今年的平均亩产量构建分别比率估计量和联合比率估计量。
(10分)答案一、选择题:1 2 3 4 5 6 7 8 9 10 CBABBCCBAB二、1 23 4567 8 9 10 ×∨××××××∨∨三、计算题(75分) 1、(16分)96.1,304803,72.649,36,54432=====t s y n N21~ˆ~%,66.0)1(s nf t N y N Y N n f ⋅-⋅⋅±==96.3536425ˆ~=⋅=y N Y8695.84101)(2=⋅-=s nf y v)()ˆ~(2y v N Y v ⋅=8433.499181)ˆ~(=Y SE所以居民区总用水量的区间为:)37.4514822,55.2558029( (9分)2222000,1%,5)2(Y r s t n Nn n n r ⋅=+=≤根据题中相关数据可得1110≥n户,由此可得922≥n 户即,要满足相应的精度要求,至少得抽922户做样本。
(7分)2、(10分)96.1,25.0,03.0,300,10000======t p Nnf n N41008.6)1(11)(-⨯≈-⋅⋅--=p p n fp v0247.0)(≈p SE (6分)所以本科生中暑假参加培训班的95%的置信区间为:)2984.0,2016.0(0484.0%25)0247.096.1(%25)(即±=⨯±=⋅±p SE t p(4分) 3、(1)(10分)由题中相关数据资料:元)(39.1058521≈⋅=∑=h h h st y W y(3分)(元)3082.166057364.160595718.545)1()(2212=+≈⋅-⋅=∑=h hh h hst n S f W y v (3分)户),元/(86.128)(≈st Y se 96.1=t(2分)该地区居民平均收入的95%的置信区间为: 元)96.10837,82.10332()(→⋅±ststY se t Y(2分)(2)(10分) 按比例分配:户)(82137.060011=⨯=⋅=W n n (2分)户)(518863.060022=⨯=⋅=W n n(2分)按奈曼分配:∑=⋅⋅⋅=Lh hhhh h S WS W n n 1由表中资料:362.2604,198.2197,164.407,600212211====∑=h h h S W S W S W n由上可得根据奈曼分配,各层所需样本容量为:94362.2604164.4076001≈⨯=n (3分)506362.2604198.21976002≈⨯=n(3分)4、(14分) (1)(9分)96.1,15,013.0,8600======t M Aaf a A ,625.21211=⋅=∑=ai i y a y(3分)7315.7199821.4715)(1212=⨯≈-⋅-=∑=y y a M s ai i b(2分)9198.51)(2≈-=bs aM fy v(2分)43.2)(≈y se ,所以该城市大学生人均月生活费支出95%的置信区间为:)39.217,86.207()(→⋅±y se t y(2分) (2)(5分)20.9171122≈=∑=a i i ws a s0146.0)1(ˆ2222-≈-+-=wb wb c s M s s s ρ (3分)7956.0ˆ)1(1=-+≈c M deff ρ(2分) 5、(12分)全县今年的平均亩产量的分别比率估计量由题可得:058.1ˆ,039.1ˆ,ˆ21===R R x y Rhh h89.389)ˆ(21=⋅=∑=hh h h Rs X R W y(5分)全县今年的平均亩产量的联合比率估计量 由题可得:62.38921==∑=h h h sty W y ,58.37121==∑=h h h stx W x049.1ˆ==stst Cx y R98.37121=⋅=∑=h h h X W X21.390ˆ=⋅=X R y CRC(7分)。