当前位置:文档之家› 抽样调查习题集

抽样调查习题集

《抽样调查》习题第一章 概述1.1 什么是概率抽样?什么是非概率抽样?它们各有什么优点? 1.2 怎样理解抽样调查的科学性? 1.3 抽样调查基础理论及其意义; 1.4 抽样调查的特点。

第二章 抽样调查基本原理2.1 试说明以下术语或概念之间的关系与区别; 1.总体、样本与个体; 2.总体与抽样框;3.个体、抽样单元与抽样框。

2.2 试说明以下术语或概念之间的关系与区别; 1.均方误差、方差与偏倚; 2.方差、标准差与标准误。

2.3 影响抽样误差的因素; 2.4 抽样分布及其意义; 2.5 抽样估计的基本原理; 2.6 置信区间的确定。

第三章 简单随机抽样3.1 设总体N=5,其指标值为{3,5,6,7,9}1.计算总体方差2和S 2;2.从中抽取n=2的随机样本,计算不放回抽样的方差)(y V ;3.按不放回抽样列出所有可能的样本并计算y ,验证)(y E =Y ;4.按不放回抽样所有可能的样本,计算其方差)(y V ,并与公式计算的结果进行比较;5.对所有的可能样本计算样本方差s 2,并验证在不放回的情况下:E (s 2)= S 2。

3.2 在一森林抽样调查中,某林场共有1000公顷林地,随机布设了50块面积为0.06公顷的方形样地,测得这50块样地的平均储蓄量为9m 3,标准差为1.63 m 3,试以95%的置信度估计该林场的木材储蓄量。

3.3 某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。

采用简单随机抽样抽选了100户,得ý=12.5,s 2=1252。

估计该居民区的总用水量95%的置信区间。

若要求估计的相对误差不超过20%,试问应抽多少户做样本?3.4 某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人中随机抽选8人,其操作时间分别为4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:分),试以95%的置信度估计该项作业平均所需时间的置信区间(有限总体修正系数可忽略)。

3.5 从一叠单据中用简单随机抽样方法抽取了250张,发现其中有50张单据出现错误,试以95%的置信度估计这批单据中有错误的比例。

若已知这批单据共1000张,你的结论有何变化?若要求估计的绝对误差不超过1%,则至少抽取多少张单据作样本?第四章 分层抽样4.1 一公司希望估计某一个月内由于事故引起的工时损失。

因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。

已知下列资料:4.2 上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数如下:4.3调查某个地区的养牛头数,以村作为抽样单元。

根据村的海拔高度和人口密度划分成四层,每层取10个村作为样本单元,经过调查获得下列数据(1) 估计该地区养牛总头数Y 及其估计量的相对标准误差Y Ys ˆ)ˆ( (2) 讨论分层抽样与不分层抽样比较效率有否提高。

(3) 若样本量不变采用Neyman 分配可以减少方差多少? (1) 按工厂数多少分配样本; (2) 按最优(奈曼)分配。

4.5 怎样分层能提高精度?4.6 总样本量在各层间分配的方法有哪些? 4.7 分层的原则及其意义。

第五章 比估计与回归估计5.1 欲估计某小区居民的食品支出占总收入的比重,该地区共有150户,现用简单随机抽样抽取14户为样本,经调查每户的食品支出y5.2 某林场欲估计一批出售木材的材积量,从N=250株砍伐的树木中随机抽取了n=12株作为样本,每株分别测量了根部横截面积和材积量(见附表)。

为了估计总材积量又测量了这250株树木根部的横截面积之和为75平方尺。

要求:(1)估计这250株树的总材积量及相对标准差;(2)比较采用比估计与简单估计的效率。

附表样本,取得资料如下:和置信度为95%的置信区间。

(2) 估计每个村的平均小麦产量及估计的相对标准差。

5.4 一公司欲了解广告对其产品销售量的作用,从销售该公司产品的452家企业中抽选了20家,分别调查了广告前与广告后的月销售量数据如下表:(1) 若广告前的月总销售量为216256,估计广告后的月销售量及其相对标准差。

(2) 求广告后比广告前销售量增加百分比的置信区间(a=0.05)。

(3) 若允许估计总销售量的最大绝对误差为△=3800,置信度为95%,确定应抽取多少企业作样本。

5.5 某养兔专业户购进100只兔子,平均重量为3.1磅,随机抽取了10只兔子为样本,记录其重量,经过两个月的饲养,现欲了解其平均重量,经过称重,其资料如下:(1) 用回归估计法估计每只兔现有的重量,并计算其方差的近似估计量。

(2) 若每只兔的平均重量允许最大误差为0.05磅,置信度为95%,应该取多少只兔为样本?5.6 某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分平原和山区两层采用分层抽样。

同时当年产量与去年产量之间有相关关系,故还计划采用比估计方法。

已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产为21200(百斤)。

现从平原用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料如下: 山区试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误,并对上述两种结果进行比较和分析。

5.7 回归估计、比估计与简单估计间的区别; 5.8 辅助变量的选择原则。

第七章 不等概率抽样7.1 对与N=4的假设总体{1,2,3,4}按给顶的概率{0.1,0.2,0.4,0.4}进行有放回抽样,n=2(1)试列出所有可能样本以及每个出现的概率;(2)对每个样本计算对总体和Y 的估计∑==ni ii z y n Y 11ˆ,验证HH Y ˆ是Y 的无偏估计;(3)根据可能样本计算)ˆ(HH Y V ,验证其结果是否按公式计算的结果一致?7.2 研究人员欲估计一批电子元件板上的缺陷数,由于缺陷数与板上的电子元件数目有关,故采用与元件数目成比例的放回的PPS 抽样。

设N=10,每块板上电子元件的数目按顺序分别为10,12,22,8,16,24,9,10,8,31,设n=4。

现要求 (1)说明样本的抽选方法;(2) 若抽中的单元按前面排列的序号是第2,3,5,7这四个元件板,其缺陷数分别为1,3,2,1,试根据这一抽样结果,估计这批元件上共有多少个缺陷数。

(3)给出上述估计量的方差估计。

7.3 假设总体大小N=7,单元指标值分别为10,20,30,40,50,60和70,采取n=2的不放回πPS 抽样。

试列出所有可能的样本,计算每个单元和每对单元被抽入样本的包含改良i π和ij π并验证21=∑=N i i π,i Nij ij ππ=∑≠。

7.4 有一个估计某城镇现有第三产业单位数的例子。

假设有去年年底的普查数和现有的实际单位数,分街道统计如下:(1)等概率抽选,简单(无偏)估计;(2)等概率抽选,以去年普查数为辅助变量的比估计;(3)按与去年普查数成比例的概率抽样,汉森—赫维茨估计。

比较这三种估计的方差或均方误差,(计算比估计的均方误差时应计算真值而不用近似公式)并加以讨论。

第八章整群抽样8.1某一社会研究机构,研究南方某一城镇的社会民俗等情况。

设该镇共有415个居民小组,现从中按简单随机抽样抽取25个居民小组作样本,取得了以下一些数据。

(1)估计该地区户平均收入及其标准差。

(2)估计三代人的户占总户数的比例,并计算其标准差;8.2某工业系统准备一项改革措施,对全系统的人进行一项民意测验,该系统共有87个单位,现采用整群抽样,用简单随机抽取15个单位作为样本,对抽中的单位作全面征求意见,其结果如下:要求:(1) 估计该系统同意这一改革人数的比例,并计算估计标准误;(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的绝对误差不超过4%,置信度为95%,则应抽多少个单位作样本。

8.3 假设整群抽样的样本群数为n ,每个群有M 个单元,群间方差为2b S ,群内方差为2wS 试对整群抽样与相同样本量的简单随机抽样的效率的比较进行讨论(fpc 可忽略不计)。

8.4 整群抽样与分层抽样的区别; 8.5 整群抽样的设计效应。

第九章 多阶抽样9.1 苗圃职工用二阶抽样方法估计树苗的平均高度,该苗圃共有N=50块地,先从中抽取10块地,再从每块抽中的地块中抽10%的树苗,对抽中的苗木测量其高度取得资料如下:已知共有M 0(1) 若两阶抽样都是简单随机的,调查结果用加权平均数∑==ni i i y M n M N Y 10)1(ˆ来估计总体均值,求估计值)1(ˆY,并计算)ˆ()1(Yv ;(2) 抽样方法同(1),但估计量不加权,即用∑==ni i y n Y 1)2(1ˆ,求估计值并计算)ˆ()2(Y v (3) 抽样方法不变,使用比估计,即∑∑=iii MyM Y )3(ˆ,求估计值及其标准误差)ˆ()3(Yv(4) 讨论上述三种方法的适用条件9.2 省卫生部门对32个城市的饮食业采用二阶抽样方法检查卫生合格情况,第一阶抽样从32个城市中简单随机抽取4个城市,第二阶抽样在每个抽中的城市用同样方法抽取一半饮食店进行检查,检查结果如下:9.3 估计一个地区的每一住户平均消费支出,拟采用二阶抽样设计,第一阶抽村,第二阶抽户,都采用简单随机抽样。

为了设计这一调查先作了一试调查获得以下信息:(a)50=Y ,(b)村与村之间的方差5.8521=S ,(c)村内户与户之间的方差5.3622=S ,(d)调查每个村的费用91=c 元,(e)调查每一住户的费用12=c 元,(f)调查的组成管理费用为10000=c 元。

若总的调查费用C T =10000元。

请计算最忧的样本村数和每村的样本住户数。

9.4 多阶抽样与单阶抽样的关系;9.5 二阶抽样与整群抽样和分层抽样的关系。

第十章 系统抽样10.1 以美国某镇的360户为总体,编号从1—360,排列的顺序按户主的姓的字母排列,下列的号码是家长为非白人的住户号码:28,31一33,36—41,44,45,47,55,56,58,68,69,82,83,85,86,89—94,98,99,101,107一110,114,154,156,178,223,224,296,298—300,302—304,306—323,325—331,333,335—339,341,342)由于姓与肤色有关系,所以非白种人的住户显出某些“聚集”的现象)。

为了估计家长为飞白人住户在全部住户中所占的比例,每8户抽1户,取得一个系统样本。

试将这一系统样本的精度与同样样本量的简单随机抽样的精度加以比较。

10.2 现欲对一条街上的居民调查住户的平均居住年限,用每隔20户抽取1户的系统抽样方法,共调查了115户,得∑==1151407i iy;∑==1151215.2011i i y 。

相关主题