分层随机抽样(答案)
97 7 4 5 4 6 5 5 1
请估计该地区养牛总头数 Y 及其估计量的相 对标准差 s(Yµ) /Yµ 。
8. 一公司希望估计某一个月内由于事故引 起的工时损失。因工人、技术人员及行政管理人 员的事故率不同,故采用分层随机抽样。已知下 列资料:
工 技术人 行政管理
人员
人员
N1 =1 32 =3 S12 6
从商行内抽取由 400 人组成的一个样本,目的是
估计使用某些娱乐设备的人所占的比例。按照粗
略的猜测,这些设备 40%到 50%是由男性使用的,
20%到 30%是由女性使用的,5%到 10%是由管理人
员使用的。请问:
(1)你如何把样本单位分配在这三组人之间?
(2)若真正使用者占的比例分别是 48%,21%
总 1234567891
数
0
1 141 4 8 9 0 1 4 0 1ห้องสมุดไป่ตู้1 0
1 348 04 23
4
2 470 5 1 6 8 8 1 1 1 5 1
5 0427457066
7
804 0
3 255 2 2 1 2 1 1 3 0 6 2
8 2613373 32
8202984
0
4 149 1 3 2 3 3 0 2 7 1 3
好
C. 层数一般以不超过 6 为宜
D. 层数一般以 4 层为最好
E. 应该充分
考虑费用和精度要求等因素来确定层数
6. 下 面 哪 种 样 本 量 分 配 方 式 属 于 奈 曼 分 配 ?
( CD )
A. nh n Nh N
nk NhSh
n
L
NhSh
h1
B. nh NhSh / ch
C.
n
2%。
Wh
层
真 Sh
估计的 Sh
值 (1) (2)
1 0. 30 30 30
2 3 20 20 20
3 0. 10 5 20 6 0. 1
7. 调查某个地区的养牛头数,以村作为抽
样单元。根据村的海拔高度和人口密度划分成四
层,每层抽取 10 个村作为样本单元,经过调查
获得下列数据:
层村
样本村养牛头数
收集到以后才知道
D. 总体规模太大,事先分层太费事
E. 一般场合都可以适用
三、名次解释
1. 分 层 随 机 抽 样
2. 自 加 权
3. 最优分配
四、简答题
1. 简述分层随机抽样相对于简单随机抽样的优
点。
2. 请列举出样本量在各层的三种分配方法,并
说明各种方法的主要思想。
3. 怎样分层能提高精度?
4. 总样本量在各层间分配的方法有哪些?
A、Vopt V prop Vsrs
B、V prop Vopt Vsrs
C、V prop Vopt Vsrs
D、Vsrs V prop Vopt
6、下面哪种样本量分配方式属于比例分配?( A)
A、 nh n Nh N
B、 nh Nh Sh ch
n
L
NhSh ch
h1
C、 nh NhSh
L
NhSh / ch
h1
D. nh WhSh
n
L
Wh Sh
h1
E. nh WhSh / ch
n
L
WhSh / ch
h1
7.事后分层的适用场合有(ABCD )
A. 各层的抽样框无法得到
B. 几个变量都适宜于分层,而要进行事先的多
重交叉分层存在一定困难
C. 一个单位到底属于哪一层要等到样本数据
层,每层取 10 个村作为样本单元,经过调查获
得下列数据
层 村总数 样本村养牛头数
1234567
8 9 10
1 1411
43 84 98 0 10 44 0
2 4705
124 13 0
3 2558
50 147 62 87 84 158 170
4 14997 104 56 160
228 262 110 232 139 178 334
请问:
(1)包含 1000 个住户的样本应该如何在这
两层中分配?
(2) 若调查的目的是估计这两层平均每个
住户拥有财产的差额,样本应如何分配(假定各
层的单位调查费用相等)?
2. 一个县内所有农场按规模大小分层,各
层内平均每个年农场谷物(玉米)的英亩数列在
下表中。
农场规 农场数 平均每一农场的 标准差 Sh
20%(即V ( pprop ) V ( psrs ) =0.8)
(2) 若 P=4% ,其中 W1=0.05 ,P1=45% ;W2=0.2, P2=5%; W3=0.75, P3=1%.则采用按比例分配的分层 抽样比简单随机抽样精度得益有多大?
14. 调查某个地区的养牛头数,以村作为抽
样单元。根据村的海拔高度和人口密度划分成四
th 均为已知数,请证明当总费用固定时,为了使
V
(
yst
)
达到最小值,
nh
必与
(Wh2 t
Sh
2
)2
/
3
成比例。并求出下
h
述条件中,一个含量为 1000 的样本所对应的 nh 。
Wh
Sh
th
层
1 0.4 4
1
2 0.3 5
2
3 0.3 6
4
4. 在一个商行内,62%的雇员是熟练的或不
熟练的男性,31%是办事的女性,7%是管理人员。
现要抽出一个包含 100 个农场的样本,目的是估
计该县平均每个农场的玉米面积,请问:
(1)按比例分配时,各层的样本量为多少?
(2)按最优分配时,各层的样本量为多少?
(假定各层的单位调查费用相等)
(3)分别将比例分配、最优分配的精度与简
单随机抽样的精确度比较。
3.设费用函数具有形式C c0 th nh ,其中 c0 及
样本
平原 去年产量 当年产量(百
(百斤)
斤)
1
204
210
2
143
160
3
82
75
4
256
280
5
275
300
6
198
190
山区
样本
去年产量 当年产量(百
(百斤)
斤)
1
137
150
2
189
200
3
119
125
4
63
60
5
103
110
6
107
100
7
159
180
8
63
75
9
87
90
11. 一公司希望估计某一个月内由于事故引
年龄组 层权 层样本 ph
qh
Wh
量 nh
14—25 0.281 400 0.08 0.917
岁 0.322 650 3 0.826
26—40 0.213 600 0.17 0.690
岁 0.814 350 4 0.536
41—60
0.31
岁
0
61 岁
0.46
以上
4
6. 设计某一类商店销售额的调查,n=550,
下:
工人
技术人员
行政管理人员
8,24,0,0, 4,5,0,24, 1,8
16,32,
8,12,3,2,
6,0,16,7, 1,8
4,4,9,5,8,
18,2,0
试估计总的工时损失数并给出它的置信度为
95%的置信区间。
13. 在估计比例问题时:
(1) 假设 P=0.5,W1=W2=0.5,则 P1 和 P2 为何值 时可以使按比例分配的分层抽样精度可以得益
N2 =92 S22 =25
N3 =27 =9 S32
若总样本量 n=30,试用奈曼分配确定各层
的样本量。
9.上题中若实际调查了 18 个工人、10 个技
术人员、2 个行政人员,其损失的工时数如下:
工人 技术人 行政管理人
员
员
8,24,0, 4,5,0, 1,8 0,16,32,24,8,12, 6,0,16, 3,2,1,8 7,4,4, 9,5,8, 18,2,0
分组
(万元)
1—49
18260 100
80
50—99
4315
250
200
100—249 2233
500
600
250—999 1057
1760
1900
1000 人 以 567
2250
2500
上
(1) 若欲抽取 3000 个工厂作样本来估计产值,
试比较下列各种分配的效率:
(2) 按工厂数多少分配样本;
按最优(奈曼)分配。
模(英亩) Nh
玉米面积Yh
0—40 394
5.4
8.3
41—80 461
16.3
13.3
81—120 391
24.3
15.1
121—16 334
34.5
19.8
0
169
42.1
24.5
161—20 113
50.1
26.0
0
148
63.8
35.2
201—24
0
241
总和或 2010
26.3
--
均值
B、 nh n C、 Wh 1 D、 Nh 1
4、在给定费用下估计量的方差V (yst ) 达到最小,
或者对于给定的估计量方差V 使得总费用达到最