当前位置:文档之家› 抽样PPT题目

抽样PPT题目


例3.1
• 调查某地区的居民奶制品年消费支出,以居民户为抽样单 元,根据经济及收入水平将居民户划分为 4层,每层按简 单随机抽样抽取10户,调查获得如下数据(单位:元), 要估计该地区居民奶制品年消费总支出及估计的标准差。
层 居民户 总数 1 1 2 200 400 10 50 2 40 130 3 0 60 样本户奶制品年消费支出 4 110 80 5 15 100 6 10 55 7 40 160 8 80 85 9 90 160 10 0 170
如果估计满意度会在90%左右呢?
t 2 PQ (1.96) 2 0.9 0.1 n0 2 35 2 d (0.1)
t 2Q (1.96) 2 0.1 n0 2 427 2 r P (0.1) 0.9
n0 427 n 374 n0 1 427 1 1 1 3000 N
s32 8205.556
2 s4 193.333
W4
N 4 1500 0.52632 N 2850
f4
n4 10 0.0067 N4 1500
ˆ N y Y h h
h 1
4
200 39.5 400 105 750 165 1500 24
2 2 2 1 fh 2 8 ˆ v Y N Wh v yh N h sh 5.93 10 nh h 1 h 1

209650
4
4
ˆ v Y ˆ 23208 s Y

ˆ ts Y

ˆ 209650 2 23208 Y
ˆ N y Y h h
例子
• 要对一个稀有事件进行调查,根据经验P应 该在万分之一左右,要求在95%的置信度 下,在相对误差为40%下,确定抽到m等于 多少时停止抽样,并且请估计平均样本量 会是多少?
r Cv( p) 0.2 t
m Cv( p) m 1
所以m=26
m E (n) 260000 P
序号
i
1 4
2 5
3 2
4 0
5 4
6 6
7 6
8 15
9 0Leabharlann 10 8yi1 n 50 y yi 5 n i 1 10
1 n 172 2 s ( y y ) 19.1111 i n 1 i 1 9
2
1 f 2 1 0.1 ˆ vY s 19.1111 1.72 n 10
例子
• 从杭州市中随机抽取200人,调查这些人对 杭州市环境的满意度,有130人表示满意。 要估计市民满意度在95%置信度下的置信 区间和绝对误差。
1、比率估计量
【例1】对浙江省居民的人均月消费进行调查,用简单随机 抽样抽取n=6户的样本,Xi表示每户的人口,Yi表示户每月
消费,请估计浙江省居民的人均月消费。
1 f 1 v p pq 0.65 0.35 0.001143 n 1 200 1
a 130 p 65% n 200
s p v p 0.0338
0.65 1.96 0.0338
• 95%近似置信区间为〔 58.37%,71.63% 〕
t 1.96 2 n0 ( ) 2 C 2 ( ) (0.68) 2 177 .6 178 r 0.1
n
n0 178 63.9 64 n0 1 1.78 1 N
例子
• 某公司要了解全部3000家客户的满意度信息。 要求以95%的把握保证绝对误差在10%以内。 应该调查多少个样本?
实际中对于样本量较小的情形, 使用比率估计量时不能忽视其偏倚。
ˆ v(Y ˆ ) 585921 s Y

例子
• 我们从某个N=100的总体中抽出一个大小 为n=10的简单随机样本,要估计总体平均 水平并给出置信度为95%的区间估计。如 果要求以95%的把握保证绝对误差不超过1, 样本量为多少?
ˆ vY ˆ 1.3115 sY

ˆ Y y 5

• 由置信度95%对应的t 1.96 ,因此,可95% 的把握说总体平均水平大约在 5 1.96 1.3115 之间,即2.4295和7.5705之间。
例子
• 我们从某个N=100的总体中抽出一个大小 为n=10的简单随机样本,要估计总体平均 水平并给出置信度为95%的区间估计。如 表:
3
4
750
1500
180
50
260
35
110
15
0
0
140
20
60
30
200
25
180
10
300
30
220
25
N1 200 N 2850 W1 0.07018 N 2850 n1 10 f1 0.05 nh 10 N1 200 n1 n1 1 2 2 1 y1i y1 1624.722 y1 y1i 39.5 s1 n1 1 i 1 n i 1
序号1 yi 4 2 5 3 2 简单随机样本的指标值 4 5 6 7 2 3 4 5 8 4 9 13 10 6
y 4.8
10 1 2 2 s ( yi y ) 9.96 10 i 1
1 f 2 s ( y ) v( y ) s 0.95 n
d u s( y) 1.96 0.95 1.86
所以置信区间为( 2.94, 6.66 )
t 2 s 2 (1.96) 2 9.96 n0 2 38.3 39 d 1 n 39 n 0 28.1 29 n0 1 0.39 1 N
如果要求以95%的把握保证绝对误差不超过 10%,样本量为多少?
C s 9.96 0.68 y 4.8
1

N 400 W2 2 0.14035 N 2850
f2
f3
n2 10 0.025 N 2 400
y2 105
2 s2 2166.667
N 750 W3 3 0.26316 N 2850
n3 10 0.0133 N3 750
y3 165
y4 24
t PQ (1.96) 0.5 0.5 n0 2 96 2 d (0.1)
2 2
如果相对误差在10%以内呢?
t Q (1.96) 0.5 n0 2 384 2 r P (0.1) 0.5
2 2
n0 384 n 340 n 1 384 1 1 1 0 3000 N
1 2 1 3 3 4 5 5 8 6 10 平均值 4.5
Xi
0
Yi
1
3
11
18
29
46
18
注意:这里Yi是要研究的变量,Xi是已知的辅助变量。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
样本 1,2 1,3 1,4 1,5 1,6 2,3 2,4 2,5 2,6 3,4 3,5 3,6 4,5 4,6 5,6
【例2.1】 • 设总体有5个单元(1、2、3、 4 、5),按 放回简单随机抽样的方式抽取 2个单元,则 所有可能的样本为 25 个(考虑样本单元的 顺序):
1, 1 2, 1 3, 1 4, 1 5, 1
1, 2
1, 3 1, 4 1, 5
2, 2
2, 3 2, 4 2, 5
3, 2
3, 3 3, 4 3, 5
y yR X x
y x
i i
X
1 15 E ( yR ) yRi 17.686 15 i 1
1 15 2 V ( yR ) yRi E ( yR ) 2.82 15 i 1
1 15 E ( y ) yi 18 15 i 1
1 15 2 V ( y ) yi E ( y ) 97.87 15 i 1
序号1 yi 4 2 5 3 2 简单随机样本的指标值 4 5 6 7 2 3 4 5 8 4 9 13 10 6
【例2.4】
• 续例2.3。估计总体总量,并给出在置信度95%的条件下, 估计的极限相对误差。
ˆ 100 5 500 Y
ˆ 的极限相对误差为: • 在置信度95%下,Y
1 0.1 2 ˆ v Y 100 19.1111 17200 10
简单估计 2 6 9.5 15 23.5 7 10.5 16 24.5 14.5 20 28.5 23.5 32 37.5
比估计 18 18 17.1 16.875 21.15 15.75 15.75 16 20 16.3 16.36 19.73 16.27 19.2 18.75
2 样本总数为 C6 15
i
2
1500
50
7
1823
150
3
4 5
1005
376 600
50
10 20
8
9 10
1450
158 1370
80
20 50
• 该县船舶在调查月完成货运量的比率估计为
ˆ y X 1123.2 154626 2671937 Y R x 65
11 ˆ N 2 (1 f ) s 2 R ˆ 2 2 ˆ v Y 2 Rs 2.10617 10 s R y x yx
h 1
4
200 39.5 400 105 750 165 1500 24
2 2 2 1 fh 2 8 ˆ v Y N Wh v yh N h sh 5.93 10 nh h 1 h 1
相关主题