当前位置:文档之家› 抽样调查ppt

抽样调查ppt




L
例:对某地区进行家庭年收入调查,以居民户为抽样单元, 将居民户划分为城镇居民和农村居民两层,每层按简单随机 抽样抽取10户,调查获得如下数据(单位:万元)。试估计 该地区居民家庭总收入并求估计的标准差。
层 居民 户总 数 样本户家庭年收入 1 2 3 4 5 6 7 8 9 10
1
2
2、使估计量总方差达到最小 ……
3.1样本分配对精度与费用的影响
例 某个总体分为三层,其层权 Wh 及标准差 S h 见表。设总样本量为300, 考虑六种不同的样本分配,并计算出各种分配下,总体均值估计量的方 差和总费用

h
1 2 3
Wh
0.2 0.3 0.5
Sh
ch
9 4 16
2 Sh nh
常数分 配
ph qh
例 广告公司要调查某市电视观众看某一广告的人数比例,由于市区、近郊、 远郊的观众对广告的兴趣有差别,而且调查的费用也不同,因此分为三层。 调查数据如表所示:
层 市区 近郊 远郊 总体比例 0.5 0.2 0.3 样本量 200 80 120 观看广告 人数 160 40 30 比例 0.8 0.5 0.25
h 1 L
PhQh nh
证明:
2 L N 1 h N h nh P 2 h Qh V pst Wh V ph 2 N h 1 Nh 1 nh h 1 L 2 1 N h N h nh PhQh 2 Nh nh h 1 N L
Wh2 1 f h
h 1
C
n
h 1
L
h
ch
2900
3137
3300
2123
3440
2912
要求:1估计该市观看广告人数的比例,并以95%的置信度作出区间估计 2 假设该市共有观众50万人,现欲估计有多少人看了此广告,并计算置信 度为95%的置信区间 解:p W p 0.5 0.8 0.2 0.5 0.3 0.25 0.575 h h st
L pq 1 f v pst W ph qh Wh2 h h nh 1 nh 1 h 1 h 1 L 2 h
L
h 1
0.52 0.8 0.2 0.2 2 0.52 0.32 0.25 0.75 199 79 119 0.00047
s pst v pst 0.0217
以95%的置信度认为该市观看了此广告的观众比例为 pst ts pst 0.575 1.96 0.0217
在95%的置信度下,该市观看此广告的观众总人数为266250~308750 人。
第三节 样本量在各层的分配
V Y
V Y


2 N V Y h h
h 1
L

h
不仅与各层的方差V Y 有关,还与各层所分配的样本量 N
h
有关 不同的分配方法:
1、按各层单元数占总体单元数的比例分配
2 V Ast N h V ph h 1

L
性质2 Ast 是 A的无偏估计,且 对于分层随机抽样,
L L V Ast V Npst V N h ph N h2V ph h 1 h 1 2 L Nh N h nh PhQh Nh 1 nh h 1
2.2总体总量估计
• 定义
NY Y st
分层随机样本
Y h
h 1
L
Ny N y Y h h st
h 1
L
• 性质1
是 Y的无偏估计,则 Y 是 Y 的无偏估 对于一般分层抽样,如果 Y
计,且
L L 2 2 2 N V Y N V Y W V Y N V Y h h h h st 2 h 1 h 1
S

2 h

Wh
成正比
60 90 150 3.09
成正比
49 110 141 3.11
成反比
79 177 44 7.23
ch


Wh S h
Wh S h ch
成正比
40 90 170 3.00
成正比
40 134 126 3.30
20 30 34
L 2 h
100 100 100 3.86
v yst

W

• 性质3 V Ast 的一个无偏估计为 对于分层随机抽样,
2 N h N h nh ph qh 2 v Ast N h v ph N h 1 nh 1 h 1 h 1

L h 1
L
L

N h N h nh nh 1
h 1
估计量方差及标准差的估计
N 2 1 fh s 2 v Y h h nh h 1
2

1 0.0167 1 0.0111 18.0 900 2 4.9 10 10 1029672.81 6002 v Y 1014.73 s Y


95%的置信度下,该地区居民家庭总收入为 ts Y 11190 1.96 1014.73 Y

即9201.1292万元~13178.8708万元
2.3总体比例估计
1 第i个单位具有所考虑的特征 Yi i=1,2,…N 0 其他
总体中具有某种特征的单元数所占的比例P的估 计为 L
h 1
L
PhQh nh
V ph
N h nh PhQh N h 1 nh
Nh 1 Nh
• 性质3
V pst 的一个无偏估计为 分层随机抽样中,
1 2 v pst Wh v ph 2 N h 1
L
L
2 Nh N h nh ph qh Nh 1 nh 1 h 1 L
2 1 N h N h nh ph qh 2 Nh nh 1 h 1 N
ph qh W 1 f h nh 1 h 1
2 h
L
2.4总体特征单元数估计
• 定义
设总体中具有某种特征的单元数为A,则
A Npst N h ph
h 1 L
• 性质1 Ast 是 对于一般的分层抽样,如果 ph是 Ph的无偏估计,则 A 的无偏估计。且
即53.25%~61.75% 2 观看此广告的总人数估计为 A Np 500000 0.575 287500
st st
Ast 的置信上限 AU NPU 500000 0.6175 308750
Ast 的置信下限 AL
NPL 500000 0.5325 266250




性质2
对于分层随机抽样
L 2 1 fh V Y N V Yh N h Sh2 nh h 1 h 1 L 2 h


• 性质3
的一个无偏估计为 V Y 分层随机抽样,
2 1 fh 2 v Y N v yh N h sh nh h 1 h 1 L 2 h
1 y1 n1 1 y2 n2
y
i 1 n2 i 1
பைடு நூலகம்
n1
1i
10.7 5.3
2
1 n1 2 s1 y1i y1 n1 1 i 1


2
18.0
2
y
2i
1 n2 s y2 i y2 n2 1 i 1
2 2


4.9
总收入估计 Y Nh yh 600 10.7 900 5.3 11190
600
900
10
5
8
7
12
3
9
4
6
5
20
8
8
2
12
4
7
6
15
9
N 1500 nh 10
N1 600 0.4 N 1500 N 2 900 W2 0.6 N 1500 W1
f1 f2 n1 10 0.0167 N1 600 n2 10 0.0111 N 2 900
pst Wh ph
h 1
• 性质1 对于一般的分层抽样,如果ph 是 Ph 的无偏估计,则 pst 是 P 的无偏估计。且
V pst Wh2V ph
h 1 L
• 性质2
分层随机抽样中,pst 是 P 的无偏估计。且
V pst Wh2 1 f h
相关主题