第7章 抽样调查
解: 250000;n 6400; x 20h; 8h;F (t ) 95.45% t 2; N
n / N 6400 / 25000 2.56% 5% 重复抽样 8 0.1(h) (3)' 0.16h (1) x n 6400 x
2013-3-7
2
第一节 抽样调查的概述
随机抽取
总体
说明 总体指标数值
样本 计算
X
2
推算
样本指标数值 2 x S
特点
1)随机原则 2)根据部分推断总体 3)抽样误差可以事先计算并加以控制
2013-3-7
3
抽样推断的流程:
一、抽选样本 二、计算样本指标/抽样指标 1、平均数 / 成数 x
2013-3-7
9
第三节 抽样误差
影响抽样误差的因素:
1) 2) 3) 4)
抽 样 单 位 数 总体的变异程度
抽
样
方
法
抽样组织形式
2013-3-7
10
第三节 抽样误差
正态分布概率简表 概率度t
0.50 1.00 1.64 1.96 2.00 3.00 4.00 38.29 68.27 90.00 95.00 95.45 99.73 99.99
t:概率度
2013-3-7
8
第四节 抽样调查的组织形式 P181
√
1、简单随机抽样:直接从总体中抽取调查单位的抽 样调查方式。一般先进行编码,然后随机抽取。 2、机械抽样:先将总体单位按某一标志排序,然后 按照固定的顺序和相同的间隔来抽选样本单位的组织 方式。 3、类型抽样:将总体单位先按一定标志分组,然后 在各组中随机抽取样本的组织方式,以保证样本对总 体具有更高的代表性 4、整群抽样:将总体划分为若干个群(区域),然后以 群为单位从中随机抽取部分群,最后对中选 群中的所 有单位进行全面调查的组织方式。
4 10 16 12 8 50
2 484 1936 55 t 220 x-22 1.65 3.30(件) x 65 144 1440 650 -12 (5 1200 -2 75 ) x x X x x 4 64 85 64 768 8 1020 77 760 18 3 2592 95 3.30 X 77324.30 — — 6800 3850 73.70 X— 80.30(件)
2013-3-7
可靠程度
概率保证程度F(t) (%)
11
[例] 某冰箱厂对250000台冰箱进行质量抽查,随机抽查6400台, 测得冰箱停电保温时间平均为20h,标准差为8h,其中有400台 不合格,试按照95.45%的可靠性计算:(1)全部250000台冰箱每 台平均停电保温时间;(2)全部250000台冰箱的合格率范围;(3) 若要求均值的允许误差不超过0.16h,至少应抽查多少台?
2、某工厂有2000个工人,用简单随机重复抽样的方 P 计算流程:p p p 解:N 2000 n 50; 法抽出50个工人作为样本,调查其产量水平,如下 ; n1 50 4 月产量/件 人数 (1) p 92 % 50 n 4 60以下 用p代替P p(1 p) 92%(1 92%) 60-70 10 (2) p 3.84 % 70-80 16 50 n
f
50
2013-3-7
15
2、某工厂有2000个工人,用简单随机重复抽样的方 P 计算流程:p p p 解:N 2000 n 50; 法抽出50个工人作为样本,调查其产量水平,如下 ; n1 50 4 月产量/件 人数 (1) p 92 % 50 n 4 60以下 用p代替P p(1 p) 92%(1 92%) 60-70 10 (2) p 3.84 % 70-80 16 50 n
2
xf x x x x x x
n
2
2
f
1)以95.45%的概率保证程度估计该厂工人的月平均产量
计算流程: S x x x X x
xf 3850 解:N 2000; (1) x 77 (件) f 50 n 50; ( x x) 2 f 6800 2 (2)S x 13614 50 f
第五节 必要抽样单位数n的确定
简单随机抽样单位数的计算公式
2013-3-7
18
[例:1] 对生产大型号的电池进行抽样调查,重复抽样得 1)电流强度的标准差为0.4安培,若要求抽样平均电流强 度的极限误差不超过0.07安培,则至少要抽取多少节电池 2)合格品率为95%,若要求抽样合格率的极限误差不超 过5%,则至少要抽取多少节电池。 3)若要同时满足① ②极限误差的要求,则应取多少节电 池(以95.45%的可靠性计算)
2013-3-7
7
第三节 抽样误差
三、抽样极限误差
样本指标与总体指标之间的误差的可能范围 x X x x x X x x 无法直接得到 p P p p p P p p
抽样极限误差与抽样平均误差的关系:
t
x t x
p t p
2
xf x x x x x x
n
2
2
f
1)以95.45%的概率保证程度估计该厂工人的月平均产量
计算流程: S x x x X x 及总产量。 总产量=平均产量×总人数
Xf 3850 73.70 N X N 80.30 N () 1X (件) f X50 77 2000 解: 2000; 73.70 2000 N 2 N 80.30 n 50; (2)147400 xX fN 160600(件) 2 ( x ) 6800 136 Sx
20 0.2 X 20 0.2
p p P p p
19.8 X 20.2(h)
93.75% 0.60% P 93.75% 0.60%
93.15% P 94.35% 12 2013-3-7
[例] 某冰箱厂对250000台冰箱进行质量抽查,随机抽查6400台, 测得冰箱停电保温时间平均为20h,标准差为8h,其中有400台 不合格,试按照95.45%的可靠性计算:(1)全部250000台冰箱每 台平均停电保温时间;(2)全部250000台冰箱的合格率范围;(3) 若要求均值的允许误差不超过0.16h,至少应抽查多少台?
解:1) 0.4安培; 0.07安培; x 2 2 t x 22 0.42 nx 130.61 取131节 2 2
2) p 95%; p 5%;
t 2 p(1 p) 22 95%(1 95%) np 76 (节) 2 2 0.05 p
80-90 90以上 合计 12 8 50
p t p 2 3.84% 7.68%
(4) p p P p p
2)若60件以下 为未达标,试以 92% 7.68% P 92% 7.68% 84.32% P 99.68% 95.45%的概率 2、达标人数 达标率 全部人数 保证程度估计 84.32%N PN 99.68%N 该厂工人的达 84.32% 2000 PN 99.68% 2000 标率及达标人数 1686.4 PN 1993.6(人) 2013-3-7 17
80-90 90以上 合计 12 8 50
p t p 2 3.84% 7.68%
(4) p p P p p
2)若60件以下 为未达标,试以 92% 7.68% P 92% 7.68% 84.32% P 99.68% 95.45%的概率 保证程度估计 该厂工人的达 标率。 2013-3-7 16
x x X x x
20 0.2 X 20 0.2
பைடு நூலகம்
x t x 2 0.1 0.2(h)
nx
t x
2
2
' 2 x
2 2 82 10000 (台) 2 0.16
19.8 X 20.2(h)
2013-3-7
13
2 2 1、某工厂有2000个工人,用简单随机重复抽样的方 2 136 用 1.65(件) S x 代替 x (3) x 法抽出50个工人作为样本,调查其产量水平,如下 50
可避免
计 系统性误差(偏差):由没有遵循随机原则造成 误 差 代表性 重点调查、典型调查
误差
抽样误差(随机误差):抽样调查
2013-3-7
5
第三节 抽样误差
二、抽样平均误差
是指抽样平均数(或成数)的标准差。反映了 抽样指标与全及指标之间的平均误差程度。
x
2
n
n
P
P(1 P) n
月产量/件
60以下 60-70 70-80 80-90 90以上 合计
f 人数 组中值 x
4 10 16 12 8 50
2 484 1936 55 t 220 x-22 1.65 3.30(件) x 65 144 1440 650 -12 (5 1200 -2 75 ) x x X x x 4 64 85 64 768 8 1020 77 760 18 3 2592 95 3.30 X 77324.30 — — 6800 3850 73.70 X— 80.30(件)
第7章 抽样调查
宁波大红鹰学院
2013-3-7
1
1、抽样调查的特点: 2、统计误差的分类、产生原因(区分方法) (哪些误差能避免): 3、影响抽样误差的因素: 4、重复和不重复抽样(抽样方法)的选择: 5、总体标准差或方差未知时的处理: 6、类型、整群、简单随机抽样的辨别: 7、全及总体(指标)与抽样总体(指标)的地 位关系: 8、计算总体平均数和总体成数(区间)