当前位置:
文档之家› 《统计学》第七章(抽样调查)
《统计学》第七章(抽样调查)
N1 p = N
N代表总体单位数;
N 0 Q = N
N1代表具有某一种表现的总体单位数; No代表具有另一种表现的总体单位数; P、Q代表成数。
11
Q N
1
+ N
0
= N N + N N = 1
∴ P + Q 则 Q
=
1
0
= 1 − P
12
〔例1〕 某公司生产的10000件产品中,有500件 为不合格品。则 产品不合格率 P= N 1 /N=500/10000=5.0% 产品合格率 Q=1—P=1-5.0%=95%
µ
p
=
p
×
(1 − n 0 . 95
p )
=
0 . 05 × 1000
=
0 . 69
%
37
按不重复抽样计算:
µ
p
=
p × (1 − p ) n (1 − ) n N
=
0 . 05 × 0 . 95 1000 × (1 − 1000 10000
)
= 0 . 65 %
38
(三)极限误差 极限误差是指抽样推断中依一定的概率保证下的误 差的最大范围。 1.抽样平均数的极限误差:
= 95 %
19
(3)抽样总体标准差和抽样总体方差。 说明抽样总体之间标志值变异程度的指标,叫做抽样 总体标准差。抽样总体标准差的平方称为抽样总体方 差(简称样本方差)。其计算公式为:
s =
∑
(x
− n
x
)
2
s
2
=
∑
(x
− n
x
)
2
20
一个总体可以抽取许多个样本,而样本不同, 抽样指标的数值也各不相同。可见,抽样指标的数 值不是惟一确定的。因为抽样指标是样本变量的函数, 是随机可变的变量。也就是说,由 样本观测值所决定的 统计量是随机变量。
49
例3,某单位从全部职工中随机抽取196名进行调查,得知 全年平均收入为8600元,标准差为840元。其中,有存款的职工 为147人。要求在95.45%的概率保证程度下,分别对全部职工每 人年平均收入和存款职工比重进行区间估计。 解:由于没有全及总体(N)的资料,只能用重复抽样计 算 1 u (1)ux=840/(196)1/2=60 ∆x=2*60=120 8480~8720 (2) up=3.1% ∆p=6.2% 68.8%~81.2%
47
(二)区间估计的两种模式:
1.根据给定的抽样极限误差范围
∆ X ,求出相应的可信度F(t)
2.根据给定的可信度F(t),求出相应的抽样极限误差范围 ∆ X
48
例1,已知:x=80,δ2=40,n=10,P(t)=0.95,在重复条件下对总体平 均数进行估计。 解:u=2 t=1.96 ∆=tu=3.92 x-∆<X<x+∆, 80-3.92<X<80+3.92 点估计:总体平均数为80 区间估计:以95%的概率保证总体平均数在76.08-83.92之间 例2,已知:x=80,δ2=40,n=10, ∆=4,在重复条件下对总体平均数进 行估计。 解:u=2 ,t= ∆/u=2 点估计:总体平均数为80 区间估计:以95.45%的概率保证总体平均数在76-84之间
解:
µ
∆
x
=
s n 480
=
50 25 500
=
10
t =
µ
p ( F
x x
=
- 10
=
2
∴ =
500
−
20
≤
X
≤
500
+
20
)
45
( 2 )=
0 . 9545
三、影响抽样误差的因素
(一)抽样单位数目的多少
(二)总体被研究的标志的变异程度
(三)抽样方法
(四)组织形式的不同
46
四、抽样估计 (一)点估计和区间估计。 点估计也叫定值估计,它是以抽样得到的样本指 标作为总体指标的估计值。 区间估计是根据一定的精确度和可靠程度的要求, 用样本指标和抽样误差去推断总体指标的可能范围 的一种估计方法。
∆ x x
t
=
µ
;
t
=
∆
p p
µ
42
抽样极限误差也可以表示为抽样平均误差的若干倍,其 倍数即概率度t:
∆ x =
x − X
= t µ x
= t
2 σ n
= t
σ
n
43
同理:
∆ p = p − P = t µ p P (1 − P ) n
44
= t
〔例5.5〕某农场种植小麦5000亩,收获前夕随机抽取 25亩进行实割实测,测得平均亩产500千克,标准差为 50千克,试求全部5000亩小麦的平均亩产在480千克至 520千克之间的概率。
32
在重复抽样条件下,其计算公式为:
µ
p
=
p × (1 − n
p )
在不重复抽样条件下,其计算公式为:
µ
p
=
p × (1 − n
p )
N ( N
− n ) − 1
33
当N很大时,以N代替N—1,则可简化为:
µp =
p × (1 − p ) n (1 − ) n N
34
[例3〕某公司生产一批灯泡,共1000只,从中随机抽取 100只,测其寿命平均为1000小时,样本标准差为60小时, 计算其抽样误差。 按重复抽样计算:
µ
x
=
σ
n
2
(1 −
n N
)
31
2.成数的平均误差 统计成数(比重)是一种结构相对数,它实际属于是非
标志平均数的特例。统计上习惯以1表示“是”,以0表 示“非”。p为1的概率,q=1—p为0的概率。成数的方差是
P(1-P)其特点为,最大值为0.25(0.5×0.5),即当两种表现
的总体单位各占一半时,它的变异程度最大。
21
(三)重复抽样和不重复抽样 1.重复抽样(重置抽样) 采用这种方法抽取样本单位的特点是:同一单位 有多次重复被抽中的机会,并且总体单位数目始 终不变,每个单位抽中或抽不中的机会在各次都 是相同的。
22
2.不重复抽样(不重置抽样)
采用这种方法抽取样本单位的特点是:同一单位 只有一次被抽中的机会,并且总体单位数目随着 样本单位数目抽取的次数的增多而愈变愈少。每 个单位抽中或抽不中的机会在各次是不同的。
第 七 章
抽 样 调 查
第一节 抽样调查概述
第二节 抽样估计 第三节 抽样的组织形式
1
第一节 抽样调查概述 一、抽样调查的含义 (一)抽样推断的含义 抽样调查是按随机原则,从全部研究对象中抽取一 部分单位进行观察,并根据样本的实际数据,对总体的 数量特征做出具有一定可靠程度的估计和判断,从而达 到对全部研究对象的认识的一种统计方法。其中心问题 是如何根据已知的部分资料来推断未知的总体情况。
µ
x=s 2 n Nhomakorabea=
60 100
2
= (小时) 6
35
按不重复抽样计算:
µ
x
=
s n 60 100
2
2
( 1
−
n N
)
= =
( 1
−
100 1000
)
5
. 69
( 小时)
36
〔例5.4〕 某公司有员工10000人,从中随机抽选1000 人调查电脑的拥有率,发现50家有,问这一调查的抽样 误差为多少? 解:p=50/1000=0.05 按重复抽样计算:
6
2.抽样总体(样本、子样) 是指在总体中按随机原则抽取的那一部分 单位所构成的集合体。 组成样本的单位称为样本单位,样本单位数亦称样本 容量,通常用n表示。样本单位数总是大于1而小于总体单 位数N的,即1<n<N。
7
样本单位数n相对于总体的单位数N要小得多。 统计把n/N称为抽样比例。样本单位数达到或超过 30个(n≥30)称为大样本,而在30个以下(n<30)称为 小样本。社会经济现象的抽样调查多取大样本,而自然实 验观察则多取小样本。以很小的样本来推断很大的总体, 这是抽样推断法的重要特点。
4
三、抽样推断的作用 (一)解决了无法进行全面调查或很难进行 全面调查的问题 (二)可以补充或修正全面调查的数据
(三)可以节省调查费用和调查时间
5
四、抽样推断涉及的基本概念 (一)总体和样本 1.全及总体(总体、母体) 它是指调查对象的全部单位,是由具有某种共同性 质的许多单位组成的。组成总体的单位称为总体单 位,总体的单位数通常用N表示。
n1 p= n
n0 q = n
17
同总体成数
n
1
+ +
n
0
= =
n ( n + n n ) = 1
p
q
1
0
则
q = 1-
p
18
[例5.2) 从某公司生产的产品中,抽样检查了 100件产品,其中有5件不合格,则: 样本产品不合格率 :
p
=
n n
1
=
5 100
=
5 %
样本产品合格率
q = 1 − p = 1 − 5%
27
(二)抽样平均误差的计算 1.抽样平均数的平均误差 (1)在重复抽样的条件下总体方差已知,样本平均 数服从正态分布,其抽样平均数的平均误差计算公式为:
µ
x
=
σ
n
2
=
σ
n
28
由上式可以看出,抽样平均数的平均误差就是抽样平 抽样平均数的平均误差就是抽样平