当前位置：文档之家› 《统计学》第七章(抽样调查)

《统计学》第七章(抽样调查)

N1 p = N
N代表总体单位数；
N 0 Q = N
N1代表具有某一种表现的总体单位数； No代表具有另一种表现的总体单位数； P、Q代表成数。
11
Q N
1
+ N
0
= N N + N N = 1
∴ P + Q 则 Q
=
1
0
= 1 − P
12
〔例1〕某公司生产的10000件产品中，有500件为不合格品。则产品不合格率 P＝ N 1 ／N＝500／10000＝5．0％产品合格率 Q＝1—P＝1－5．0％＝95％
µ
p
=
p
×
(1 − n 0 . 95
p )
=
0 . 05 × 1000
=
0 . 69
%
37
按不重复抽样计算：
µ
p
=
p × (1 − p ) n (1 − ) n N
=
0 . 05 × 0 . 95 1000 × (1 − 1000 10000
)
= 0 . 65 %
38
(三）极限误差极限误差是指抽样推断中依一定的概率保证下的误差的最大范围。 1.抽样平均数的极限误差：
= 95 %
19
(3)抽样总体标准差和抽样总体方差。说明抽样总体之间标志值变异程度的指标，叫做抽样总体标准差。抽样总体标准差的平方称为抽样总体方差（简称样本方差）。其计算公式为：
s =
∑
(x
− n
x
)
2
s
2
=
∑
(x
− n
x
)
2
20
一个总体可以抽取许多个样本，而样本不同，抽样指标的数值也各不相同。可见，抽样指标的数值不是惟一确定的。因为抽样指标是样本变量的函数，是随机可变的变量。也就是说，由样本观测值所决定的统计量是随机变量。
49
例3，某单位从全部职工中随机抽取196名进行调查，得知全年平均收入为8600元，标准差为840元。其中，有存款的职工为147人。要求在95.45%的概率保证程度下,分别对全部职工每人年平均收入和存款职工比重进行区间估计。解：由于没有全及总体（N）的资料，只能用重复抽样计算 1 u （1）ux=840/(196)1/2=60 ∆x=2*60=120 8480~8720 (2) up=3.1% ∆p=6.2% 68.8%~81.2%
47
（二）区间估计的两种模式：
1.根据给定的抽样极限误差范围
∆ X ，求出相应的可信度F(t)
2.根据给定的可信度F(t)，求出相应的抽样极限误差范围 ∆ X
48
例1，已知：x=80,δ2=40,n=10,P(t)=0.95,在重复条件下对总体平均数进行估计。解：u=2 t=1.96 ∆=tu=3.92 x-∆<X<x+∆, 80-3.92<X<80+3.92 点估计：总体平均数为80 区间估计：以95%的概率保证总体平均数在76.08-83.92之间例2,已知：x=80,δ2=40,n=10, ∆=4,在重复条件下对总体平均数进行估计。解:u=2 ,t= ∆/u=2 点估计：总体平均数为80 区间估计：以95.45%的概率保证总体平均数在76-84之间
解：
µ
∆
x
＝
s n 480
＝
50 25 500
＝
10
t ＝
µ
p （ F
x x
＝
－ 10
＝
2
∴ ＝
500
−
20
≤
X
≤
500
+
20
）
45
( 2 )＝
0 . 9545
三、影响抽样误差的因素
(一)抽样单位数目的多少
(二)总体被研究的标志的变异程度
(三)抽样方法
(四）组织形式的不同
46
四、抽样估计（一）点估计和区间估计。点估计也叫定值估计，它是以抽样得到的样本指标作为总体指标的估计值。区间估计是根据一定的精确度和可靠程度的要求，用样本指标和抽样误差去推断总体指标的可能范围的一种估计方法。
∆ x x
t
=
µ
;
t
=
∆
p p
µ
42
抽样极限误差也可以表示为抽样平均误差的若干倍，其倍数即概率度t：
∆ x =
x − X
= t µ x
= t
2 σ n
= t
σ
n
43
同理：
∆ p = p − P = t µ p P (1 − P ) n
44
= t
〔例5.5〕某农场种植小麦5000亩，收获前夕随机抽取 25亩进行实割实测，测得平均亩产500千克，标准差为 50千克，试求全部5000亩小麦的平均亩产在480千克至 520千克之间的概率。
32
在重复抽样条件下，其计算公式为：
µ
p
=
p × (1 − n
p )
在不重复抽样条件下，其计算公式为：
µ
p
=
p × (1 − n
p )
N ( N
− n ) − 1
33
当N很大时，以N代替N—1，则可简化为：
µp =
p × (1 − p ) n (1 − ) n N
34
[例3〕某公司生产一批灯泡，共1000只，从中随机抽取 100只，测其寿命平均为1000小时，样本标准差为60小时，计算其抽样误差。按重复抽样计算：
µ
x
=
σ
n
2
(1 −
n N
)
31
2．成数的平均误差统计成数(比重)是一种结构相对数，它实际属于是非
标志平均数的特例。统计上习惯以1表示“是”，以0表示“非”。p为1的概率，q＝1—p为0的概率。成数的方差是
P(1－P)其特点为，最大值为0．25(0.5×0.5)，即当两种表现
的总体单位各占一半时，它的变异程度最大。
21
(三)重复抽样和不重复抽样 1．重复抽样（重置抽样）采用这种方法抽取样本单位的特点是：同一单位有多次重复被抽中的机会，并且总体单位数目始终不变，每个单位抽中或抽不中的机会在各次都是相同的。
22
2．不重复抽样（不重置抽样）
采用这种方法抽取样本单位的特点是：同一单位只有一次被抽中的机会，并且总体单位数目随着样本单位数目抽取的次数的增多而愈变愈少。每个单位抽中或抽不中的机会在各次是不同的。
第七章
抽样调查
第一节抽样调查概述
第二节抽样估计第三节抽样的组织形式
1
第一节抽样调查概述一、抽样调查的含义 (一)抽样推断的含义抽样调查是按随机原则，从全部研究对象中抽取一部分单位进行观察，并根据样本的实际数据，对总体的数量特征做出具有一定可靠程度的估计和判断，从而达到对全部研究对象的认识的一种统计方法。其中心问题是如何根据已知的部分资料来推断未知的总体情况。
µ
x=s 2 n Nhomakorabea=
60 100
2
= （小时） 6
35
按不重复抽样计算：
µ
x
=
s n 60 100
2
2
( 1
−
n N
)
= =
( 1
−
100 1000
)
5
. 69
( 小时）
36
〔例5．4〕某公司有员工10000人，从中随机抽选1000 人调查电脑的拥有率，发现50家有，问这一调查的抽样误差为多少？解：p＝50／1000＝0.05 按重复抽样计算：
6
2．抽样总体（样本、子样）是指在总体中按随机原则抽取的那一部分单位所构成的集合体。组成样本的单位称为样本单位，样本单位数亦称样本容量，通常用n表示。样本单位数总是大于1而小于总体单位数N的，即1<n<N。
7
样本单位数n相对于总体的单位数N要小得多。统计把n／N称为抽样比例。样本单位数达到或超过 30个(n≥30)称为大样本，而在30个以下(n<30)称为小样本。社会经济现象的抽样调查多取大样本，而自然实验观察则多取小样本。以很小的样本来推断很大的总体，这是抽样推断法的重要特点。
4
三、抽样推断的作用 (一)解决了无法进行全面调查或很难进行全面调查的问题 (二)可以补充或修正全面调查的数据
(三)可以节省调查费用和调查时间
5
四、抽样推断涉及的基本概念 (一)总体和样本 1．全及总体（总体、母体）它是指调查对象的全部单位，是由具有某种共同性质的许多单位组成的。组成总体的单位称为总体单位，总体的单位数通常用N表示。
n1 p= n
n0 q = n
17
同总体成数
n
1
+ +
n
0
= =
n ( n + n n ) = 1
p
q
1
0
则
q ＝ 1－
p
18
[例5．2) 从某公司生产的产品中，抽样检查了 100件产品，其中有5件不合格，则：样本产品不合格率：
p
=
n n
1
=
5 100
=
5 %
样本产品合格率
q = 1 − p = 1 − 5%
27
(二)抽样平均误差的计算 1．抽样平均数的平均误差（1）在重复抽样的条件下总体方差已知，样本平均数服从正态分布，其抽样平均数的平均误差计算公式为：
µ
x
=
σ
n
2
=
σ
n
28
由上式可以看出，抽样平均数的平均误差就是抽样平抽样平均数的平均误差就是抽样平

e商务文档

《统计学》第七章(抽样调查)

相关文档推荐：