统计学原理
设样本中具有某一特征的单位数为n1 ,不具有 该特征的单位数为n0,n=n1+n0,则
n0 n1 p ,q , p q 1 n n
14
4.样本交替标志的方差和标准差
xf n 1 n 0 p x n f x x f 1 p n 0 p n 方差 n f
4.根据经验估计出来
32
四、抽样极限误差
1.抽样调查中,用样本指标推断总体指标所允许的 误差的最大值,用△表示,也称为抽样允许误差 范围 2.度量了抽样推断的误差范围 3.抽样极限误差与抽样推断的精度成反比 4.有平均数的极限误差 x 和成数的极限误差 p
5.
x X x, p P p
第七章
本章要点……
抽样调查
1.抽样调查中的基本概念 2.各种抽样误差的含义和计算方法
3.抽样调查的组织方式
4.抽样推断过程
5.必要样本单位数目的确定
1
生活中这种“统计分析”案例举不胜举
2
第一节 抽样调查中的基本概念
一、抽样调查的概念
二、抽样调查的特点 三、抽样调查的应用范围 四、抽样调查的几个基本概念
9
样本
(三)全及指标
1.全及平均数(总体平均数):总体单位某一数量标志值 的算术平均值,是唯一的、确定的,但事先未知的。
X
X 或X
N
Xf f
( X X)f f
2
10
2.全及标准差(总体标准差):总体单位某一数量标志值 偏离平均值的离散程度。是唯一的、确定的,但事先未知 的
1.需要全面统计资料而无法进行全面调查时
2.可以进行全面调查,但费用与时间过大 3.可以补充和修正全面调查的结果 4.可用于生产过程中的质量控制 5.可以分析社会经济现象中出现的新情况、
新事物
6
四、几个基本概念
1.全及总体(总体) 2.抽样总体(样本) 3.全及指标(总体指标) 4.抽样指标(样本指标) 5.抽样框 6.抽样单元 7.抽样比
1.总体单位标志值的差异程度(总体标准差б) 2.样本容量的大小 3.抽样方法 抽样平均误差与总体方差成正比,与样本容 量成反比,重复抽样的平均误差大于非重复抽样 的平均误差
总体内部 差异 影响抽样平均 误差的因素 样本容量 抽样方法
23
1、244页上的四名同学的成绩:65、60、70、85 分,其平均成绩是70分----总体平均数。 2、采用重复抽样每次抽取两名同学,一共能够组 成16个样本。可计算16个样本平均数x。 3、16个样本平均数的平均数等于总体平均数: 1120/16 = 70。 4、(x – X )每个样本的抽样误差,是随机变量。 而Σ(x – X )=0 就是311页第5列的合计 5、因而,要计算抽样平均误差必须采用标准差的 方法。 6、246页若是采用不重复抽样,也是每次抽取2名 可抽到12个样本。其样本平均数的平均数,同样 是总体平均数:840/12 = 70
1 0 2 2 2 1
0
p (1 p ) 标准差 p (1 p )
15
(五)抽样单元、抽样框、抽样比
1.抽样单元:根据需要对总体单位进行的 分组或分类,每一组或一类成为一个抽 样单元
2.抽样框:所有抽样单元组成的框架范围
3.抽样比:样本单位占总体单位的百分比
16
(六)抽样方法
1.重复抽样(又称重置抽样、有放回抽样):
(1)对抽出的个体记录以后,放回到原总体中 (2)总体中的个体单位数在抽样过程中保持不变 (3)有可能抽到相同的(此前已经抽到过的)个体 (4)误差相对较大,推断不够精确
2. 不重复抽样(又称不重置抽样、无放回抽样):
(1)抽出的个体记录以后,不再放回到原总体中 (2)总体中的单位数在抽样过程中不断减少 (3)不可能抽到相同(此前抽取过)的个体 (4)误差相对较小,推断相对精确
( X X)或
2
N
3.全及比例(总体比例):总体中具有某一特征 的单位数占全部单位总数的比重,也称为成数, 用P表示。 设总体中具有某一特征的单位数为N1 ,不具有该 特征的单位数为N0,N=N1+N0,则
N0 N1 P ,q , P q 1 N N
11
4.交替标志的方差和标准差
33
6.极限误差是平均误差的t倍,t 是概率度。
第三节
抽样推断(估计)
一、抽样估计的概率度和可靠度
二、抽样估计的方法 三、全及指标的推算
34
一、抽样估计的概率度和可靠度
1.概率度:抽样极限误差与抽样平均误差之比, 用t表示,说明极限误差是平均误差的倍数。 对抽样平均数而言, t
x
x
对抽样成数而言,
Xf N 1 N 0 P X N f X X f 1 P N 0 P 方差 N f
1 0 2 2 1
2
N0
P (1 P ) 标准差 P (1 P )
12
(四)抽样指标(样本指标)
1.抽样平均数(样本平均数):样本单位某一数量标志值 的算术平均值,是随机的,不唯一、不确定。
使用时间 (小时) 900以下 900—950 950—1000
样本数(个) 2 4 11
使用时间 (小时) 1050—1100 1100—1150 1150—1200
样本数(个) 84 18 7
1000—1050 合计
71
1200以上
3 200
28
分别按重复抽样和不重复抽样计算抽样平均 误差
根据上述资料,可算出3、抽样调查的概念1.是专门组织的非全面调查
2.按随机性原则从总体中抽取个体单位 3.根据样本的调查结果推断总体相应特征
4.是统计推断的基本方法
4
二、抽样调查的特点
1.遵循随机性原则抽取调查单位
2.根据样本推断总体
3.产生以抽样误差为主的调查误差 4.抽样误差可以事先计算并加以控制
5
三、抽样调查的应用范围
25
(三)重复抽样的抽样平均误差
1.平均数的抽样平均误差的计算
x
2
n
n
, 为总体标准差
2.成数的抽样平均误差的计算
p
P (1 P ) ,P为总体成数 n
26
(四)非重复抽样抽样平均误差的计算
1.平均数的抽样平均误差的计算
x
2
n 1 n N
,为总体标准差
17
(七)抽样调查理论依据
1.大数定律 2.中心极限定理
在随机抽样条件下,随样本容量 n 的不断增加,样本 指标与总体指标之间的离差趋于零. 一个均匀的硬币,有图案与币值两面。抛一次就有两种
结果。抛的次数较少情况下,两种结果出现的比率差别较
大。但抛的次数越多,两种结果的比率越接近或等于50%
18
19
n 4
39
s
x x
n 1
2
1502 1493 2 1453 1493 2 1367 1493 2 1650 1493 2
4 1
118 .61(小时)
所以,该批灯泡的平均使用寿命是1493小时, 标准差是118.61小时。 而我们都知道,该批灯泡的平均使用寿命不会恰 好就是1493小时,只是在1495小时“左右”。点估 计无法告诉我们,这个“左右”的范围与在这个范 围的可能性有多大。
200
2
3.7922 (小时)
样本合格率与总体真实合格率的平均误差
P(1 P) 0.915 0.085 p n 200 1.972 %
30
2.不重复抽样抽样平均误差的计算
n x 1 n N 3.7541(小时)
2
53.63 1 2%
t
p
p
35
二、可靠度
1.说明抽样估计结果的可信程度 2.也是推断总体指标落在,以样本指标为中心的 一定区间内的概率保证程度 3.是大于0小于1的百分数,用F(t)表示。
4.是概率度的函数,同概率度具有一一对应关系
t 概率度 1.00 1.65 2.00 3.00 F(t) 概率保证程度 % 68.27 90.00 95.45 99.73
38
2.
用样本指标 替代总体指 标估计总体 标志总量 用样本成数 代替总体成 数估计总体 的部分单位 数
3.
例题
某企业对所生产的灯泡进行寿命测试,随机 抽取4只灯泡,测得寿命(单位:小时)分别为: 1502,1453,1367,1650,试估计该批灯泡的平 均使用寿命和灯泡寿命的标准差。 由于
x 1502 1452 1367 1650 1493 (小时) x
24
(二)抽样平均误差的计算
1. 抽样平均误差与抽样的组织方式和抽样方法 有关,这里仅介绍简单随机抽样条件下的重复抽 样和非重复抽样的抽样平均误差的计算。 2.抽样平均误差又分为平均数的抽样平均误差 和成数的抽样平均误差 3.教材245页重复抽样、246页非重复抽样的抽 样平均误差仅是“理论公式”。在实际工作中使 用……
7
(一)全及总体
1.是所要研究对象的全体 2.是客观存在的,由许多性质相同的基本单位 组成的整体,就是统计总体 3.一般用N表示总体中包含的基本单位数,X表 示总体单位的某个数量标志值。 4. 称:N为总体单位总数 X为总体单位标志值 5.总体具有唯一性和确定性
这是唯 一的
8
(二)抽样总体
1.按随机性原则从总体中抽取的若干个个 体组成的总体,又称为样本 2.是抽样推断的基础 3.样本含有的单位数用n表示,样本单位 的某个数量标志值用x表示, 4.称: n为样本容量、x为样本观察值 5.样本具有随机性、多样性、偶然性