当前位置:文档之家› 统计学 第八章 抽样调查

统计学 第八章 抽样调查

25个样本的日工资平均数计算表 样本变量 34 38 42 46 50 34 34 36 38 40 42 38 36 38 40 42 44 42 38 40 42 44 46 46 40 42 44 46 48 50 42 44 46 50 50
20
一、重复(置)抽样分布
样本日平均工资 频数 1 2 3 4 5 4 频率 1/25 2/25 3/25 4/25 5/25 4/25
2.抽样平均数的标准差又称为抽样平均误差或抽 样标准误差,重复抽样的抽样平均误差等于总体标 准差除以样本单位数的平方根。即:
(X )
2 ( X X )
M

2 ( X )
M


n

2
n

32 4元 2
24
样本平均数的分布与总体分布的比较
总体分布
% 20
样本平均数的分布
X

n
修正因子
(
N 1
)
n
(1
N
)
30
二、不重复(置)抽样分布
(二)抽样成数的分布
E ( p) P
XP P
P(1 P) N n ( ) P ( ) E pp n N 1 P(1 P) n (1 ) n N
31
例8-7:要估计某地区10000名适龄儿童的入学率,
总体容量N=10000 样本单位数n=100 样本均值(平均耐用时间) x=1055小
时,样本成数(合格率) p=91%
依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
10
五、样本统计量的计算 公式
•样本均值 :
在样本资料未分组的情况下:
x
x
i 1
n
i
n
k i i

x
n
在样本资料分组的情况下: x
32
抽样平均误差公式汇编
重复抽样 不重复抽样

n
样本平均 数的抽样 ( X ) 误差 样本成数 的抽样误 差

2
n

X
2
n (1 ) n N
p
P(1 P) n
P(1 P) n p (1 ) n N
33
三、抽样误差的种类
5/25 4/25 3/25
10
2/25 1/25
0 34 38 42
46
50
X
34 36 38 40 42 44 46 48 50
42元 2 32元2
原来如此
E ( X ) 42元
(X )
2
32 16元2 n 2
2
25
一、重复(置)抽样分布
从以上结论可知,(1)抽样平均误差比总体标准差 小得多,仅为总体标准差的
0-1变量 概率
0 1-P
1 P
X P E( X P ) 0 (1 P) 1 P P
2 ( P) (1 P)2 p (0 P)2 (1 P) P(1 P)
27
一、重复(置)抽样分布
现在从总体中用重复抽样方法抽取n个单位组成
样本,计算样本成数p,样本成数的分布实质上
六、抽样方法与样本可能数 目
• 样本可能数目:是指从总体中可能抽取的样本的最
多数目,抽样数目大小与抽样方法有关。
重复抽样时的样本可能数目是一个可重复的排列数:
A N
n N
n
例8-2:从0-9的10个数中随机重复抽选6个数字组成电话 号码,共能组成多少个电话号码?
A N 10 100万
从理论上讲,有些现象虽然可以进行全面调查,但实际上没有 例如: 必要或很难办到,也要采用抽样调查。 对无限总体不能采用全面调查。 抽样调查的结果可以对全面调查的结果进行检查和修正 另外,有些产品的质量检查具有破坏性,不可能进行 抽样调查可以用于工业生产过程的质量控制。 全面调查,只能采用抽样调查。 利用抽样调查原理,可以对某些总体的假设进行检验,来判别 这种假设的真伪,以决定行动的取舍。
n N n N
例8-4:从小组10位学生中不重复随机抽选3个组成 样本,考查其平均成绩,可能的样本数目为:
C
3 10
10 9 8 720 120种 3 2 1 6
15
第二节
抽样分布
16
第二节
抽样分布
• 抽样分布:样本统计量的概率分布。 • 样本统计量是随机变量。 • 统计量的取值不但和样本容量有关,还和抽 样方法有关。下面我们讨论简单随机样本的 抽样分布。
17
第二节
抽样分布
一、重复(置)抽样分布 (一)样本平均数的分布 (二)抽样成数的分布 二、不重复(置)抽样分布 (一)样本平均数的分布
(二)抽样成数的分布
三、抽样误差的种类
四、关于正态分布的定理
18
一、重复(置)抽样分布
(一)样本平均数的分布
样本平均数的分布由所有可能样本的平均数取值和相应 的概率组成。 例8-5:某施工班组5个工人的日工资分别为:34、38、 42、46、50元。则总体工人日工资平均数和方差分别为 : X
6
四、基本概念(概念要点)
全及总体(Population):所要研究的事物的全体构成的总体 样本(Sample):从全及总体中所抽取的部分单位组成的总体,
又称抽样总体;
总体参数(Population parameter):是在理论上可以从整个 总体中计算出来的总体指标。 样本统计量(Sample statistic):是根据样本观察值计算出 来的样本指标。
就是(0,1)变量的样本平均数的分布:
E ( p) P
p
2 ( P)
n

P(1 P) n
28
一、重复(置)抽样分布
例8-6:已知某批零件的优等品率为80%,现用
重复抽样方法从中抽取100件,求样本优等品率
的抽样平均误差。
P(1 P) 0.8 0.2 p 4% n 100
29
二、不重复(置)抽样分布
(一)样本平均数的分布 1.不重复抽样的样本平均数的数学期望等于总体平 均数,即:
E( X )
2.不重复抽样的抽样平均误差等于重复抽样的抽 样平均误差乘以修正因子,即: N n
N 1
32 5 2 x2 ( ) 2 12 3.464元 N 2n 5 1 n

2
N

34 38 42 46 50 42元 5
2 2 2
2
X X 34 42 38 42 46 42 50 42 N 5
2
32元2
19
一、重复(置)抽样分布
现用重复抽样方法从5人中随机抽取2人组成样本 ,样本可能数目为52 = 25个。各样本的日平均工 资计算结果如下:
随机抽取
计 算
计 算
总体参数
X P σ
统计推断
样本统计量
x p s
总体参数一般是未知的
样本统计量的值是可知的 9
四、基本概念(举例)
【 例 8-1】 对 一批某种型号 的 电 子 元 件 10000 只进行耐 用时间检查, 随机抽取100只, 测试的平均耐 用 时 间 为 1055 小时,合格率 为91%。
3
一、什么是抽样调查
抽样调查:按随机原则从总体中抽取一部分 单位进行调查,根据样本资料计算样本的特征 值,然后以样本的特征值,对总体的特征值做 出具有一定可靠性的估计和判断,以反映总体 的数量特征的一种统计方法。
随机原则:即是在抽取样本时,排除人们 主观意图的作用,使得总体中的每个单位或 每个样本有相等的入选机会。随机原则又称 为等可能性原则。
22
一、重复(置)抽样分布
根据样本日工资平均数分布表,可以计算日工资
平均数的数学期望和方差:
Xf 1 E( X ) X (34 1 36 2 38 3 ... 50 1) 42元 f 25
2( X )
2 [ X E ( X )] f
4
二、抽样调查的特点
• 调查单位的确定是按随机原则从全部总体单位 中抽取的。 • 用部分单位的指标数值去推断和估计总体指标 数值。 • 抽样调查中的抽样误差是不可避免的,但在事 先是可以计算并加以控制的。 • 抽样推断是运用概率估计的方法。
5
三、抽样调查的作用
有些现象是无法进行全面调查的,为了测算全面资料,必须采 用抽样调查的方法。
n N n 6
13
六、抽样方法与样本可能数目
不重复抽样时的样本可能数目可分为考虑顺序和不考虑 顺序两种情况。考虑顺序时的样本可能数目是不重复的 排列数:
n P N N ( N 1)( N 2)...( N n 1) N !/( N n)!
例8-3:从班级10位学生中抽选三人担任不同的职务,
用不重复抽样的方法抽取400名儿童,检查结果有
320名入学,计算样本入学率的抽样平均误差。 由上可知,P=320/400=80% 1、在重复抽样下,入学率的抽样平均误差:
P(1 P) 0.8 0.2 p 2% n 400
2、在不重复抽样下,入学率的抽样平均误差:
p
P(1 P) n 0.8 0.2 400 (1 ) (1 ) 1.96% n N 400 10000
f
2 1 ( x ) ( 42) x) 2 (50 4元 2 [(34 42) 1 (36 2 16 ... 42) 2 1] 16元2 25
相关主题