抽样与抽样分布教材
n
x
xi
i 1
M
1.0 1.5 4.0 16
2.5
n
(xi x )2
2 x
i 1
M
(1.0 2.5)2
(4.0 2.5)2
2
0.625
16
n
式中:M为样本数目
比较及结论:1. 样本均值的均值(数学期望)等于总体均值
2. 样本均值的方差等于总体方差的1/n
Ⅲ-26
样本均值的分布与总体分布的比较
Ⅲ-19
(1)抽样平均数的平均误差(抽样均值误差)注意啦:
重复抽样
当抽样比例
小于5%时,
不区别抽样
方法影响
不重复抽样
2 N n
()
x n N 1
N n N 1
称为修正系数
Ⅲ-20
(2)抽样成数的平均误差
重复抽样
p
P(1 P) n
不重复抽样
p
P(1 P) ( N n) n N 1
N n N 1
的点
为卡方分布的上a分位点。
a
2 a
(
n)
Ⅲ-40
样本方差的分布
设总体服从正态分布 X~ N(μ,σ2 ),X1,X2, …,Xn为来自该正态总体的样本,则样本方 差 s2 的分布为
(n 1)s 2
2
~
2 (n 1)
将2(n – 1)称为自由度为(n-1)的卡方分布
Ⅲ-41
卡方 (2) 分布
第一个 观察值
第二个观察值
1234
1 1.0 1.5 2.0 2.5
2 1.5 2.0 2.5 3.0
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
.3 P ( x ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
Ⅲ-25
所有样本均值的均值和方差
12个样本的均值(x)
第一个
第二个观察值
观察值
1
2
3
4
1
-
1.5
2.0
2.5
2
1.5
-
2.5
3.0
3
2.0
2.5
-
3.5
4
2.5
3.0
3.5
-
Ⅲ-34
12个样本的均值(x)
样本均值 频数 频率
1.5
2 2/12
2.0
2 2/12
2.5
4 4/12
3.0
2 2/12
3.5
2 2/12
合计 12 1
0.4
总体
选择容量为n 的 简单随机样本 计算样本方差S2
计算卡方值
2 = (n-1)S2/σ2
计算出所有的
2值
Ⅲ-42
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
2
样本统计量
样本均值
样本成数
样本方差
正态总体或非正 态总体大样本
正态 总体小样本
大样本
正态分布
t分布
Ⅲ-43
正态分布
2分布
解:(1)重复抽样条件下
单位 A B C D A A,A A,B A,C A,D B B,A B,B B,C B,D C C,A C,B C,C C,D D D,A D,B D,C D,D
(2)不重复抽样条件下
单位 A A-
BCD A,B A,C A,D
B B,A - B,C B,D
C C,A C,B - C,D
0.95 (1 0.95) 0.02179 100
Ⅲ-30
根据中心极限定理可知,当样本容量足够大时,样 本均值的抽样分布逐渐趋于正态分布。而抽样成数 的样本容量足够大的条件是np≥5和n(1-p)≥5,而本例 中n=100,p=0.95,所以服从正态分布,即 p~N(p,p(1-p)/n)
2 = p(1-p)/n
x~N(μ,σ2/n)
=10
n= 4
x 5
n =16
x 2.5
= 50 X
总体分布
x 50
X
抽样分布
Ⅲ-28
中心极限定理(图示)
中心极限定理:设从均值为,方差为 2的一个任意总
体中抽取容量为n的样本,当n充分大时,样本均值x 的
抽样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分
p
P(1 P) ( N n) n N 1
0.95 (1 0.95) 10000 100 0.02168
100
10000 1
Ⅲ-37
样本方差的抽样分布
卡方分布定义
设X1,X2,…,Xn为来自总体N(0,1)的样本,则 称统计量
服从自由度为n的卡方分布 简记为:
Ⅲ-39
卡方分布定义
对于给定的正数a,0<a<1,称满足条件
第3章 抽样与抽样分布
本章内容
§3.1 总体与样本 §3.2 抽样的组织形式 §3.3 抽样误差与抽样分布
Ⅲ-2
§3.1 总体与样本
一、全及总体与抽样总体 1、全及总体
指调查对象的全部单位构成的整体,即具有某种 共同性质的若干单位的集合体。简称总体、母体。 可分为有限总体和无限总体 总体单位数用N来表示 2、抽样总体 从全及总体中按照随机原则抽取一部分单位构成 的集合体。简称样本、子样。 大样本和小样本 样本单位数用n来表示
T ( X ) 为统计量,它服从自由度为(n-1)的t 分布
0.3
0.2
0.1
0
1.5
2
2.5
3
3.5
样本均值的抽样分布
Ⅲ-35
所有样本均值的均值和方差
n
x
xi
i 1
M
1.5 3.5 12
30 12
2.5
n
(xi x )2
2
i 1
x
M
(1.5 2.5)2 (3.5 2.5)2 5 2 ( N n )
12
12 n N 1
代表性误差: 偏差 随机误差
Ⅲ-18
2、抽样误差的概念 指根据样本数据计算而得到的样本统计量与被估计的未知 的总体参数真值之间的随机误差。
3、影响抽样误差的因素 (1)抽样单位数目的多少 (2)总体被研究标志的变异程度 (3)抽样方法和组织形式的不同
4、抽样平均误差 指抽样平均数(或抽样成数)的标准差。它反映抽样平均 数(或抽样成数)与总体平均数(或总体成数)的平均误 差程度。
(1)抽样平均数
Ⅲ-7
(2)抽样成数
定义:在抽样总体中, 一个现象有两种表现 时,其中具有某一种 表现的单位数占抽样 总体单位数目的比重, 叫抽样成数,或样本 成数。
pq 1
例:某灯泡厂生产的10000只 灯泡中,从中抽取1000只进 行检验,其中有50只不合格, 则
样本不合格率:
p=50/1000=5% 合格率:q=1-p=95%
总体分布
.3
.2
.1 0
1
234
= 2.5
σ2 =1.25
抽样分布
.3 P ( x ) .2
x 2.5
2 x
0.625
.1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
Ⅲ-27
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N ~ (μ,σ2 )时,来自该总体 的所有容量为n的样本的均值x 也服从正态分布, x 的数学期望为μ,方差为σ2/n。即
D D,A D,B D,C -
Ⅲ-12
§3.2 抽样的组织形式
一、简单随机抽样(纯随机抽样) 二、类型抽样(分类抽样) 三、机械抽样(等距抽样) 四、整群抽样
Ⅲ-13
一、简单随机抽样(纯随机抽样)
1、概念
对全及总体的所有单位不进行任何分类或排队,按照随机 原则直接从总体单位N中抽取n个单位作为样本,保证每个 单位在抽选中都有相等的中选机会。
T 统计量的分布
学生氏分布定义 设X~N(0,1),Y~2(n),并且X,Y 独立,则称随机变量
服从自由度为n 的t分布,记为t~t(n)
Ⅲ-45
t分布定义
对于给定的正数a,0<a<1,称满足条件
的点
为t(n)分布的上a分位点。
a
ta (n)
Ⅲ-46
T 统计量的分布
设X1,X2,…,Xn是来自正态总体N~(μ1,σ12 )的一个 样本, 称
2、具体抽样方法
将总体各单位编号,然后随机抽取,直到抽够预定数目。
Ⅲ-14
二、类型抽样(分类抽样)
1、概念 先将总体按某个标志分成若干组,再随机从各组 中抽取样本单位。
2、具体抽样方法 (1)不等比例类型抽样法 (2)等比例类型抽样法
Ⅲ-15
三、机械抽样(等距抽样)
1、概念
将总体各单位按某一标志进行排序,然后再按固 定的顺序和间隔来抽选样本单位。
x
n
布的总体
当样本容量足够
大时(n ≥30) ,
样本均值的抽样
分布逐渐趋于正
态分布
x
X
Ⅲ-29
二、抽样分布 (一)重复抽样分布
2、抽样成数的抽样分布
例:对某种产品质量的合格率进行检验,现用重复 抽样方法,从总体中抽取100个样本进行检验,其 合格率p=95%,其抽样平均误差为:
p
P(1 P) n
Ⅲ-3
二、全及指标和抽样指标 1、全及指标
根据总体各单位标志值计算的反映总体数量特征 的综合指标,也称为总体指标或总体参数。 (1)总体平均数
Ⅲ-4