当前位置：文档之家› 抽样与抽样分布教材

抽样与抽样分布教材

n
x
xi
i 1
M
1.0 1.5 4.0 16
2.5
n
(xi x )2
2 x
i 1
M
(1.0 2.5)2
(4.0 2.5)2
2
0.625
16
n
式中：M为样本数目
比较及结论：1. 样本均值的均值（数学期望）等于总体均值
2. 样本均值的方差等于总体方差的1/n
Ⅲ-26
样本均值的分布与总体分布的比较
Ⅲ-19
（1）抽样平均数的平均误差（抽样均值误差）注意啦：
重复抽样
当抽样比例
小于5%时，
不区别抽样
方法影响
不重复抽样
2 N n
()
x n N 1
N n N 1
称为修正系数
Ⅲ-20
（2）抽样成数的平均误差
重复抽样
p
P(1 P) n
不重复抽样
p
P(1 P) ( N n) n N 1
N n N 1
的点
为卡方分布的上a分位点。
a
2 a
(
n)
Ⅲ-40
样本方差的分布
设总体服从正态分布 X~ N(μ,σ2 )，X1，X2， …，Xn为来自该正态总体的样本，则样本方差 s2 的分布为
(n 1)s 2
2
~
2 (n 1)
将2(n – 1)称为自由度为(n-1)的卡方分布
Ⅲ-41
卡方 (2) 分布
第一个观察值
第二个观察值
1234
1 1.0 1.5 2.0 2.5
2 1.5 2.0 2.5 3.0
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
.3 P ( x ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
Ⅲ-25
所有样本均值的均值和方差
12个样本的均值（x）
第一个
第二个观察值
观察值
1
2
3
4
1
－
1.5
2.0
2.5
2
1.5
－
2.5
3.0
3
2.0
2.5
－
3.5
4
2.5
3.0
3.5
－
Ⅲ-34
12个样本的均值（x）
样本均值频数频率
1.5
2 2/12
2.0
2 2/12
2.5
4 4/12
3.0
2 2/12
3.5
2 2/12
合计 12 1
0.4
总体
选择容量为n 的简单随机样本计算样本方差S2
计算卡方值
2 = (n-1)S2/σ2
计算出所有的
2值
Ⅲ-42
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
2
样本统计量
样本均值
样本成数
样本方差
正态总体或非正态总体大样本
正态总体小样本
大样本
正态分布
t分布
Ⅲ-43
正态分布
2分布
解：（1）重复抽样条件下
单位 A B C D A A,A A,B A,C A,D B B,A B,B B,C B,D C C,A C,B C,C C,D D D,A D,B D,C D,D
（2）不重复抽样条件下
单位 A A-
BCD A,B A,C A,D
B B,A - B,C B,D
C C,A C,B - C,D
0.95 (1 0.95) 0.02179 100
Ⅲ-30
根据中心极限定理可知，当样本容量足够大时，样本均值的抽样分布逐渐趋于正态分布。而抽样成数的样本容量足够大的条件是np≥5和n(1-p)≥5，而本例中n=100,p=0.95，所以服从正态分布，即 p～N(p,p(1-p)/n)
2 = p(1-p)/n
x～N(μ,σ2/n)
=10
n= 4
x 5
n =16
x 2.5
= 50 X
总体分布
x 50
X
抽样分布
Ⅲ-28
中心极限定理（图示）
中心极限定理：设从均值为，方差为 2的一个任意总
体中抽取容量为n的样本，当n充分大时，样本均值x 的
抽样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分
p
P(1 P) ( N n) n N 1
0.95 (1 0.95) 10000 100 0.02168
100
10000 1
Ⅲ-37
样本方差的抽样分布
卡方分布定义
设X1，X2，…，Xn为来自总体N（0，1）的样本，则称统计量
服从自由度为n的卡方分布简记为：
Ⅲ-39
卡方分布定义
对于给定的正数a，0<a<1，称满足条件
第3章抽样与抽样分布
本章内容
§3.1 总体与样本 §3.2 抽样的组织形式 §3.3 抽样误差与抽样分布
Ⅲ-2
§3.1 总体与样本
一、全及总体与抽样总体 1、全及总体
指调查对象的全部单位构成的整体，即具有某种共同性质的若干单位的集合体。简称总体、母体。可分为有限总体和无限总体总体单位数用N来表示 2、抽样总体从全及总体中按照随机原则抽取一部分单位构成的集合体。简称样本、子样。大样本和小样本样本单位数用n来表示
T ( X ) 为统计量,它服从自由度为(n-1)的t 分布
0.3
0.2
0.1
0
1.5
2
2.5
3
3.5
样本均值的抽样分布
Ⅲ-35
所有样本均值的均值和方差
n
x
xi
i 1
M
1.5 3.5 12
30 12
2.5
n
(xi x )2
2
i 1
x
M
(1.5 2.5)2 (3.5 2.5)2 5 2 ( N n )
12
12 n N 1
代表性误差：偏差随机误差
Ⅲ-18
2、抽样误差的概念指根据样本数据计算而得到的样本统计量与被估计的未知的总体参数真值之间的随机误差。
3、影响抽样误差的因素（1）抽样单位数目的多少（2）总体被研究标志的变异程度（3）抽样方法和组织形式的不同
4、抽样平均误差指抽样平均数（或抽样成数）的标准差。它反映抽样平均数（或抽样成数）与总体平均数（或总体成数）的平均误差程度。
（1）抽样平均数
Ⅲ-7
（2）抽样成数
定义：在抽样总体中，一个现象有两种表现时，其中具有某一种表现的单位数占抽样总体单位数目的比重，叫抽样成数，或样本成数。
pq 1
例：某灯泡厂生产的10000只灯泡中，从中抽取1000只进行检验，其中有50只不合格，则
样本不合格率：
p=50/1000=5% 合格率：q=1-p=95%
总体分布
.3
.2
.1 0
1
234
= 2.5
σ2 =1.25
抽样分布
.3 P ( x ) .2
x 2.5
2 x
0.625
.1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
Ⅲ-27
样本均值的抽样分布与中心极限定理
当总体服从正态分布N ～ (μ,σ2 )时，来自该总体的所有容量为n的样本的均值x 也服从正态分布， x 的数学期望为μ，方差为σ2/n。即
D D,A D,B D,C -
Ⅲ-12
§3.2 抽样的组织形式
一、简单随机抽样（纯随机抽样）二、类型抽样（分类抽样）三、机械抽样（等距抽样）四、整群抽样
Ⅲ-13
一、简单随机抽样（纯随机抽样）
1、概念
对全及总体的所有单位不进行任何分类或排队，按照随机原则直接从总体单位N中抽取n个单位作为样本，保证每个单位在抽选中都有相等的中选机会。
T 统计量的分布
学生氏分布定义设X～N(0,1)，Y～2（n），并且X，Y 独立，则称随机变量
服从自由度为n 的t分布，记为t～t(n)
Ⅲ-45
t分布定义
对于给定的正数a，0<a<1，称满足条件
的点
为t(n)分布的上a分位点。
a
ta (n)
Ⅲ-46
T 统计量的分布
设X1，X2，…，Xn是来自正态总体N~(μ1,σ12 )的一个样本，称
2、具体抽样方法
将总体各单位编号，然后随机抽取，直到抽够预定数目。
Ⅲ-14
二、类型抽样（分类抽样）
1、概念先将总体按某个标志分成若干组，再随机从各组中抽取样本单位。
2、具体抽样方法（1）不等比例类型抽样法（2）等比例类型抽样法
Ⅲ-15
三、机械抽样（等距抽样）
1、概念
将总体各单位按某一标志进行排序，然后再按固定的顺序和间隔来抽选样本单位。
x
n
布的总体
当样本容量足够
大时(n ≥30) ，
样本均值的抽样
分布逐渐趋于正
态分布
x
X
Ⅲ-29
二、抽样分布（一）重复抽样分布
2、抽样成数的抽样分布
例：对某种产品质量的合格率进行检验，现用重复抽样方法，从总体中抽取100个样本进行检验，其合格率p=95%，其抽样平均误差为：
p
P(1 P) n
Ⅲ-3
二、全及指标和抽样指标 1、全及指标
根据总体各单位标志值计算的反映总体数量特征的综合指标，也称为总体指标或总体参数。（1）总体平均数
Ⅲ-4

e商务文档

抽样与抽样分布教材

相关文档推荐：