抽样分布与参数估计
• 抽样 • 从所研究的对象中随机取出一部分进行观察,由此获 得有关总体的信息。
第三章 抽样分布与参数估计
• 抽样分为概率抽样与非概率抽样 • 其中概率抽样分为:
纯随机抽样、等距抽样、分层抽样、整群抽样
第三章 抽样分布与参数估计 常用的总体参数
• 总体平均数 • 总体方差 • 总体标准差
N
XI
I 1
{5,7} 6
{8,7} 7.5
{7,7} 7
{10,7} 8.5
{10,10} 10
{5,10} 7.5
{8,10} 9
{7,10} 8.5
{10,10} 10
第三章 抽样分布与参数估计
• 一个样本统计量的概率分布被称为该统计量的抽样分 布
样本均值抽样分布 直方图
10
150.00%
100.00% 5
例3.1 矩法估计例题
• 设总体 X ~ N,2 ,X1, X2,, Xn 为总体的样本, 求, 的矩2法估计量。
– 解:
ˆ矩 X
ˆ
2 矩
1
n
n 1 i1
Xi X
2
S2 n 1
例3.2 灯泡平均寿命分析
• 设从某灯泡厂某天生产的灯泡中随机抽取10只灯泡,测得 其寿命为(单位:小时)1050,1100,1080,1120,1200, 1250,1040,1130,1300,1200。试用矩法估计该厂这天
3.3.1 总体方差 2已知时,总体均值µ的估计
• X ~ N , 2 ,x1, x2,, xn 为来自总体的样本
• 样本均值 x 服从数学期望为μ、方差为 /2n的正态
分布,即 x ~ N , 2 n
• 当 2已知时,U x ~ N 0,1
n
• 可得到1-α置信度下,μ的置信区间为
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
• 例:已知某高校女生比例为46%,现对全体学 生做两次随机抽样, n=200和n=1000 ,求 这两次抽样中女生的比例在50%以上的概率。
第三章 抽样分布与参数估计
3.2 点估计
第三章 抽样分布与参数估计
3.2.1 点估计的概念
• 点估计是以样本统计量作为相应总体参数的估计量
• 称为显著性水平(Significance Level)
。
• 区间示意图
置信区间
f (ˆ)
1-α
ˆ
ˆ1 θ
ˆ2
• 置信区间表达了区间估计的精确度,置信概率表达了区间
估计的可靠性,它是区间估计的可靠概率;而显著性水平
表达了区间估计的不可靠的概率
• 可靠度与精度是一对矛盾,一般是在保证可靠度的条件下 尽可能提高精度
x
2
n
,x
2
n
• 置信区间的宽度为:
2L 2 / 2
n
例3.6 零件直径问题
• 已知某零件的直径服从正态分布,从该批产品中随机抽取 10件,测得平均直径为202.5mm,已知总体标准差
N 100
Mean 343.76
Std. Deviation 4.130
Variance 17.053
100
净重均值、方差估计值,结果同Statistics表
3.3 区间估计
3.3 区间估计
• 用一个区间去估计未知参数, 即把未知参数值估计在某
两界限之间
• 设 x1, x2,, xn是来自密度 f (X , ) 的样本
中心极限定理的作用
• 建立起 Z值与样本均值之间的数值关系.
• 不论该总体服从何种分布,只要当样本容量足够大
( n 3)0 ,样本均值的分布都大致服从正态分布。
X
~
N (,
2
)
n
第三章 抽样分布与参数估计
• 例:某高校在研究生入学体检后对所有结果进 行统计分析,得出其中某一项指标的均值是7, 标准差2.2。从这个总体中随机选取一个容量 为31的样本。
N
N
(XI X )2
2 I 1
N
• 总体比率(总体成数)
P N1 N
第三章 抽样分布与参数估计
• 样本平均数 • 样本方差 • 样本标准差
n
Xi
x i1
n
n
(Xi x)2
s2 i1 n 1
s
• 样本比率(样本成数)
p n1 n
第三章 抽样分布与参数估计
• 样本统计量经常被用作估计总体参数。 • 点估计就是运用样本数据值计算出一个样本统计量的
• 例如:用样本均值 X直接作为总体均值 的估计值
• 点估计的优点 • 能够提供总体参数的具体估计值,可以作为行动决 策的数量依据
• 点估计的不足 • 任何点估计不是对就是错,并不能提供误差情况如 何、误差程度有多大的信息
3.2.2 点估计的优良性标准
• 无偏性
– 设总体的参数为 ,其估计量为 ˆ,如果E(ˆ) 即估计量ˆ 的数学期望等于被估计的总体参数, 我们称估计量 是参ˆ 数 的无 偏估计量
• (1)计算样本均值大于7.5的概率, • (2)计算样本均值小于7.2的概率, • (3)计算样本均值在7.2和7.5之间的概率。
第三章 抽样分布与参数估计
• 样本容量大于30,由中心极限定理可知,样本均值 x的分
布近似均值为
7,
标准差
=
X
n
=
2.2 31
=0.39的正态分布
即
X ~ N (7,0.392 )
|
)
0
• 有效性
– 设 ˆ1 ˆ1(X1,..., X n )和 ˆ2 ˆ2 (X1,..., Xn )都是参数的无偏 估计量,若对任意 ,D(ˆ1) D(ˆ2 ) ,且至少对于
某个 上式中的不等号成立,则称ˆ1 较 ˆ2有效
矩估计法
• 借助样本矩去估计总体的矩
– 用样本的一阶原点矩来估计总体的均值 – 用样本的二阶中心矩来估计总体的方差
50.00%
0
0.00%
6
7
8
9
10 其他
频率
累积
%
频率
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
总体分布
正态分布
样本均值 分布(n=2)
样本均值 分布(n=10)
样本均值 分布(n=30)
指数分布
均匀分布
第三章 抽样分布与参数估计
生产的灯泡的平均寿命及寿命分布的方差。
– 解:
E(Xˆ )
x
1 10
10 i 1
xi
1147(h)
D(Xˆ ) 2 7578.889
极大似然估计法
• 求极大似然估计的一般步骤
– 写出似然函数 – 对似然函数取对数,并整理 – 求导数 – 解似然方程
例3.4 极大似然估计例题
• 设总体X服从N(, 2),是X 的样本值,求,
按顺序分组
计算四分点 设置指定的百分点
均值
中位数 众数 样本数据值总和
标准差
方差 最大值与最小值之差
最小值 最大值
均值标准差
数据分布的斜度 数据分布的峰度
频次分析模块(续)
样本均值 样本方差
Statistics
净 重 N Valid
Missing Mean Std. Deviation Variance
第三章 抽样分布 与参数估计
第三章 抽样分布与参数估计
• 3.1 抽样分布 • 3.2 点估计 • 3.3 区间估计
第三章 抽样分布与参数估计
3.1 抽样分布
为什么要抽样? 为了收集必要的资料,对所研究对象(总体)的
全部元素逐一进行观测,往往不很现实。
元素多,搜集数据费
抽 样
时、费用大,不及时而 使所得的数据无意义
(
2
)
ln
L
1
2( 2 )2
n
(xi
i1
)2
n
2( 2 )
0
ˆmle
1 n
n
xi
i 1
x
2
mle
1 n
n
(xi
i 1
x)2
,S2的极大似然估计量分别为
1 n
n
Xi
i 1
,X
1 n
n
(Xi
i 1
X )2
Sn2
频次分析模块
Analyz→Descriptive Statistics → Frequencies Statistics
总体庞大,难以对总 体的全部元素进行 研究
原
因
检查具有破坏性
炮弹、灯管、砖等
第三章 抽样分布与参数估计
统计学基本概念
• 总体 (全体) Population • 所有感兴趣的对象
• 样本Sample • 总体的一部分
• 总体参数Parameter • 关于总体的概括性度量
• 统计量Statistic • 关于样本的概括性度量
• 对给定的 (0 1) ,如能找到两个统计量1(x1, x2,, xn )
及 2 (x1, x2,, xn ) ,使得 P{1(x1, x2,, xn ) 2 (x1, x2,, xn )} 1
• 1 是置信度,置信度也称为置信概率
• 1x1, x2,, xn ,2x1, x2,, xn 是置信度为 1 的θ的置信区间
值,将其作为总体参数的估计值。
• 如用 x 5去0估计
• 问题是不同的样本提供不同的估计值 • 样本越大,估计的性质越好,但成本也越高 • 了解估计的性质有多好
• 解决办法:以样本的抽样分布作为理论基础。