当前位置:文档之家› 参数的假设检验抽样分布、参数估计、假设检验(回归分析)

参数的假设检验抽样分布、参数估计、假设检验(回归分析)


z = -3.162 < 1.64 接受原假设
5% 1.64
假设检验的基本原理
2)相伴概率 P 检验统计量观察值以及所有所有比
它更为极端的可能值出现的概率之和 双侧检验:
P = P(Z < -3.162) + P(Z > 3.162) = 0.002
左侧检验:P = P(Z < -3.162) = 0.001
1
t分布两尾 概率分位点
P(x t / 2sx x t / 2sx ) 1
参数估计 - 区间估计
正态总体方差的区间估计
(n 1)s2
2
~
2 (n 1)
2分布上尾 概率分位点
P(12
2
(n 1)s2
2
2
2)
1
P(
(n 1)s2
12 2
2
(n 1)s
2 2
2
)
1
参数估计 - 区间估计
n
Z x ~ N(0,1) 2 n
中心极限定理
➢ 无论样本所来自的总体是否服从正态分布, 只要样本足够大,样本平均数就近似服从正 态分布,样本越大,近似程度越好。
➢所需的样本含量随原总体的分布而异,但只 要样本含量 30,无论原总体是何分布,都 足以满足近似的要求。
➢设原总体的期望为,方差为 2,则样本平 均数的期望为,方差为 2 /n。
统计推断概述
抽样分布 参数估计简介 假设检验的基本原理
抽样分布的概念
样本统计量的概率分布称为抽样分布(sampling distribution)
样本是通过对总体的随机抽样获得的 样本统计量是随机变量,有一定的概率分布
简单随机样本
➢抽样是完全随机的 - 总体中的每个个体都 有相同的机会被抽中
F ~ F(m, n)
F 分布
F 分布
性质
F分布随机变量的取值范围为(0,) F分布的分布曲线受两个自由度的影响 若F ~ F(m, n),则 1/F ~ F(n, m) 若X ~ t(n),则 X2 ~ F(1, n)
F 分布
F分布的上侧分位数表:附表5(p.281)
P(F F )
➢ 基本方法 - 构造函数g(x)的方法 • 矩法:用与总体参数相应的样本统计量作 为估计值,必要时可对统计量作适当调整
• 最大似然法:用使样本观测值的似然函数 达到最大的统计量作为估计值
• 最小二乘法:用使估计误差平方和的统计 量作为估计值
• 贝叶斯法:根据贝叶斯理论构造估计量
参数估计 - 点估计
右侧检验:P = P(Z > -3.162) = 0.999
假设检验的基本原理
-3.162
3.162
双侧检验的相伴概率
-3.162
3.162
左侧检验的相伴概率
假设检验的基本原理
相伴概率可用于对假设的统计推断: 检验统计量的观察值落在否定域中等价于相伴概率小于显著性水平,即 P < 可以用否定域,也可用相伴概率对原假设进行推断 如果检验统计量是连续分布的,用否定域进行推断 如果检验统计量是离散分布的,用相伴概率进行推断
/2
1 -
12 2
/2
2 2
假设检验
假设(hypothsis)
对总体的某些未知的或不完全知道的性质所提出的待考察的命题
假设检验
对假设成立与否做出的推断
假设检验的基本原理
问题的提出
例 :某猪场称该场的猪在体重为100kg时的平均背膘厚度为9mm。 问题:此说法是否正确?有4种可能性(假设)
正态总体样本方差的 分布
样本方差的期望和方差
➢设样本来自均数为,方差为 2的总体
➢设样本为简单随机样本
s2 (xi x)2
n 1
正态总体样本方差的 分布
样本方差的分布
(xi
2
x)2
(xi
)2 n(x 2
)2
xi
2
Байду номын сангаас
x
n
2
~
2 (n
1)
(n 1)s2
2
~
2 (n 1)
参数估计
2 分布
2 分布上侧分位数表:附表3(p.277)
P(X 2 )
t 分布
定义
设Z ~ N(0, 1),Y ~ 2 (n),且相互独立,则
t Z Yn
服从自由度为n的 t 分布,记为
t ~ t(n)
t 分布
t 分布
性质
与标准正态分布相似
关于 t = 0对称 只有一个峰,峰值在t = 0
1 n
xi )
1 n2
Var(x1
x2
xn )
1 n2
( 2
2
2)
1 n2
n
2
2
n
标准差
x
n
(平均数的标准误)
正态总体样本平均数的分布
正态总体样本平均数的分布
设样本来自正态总体 N( , 2),则样本平均数也 服从正态分布,其总体均数为 ,方差为 2/n。
X ~ N(, 2) x ~ N(, 2 )
n 1
参数估计 - 点估计
➢均方误差:
E(ˆ )2 Var(ˆ) [E(ˆ) ]2
➢一致性:估计值随着样本的增大而更加接近 真值
➢有效性: 抽样方差达到最小的无偏估计 ➢充分性: 估计函数包含了关于被估参数的全
部信息
参数估计 - 区间估计
以一定的置信度对参数可能取值范围的估计
求统计量 t1和 t2 ,使得对于给定的 (0 1,常用 =0.05和 =0.01),有
Y ~ 2(n)
2 分布
2 分布
性质
2 分布随机变量的取值范围为(0,)
若Y1 ~ 2 (n),Y2 ~ 2 (m),且相互独立,则 Y1 ± Y2 ~ 2 (n ± m)
2 分布为非对称分布,其分布曲线的形状由自由度决定, 自由度越大,分布越趋于对称
当 n , 2 (n) N(n, 2n)
P(t1 t2) 1
1 - :置信度( 置信水平) [t1, t2]:置信区间 t1、t2:置信限(置信下限、置信上限)
参数估计 - 区间估计
正态总体平均数的区间估计
当 2已知
x ~ N(, 2 )
n
x x
~
N(0,1)
P(u / 2
x x
u / 2 )
1
标准正态分 布两尾概率 分位点
难题
存在抽样误差 当样本平均数与9mm之差达到多大时可否
定 = 9
假设检验的基本原理
解决的思路
针对要回答的问题提出一对对立的假设,并对其中的一个 进行检验
找到一个样本统计量,它与提出的假设有关,其抽样分布 已知
根据这个统计量观察值出现的概率,利用小概率事件原理 对假设是否成立做出推断
1)提出一对对立的假设 2)构造并计算检验统计量 3)确定否定域 4)对所作的假设进行推断
假设检验的基本原理
例(续)
设由该场随机抽取了10头猪,测得它们在体重为 100kg时的平均背膘厚为8.7mm。已知该场猪的背膘
厚服从正态分布,总体方差为 2 = 2.5mm2
1)提出假设
原假设(null hypothesis): H0: = 9mm
分布曲线受自由度影响,自由度越小,离散程度越大 当 n ,t(n) N(0, 1)
t 分布
t 分布与正态分布的比较
t 分布
t分布双侧分位数表:附表4(p. 279)
1 P(t t t )
F 分布
定义
若 X ~ 2 (m),Y ~ 2 (n),且相互独立,则
FX m Yn
服从自由度为m(第一自由度)和n(第 二自由度)的 F 分布,记为
结论:该场猪的平均背膘厚与9mm差异极显著
假设检验的基本原理
几个相关概念
1)双侧检验和单侧检验 双侧检验:否定域在检验统计 量分布的两尾 单侧检验:否定域在检验统计 量分布的一侧
左侧检验:否定域在检验统计量分布的左 侧
右侧检验:否定域在检验统计量分布的右 侧
假设检验的基本原理
例(续)
左侧检验 1)假设: H0: = 9, HA: < 9
E[ (x )2 n(x )2 ]
E(x )2 nE(x )2
(n 2 n 2 ) (n 1) 2
n
E(s2)
1 n 1
E[ ( xi
x)2
]
2
s2是2的无
偏估计量
参数估计 - 点估计
➢抽样方差/标准误:估计值的方差/标准差
样本平均数的抽样方差: Var(x) 2
n
样本方差的抽样方差: Var(s2) 2 4
假设检验的基本原理
3)确定否定域
在检验统计量抽样分布的尾部(1侧或2侧)中划定一小概 率区域,一旦计算的检验统计量的实际值落入此区域,就 否定原假设,接受备择假设。
这个小概率也称为显著性水平,用 表示 通常取 =5%或 =1%
假设检验的基本原理
若取 =5%,则
1 P(u0.025 Z u0.025 ) 0.05
正态总体样本平均数的分布
样本平均数的期望和方差
➢设样本来自均数为,方差为 2的总体
➢设样本为简单随机样本
x
1 n
xi
正态总体样本平均数的分布
期望
E(x)
x
E(1 n
xi )
1 n
E(x1
x2
xn )
1 ( )
n
1 n
n
正态总体样本平均数的分布
方差
V ar( x
)
2 x
Var(
相关主题