当前位置：文档之家› 参数的假设检验抽样分布、参数估计、假设检验(回归分析)

参数的假设检验抽样分布、参数估计、假设检验(回归分析)

z = -3.162 < 1.64 接受原假设
5% 1.64
假设检验的基本原理
2）相伴概率 P 检验统计量观察值以及所有所有比
它更为极端的可能值出现的概率之和双侧检验：
P = P(Z < -3.162) + P(Z > 3.162) = 0.002
左侧检验：P = P(Z < -3.162) = 0.001
1
t分布两尾概率分位点
P(x t / 2sx x t / 2sx ) 1
参数估计 - 区间估计
正态总体方差的区间估计
(n 1)s2
2
~
2 (n 1)
2分布上尾概率分位点
P(12
2
(n 1)s2
2
2
2)
1
P(
(n 1)s2
12 2
2
(n 1)s
2 2
2
)
1
参数估计 - 区间估计
n
Z x ~ N(0,1) 2 n
中心极限定理
➢ 无论样本所来自的总体是否服从正态分布，只要样本足够大，样本平均数就近似服从正态分布，样本越大，近似程度越好。
➢所需的样本含量随原总体的分布而异，但只要样本含量 30，无论原总体是何分布，都足以满足近似的要求。
➢设原总体的期望为，方差为 2，则样本平均数的期望为，方差为 2 /n。
统计推断概述
抽样分布参数估计简介假设检验的基本原理
抽样分布的概念
样本统计量的概率分布称为抽样分布（sampling distribution）
样本是通过对总体的随机抽样获得的样本统计量是随机变量，有一定的概率分布
简单随机样本
➢抽样是完全随机的 - 总体中的每个个体都有相同的机会被抽中
F ~ F(m, n)
F 分布
F 分布
性质
F分布随机变量的取值范围为（0，） F分布的分布曲线受两个自由度的影响若F ~ F(m, n)，则 1/F ~ F(n, m) 若X ~ t(n)，则 X2 ~ F(1, n)
F 分布
F分布的上侧分位数表：附表5（p.281）
P(F F )
➢ 基本方法 - 构造函数g(x)的方法 • 矩法：用与总体参数相应的样本统计量作为估计值，必要时可对统计量作适当调整
• 最大似然法：用使样本观测值的似然函数达到最大的统计量作为估计值
• 最小二乘法：用使估计误差平方和的统计量作为估计值
• 贝叶斯法：根据贝叶斯理论构造估计量
参数估计 - 点估计
右侧检验：P = P(Z > -3.162) = 0.999
假设检验的基本原理
-3.162
3.162
双侧检验的相伴概率
-3.162
3.162
左侧检验的相伴概率
假设检验的基本原理
相伴概率可用于对假设的统计推断: 检验统计量的观察值落在否定域中等价于相伴概率小于显著性水平，即 P < 可以用否定域，也可用相伴概率对原假设进行推断如果检验统计量是连续分布的，用否定域进行推断如果检验统计量是离散分布的，用相伴概率进行推断
/2
1 -
12 2
/2
2 2
假设检验
假设(hypothsis)
对总体的某些未知的或不完全知道的性质所提出的待考察的命题
假设检验
对假设成立与否做出的推断
假设检验的基本原理
问题的提出
例：某猪场称该场的猪在体重为100kg时的平均背膘厚度为9mm。问题：此说法是否正确？有4种可能性(假设)
正态总体样本方差的分布
样本方差的期望和方差
➢设样本来自均数为，方差为 2的总体
➢设样本为简单随机样本
s2 (xi x)2
n 1
正态总体样本方差的分布
样本方差的分布
(xi
2
x)2
(xi
)2 n(x 2
)2
xi
2
Байду номын сангаас
x
n
2
~
2 (n
1)
(n 1)s2
2
~
2 (n 1)
参数估计
2 分布
2 分布上侧分位数表：附表3（p.277）
P(X 2 )
t 分布
定义
设Z ~ N(0, 1)，Y ~ 2 (n)，且相互独立，则
t Z Yn
服从自由度为n的 t 分布，记为
t ~ t(n)
t 分布
t 分布
性质
与标准正态分布相似
关于 t = 0对称只有一个峰，峰值在t = 0
1 n
xi )
1 n2
Var(x1
x2
xn )
1 n2
( 2
2
2)
1 n2
n
2
2
n
标准差
x
n
（平均数的标准误）
正态总体样本平均数的分布
正态总体样本平均数的分布
设样本来自正态总体 N( , 2)，则样本平均数也服从正态分布，其总体均数为，方差为 2/n。
X ~ N(, 2) x ~ N(, 2 )
n 1
参数估计 - 点估计
➢均方误差：
E(ˆ )2 Var(ˆ) [E(ˆ) ]2
➢一致性：估计值随着样本的增大而更加接近真值
➢有效性: 抽样方差达到最小的无偏估计 ➢充分性: 估计函数包含了关于被估参数的全
部信息
参数估计 - 区间估计
以一定的置信度对参数可能取值范围的估计
求统计量 t1和 t2 ，使得对于给定的 (0 1，常用 =0.05和 =0.01)，有
Y ~ 2(n)
2 分布
2 分布
性质
2 分布随机变量的取值范围为（0，）
若Y1 ~ 2 (n)，Y2 ~ 2 (m)，且相互独立，则 Y1 ± Y2 ~ 2 (n ± m)
2 分布为非对称分布，其分布曲线的形状由自由度决定，自由度越大，分布越趋于对称
当 n ， 2 (n) N(n, 2n)
P(t1 t2) 1
1 - ：置信度（置信水平） [t1, t2]：置信区间 t1、t2：置信限（置信下限、置信上限）
参数估计 - 区间估计
正态总体平均数的区间估计
当 2已知
x ~ N(, 2 )
n
x x
~
N(0,1)
P(u / 2
x x
u / 2 )
1
标准正态分布两尾概率分位点
难题
存在抽样误差当样本平均数与9mm之差达到多大时可否
定＝ 9
假设检验的基本原理
解决的思路
针对要回答的问题提出一对对立的假设，并对其中的一个进行检验
找到一个样本统计量，它与提出的假设有关，其抽样分布已知
根据这个统计量观察值出现的概率，利用小概率事件原理对假设是否成立做出推断
1）提出一对对立的假设 2）构造并计算检验统计量 3）确定否定域 4）对所作的假设进行推断
假设检验的基本原理
例（续）
设由该场随机抽取了10头猪，测得它们在体重为 100kg时的平均背膘厚为8.7mm。已知该场猪的背膘
厚服从正态分布，总体方差为 2 ＝ 2.5mm2
1）提出假设
原假设(null hypothesis)： H0: = 9mm
分布曲线受自由度影响，自由度越小，离散程度越大当 n ，t(n) N(0, 1)
t 分布
t 分布与正态分布的比较
t 分布
t分布双侧分位数表：附表4（p. 279）
1 P(t t t )
F 分布
定义
若 X ~ 2 (m)，Y ~ 2 (n)，且相互独立，则
FX m Yn
服从自由度为m（第一自由度）和n（第二自由度）的 F 分布，记为
结论：该场猪的平均背膘厚与9mm差异极显著
假设检验的基本原理
几个相关概念
1）双侧检验和单侧检验双侧检验：否定域在检验统计量分布的两尾单侧检验：否定域在检验统计量分布的一侧
左侧检验：否定域在检验统计量分布的左侧
右侧检验：否定域在检验统计量分布的右侧
假设检验的基本原理
例（续）
左侧检验 1）假设： H0: = 9， HA: < 9
E[ (x )2 n(x )2 ]
E(x )2 nE(x )2
(n 2 n 2 ) (n 1) 2
n
E(s2)
1 n 1
E[ ( xi
x)2
]
2
s2是2的无
偏估计量
参数估计 - 点估计
➢抽样方差/标准误：估计值的方差/标准差
样本平均数的抽样方差： Var(x) 2
n
样本方差的抽样方差： Var(s2) 2 4
假设检验的基本原理
3）确定否定域
在检验统计量抽样分布的尾部（1侧或2侧）中划定一小概率区域，一旦计算的检验统计量的实际值落入此区域，就否定原假设，接受备择假设。
这个小概率也称为显著性水平，用表示通常取＝5％或＝1％
假设检验的基本原理
若取＝5％，则
1 P(u0.025 Z u0.025 ) 0.05
正态总体样本平均数的分布
样本平均数的期望和方差
➢设样本来自均数为，方差为 2的总体
➢设样本为简单随机样本
x
1 n
xi
正态总体样本平均数的分布
期望
E(x)
x
E(1 n
xi )
1 n
E(x1
x2
xn )
1 ( )
n
1 n
n
正态总体样本平均数的分布
方差
V ar( x
)
2 x
Var(

e商务文档

参数的假设检验抽样分布、参数估计、假设检验(回归分析)

相关文档推荐：