当前位置:
文档之家› 2019-2020年人教统编4-3非参数假设检验幻灯片
2019-2020年人教统编4-3非参数假设检验幻灯片
未落入拒绝域,即认为是均匀的。
例2.试检验每年爆发战争次数分布是否服从泊松分布. 解: 这是一个分布的拟合优度检验,提出假设:H0: X ~P(λ)
由观察值,得参数λ的最大似然估计为
ˆ x 0.69
按参数为 0.69 的泊松分布,计算事件X=i 的概率 pi ,
pi 的估计是 pˆ i e0.69 0.69i i !
(k
r
1)}
(估计r 个参数)
如果根据所给的样本值 x1, x2, .., xn 算得统计量χ2 的实 测值落入拒绝域,则拒绝原假设;否则就认为差异不显
著而接受原假设.
注:皮尔逊定理是在 n 无限增大时推导出来的, 因而使用时要注意 n 要足够大以及 npi 不太小这两个 条件. 根据计算实践,要求 n 不小于 50 以及 npi 不小 于 5. 否则应适当合并相邻区间,使 npi 满足此要求 .
2 1
(k
1)
2 0.95
(5)
11.0705
由样本,得检验统计量的值:(其中分子中的10是60*1/6)
2 k (ni npi )2 (7 10)2 (8 10)2 .... (13 10)2 2.8 11.0705
i 1
npi
10
10
10
一、χ2拟合优度检验
χ2 检验法是在总体X 的分布未知时,根据来自总体的样
本,检验关于总体分布的假设的一种检验方法. 基本思想: 提出原假设:
H0:总体 X 的分布函数为 F(x)
然后根据样本的经验分布和所假设的理论分布 之间的吻合程度来决定是否接受原假设.这种检验通 常称作拟合优度检验,它是一种非参数检验.
i 1
npi
在理论分布 已知的条件下,
第三节 非参数假设检验
一、总体分布函数的假设检验 二、独立性假设检验 三、两总体分布比较的假设检验
问题的背景:
前面已经研究了假设检验的基本思想,并讨论了 当总体分布已知时,关于其中未知参数的假设检验问 题.
然而可能遇到这样的情形,总体服从何种理论分 布并不知道,要求我们直接对总体分布提出一个假 设.
又α = 0.05,自由度为 2,查χ2分布表得:
2 1
(k
1
1)
2 0.95
(2)
5.9915
由样本,得检验统计量的值:
2 4 (ni npi )2 2.673 5.9915 未落入拒绝域, i1 npi 故认为每年发生战争次数 X 服从参数为 0.69 的泊松分布.
实测频数
ni npi
理论频数
它标志着经验分布与理论分布之间的差异的大小.
4.皮尔逊引进如下统计量表示经验分布与理论分布之
间的差异:
其分布是什么?
2 k (ni npi )2
i 1
npi
在理论分布 已知的条件下,
npi 是常量
Pearson证明了如下定理:
若原假设中的理论分布 F(x) 已经完全给定,那 么当 n 充分大时,统计量
~ 2 k (ni npˆi )2
2 (k r 1)
i1 npˆi
根据以上定理,对给定的显著性水平α ,
查χ2 分布表可得临界值χ21-α
,使得
P( 2
2 1
)
分别得拒绝域:
W
{ 2
2 1
(k
1)}
(不需估计参数)
W
{ 2论分布,可以算出总体 X 的值落入每
个 Ai 的概率 pi ,于是 npi 就是落入 Ai 的样本值的理论 频数.
实测频数
ni npi
理论频数
它标志着经验分布与理论分布之间的差异的大小.
4.皮尔逊引进如下统计量表示经验分布与理论分布之
间的差异:
其分布是什么?
2 k (ni npi )2
基本原理和步骤如下:(总体分布取值有限)
1. 将总体 X 的取值为 a1, a2, …, ak .
2. 把取值为 ai 的样本值的个数记作 ni ,称为实测 频数. 所有实测频数之和 n1+ n2+ …+nk 等于样本容 量 n.
H0:P(X=ai) =pi , i=1,2,…, k.
3.根据所假设的理论分布,可以算出 npi 就是落入 X 取 值为 ai 的样本值的理论频数.
i = 0, 1, 2, 3, 4
将有关计算结果列表如下:
pˆ i
npˆ i
(ni n pi )2 n pi
注:将n pˆi<5 的组予以合
并,即将发
生3次及以上
次数的组归
并为一组.
≥3
13.91
检验的拒绝域为:
W
{ 2
2 1
(k
1 1)}
因假设的理论分布中有一个未知参数,即r = 1,又 k =4, 故自由 度为 4-1-1=2.
例1. 掷一颗骰子 60 次,结果如下:试在α= 0.05 水平 下检验其是否均匀?
解: 这是一个分布的拟合优度检验,记出现点数 i 的概
率为 pi , 提出假设:
H0
:
p1
p2
...
p6
1 6
检验的拒绝域为:
W
{ 2
2 1
(k
1)}
现在α = 0.05,k = 6,查表得
基本原理和步骤如下:(连续型随机变量总体)
1. 将总体 X 的取值范围分成 k 个互不重迭的小区 间(或小组), 记作 A1, A2, …, Ak .
2. 把落入第 i 个小区间 Ai 的样本值的个数记作 ni ,称为实测频数. 所有实测频数之和 n1+ n2+ …+nk 等于样本容量 n.
H0:P(Ai) =pi , i=1,2,….k.
~ 2 k (ni npi )2
2(k 1)
i1 npi
注: 若在 H0下分布类型已知,但其参数未知,这时需要 先用极大似然估计法估计参数,然后作检验.
Fisher证明了如下定理:
若原假设中的理论分布 F(x) 中有 r 个未知参数 需用相应的最大似然估计来代替,那么当 n 充分大 时,统计量
例如,从 1500 到 1931 年的 432 年间,每年爆发战 争的次数可以看作一个随机变量,椐统计,这 432 年间 共爆发了 299 次战争,具体数据如下:
战争次数 X
0 1 2 3 4
发生X 次战争的年 数
223
142 48 15 4
Poisson分布?
对总体分布进行检验的问题称为分布的拟合检验.