当前位置：文档之家› 2019-2020年人教统编4-3非参数假设检验幻灯片

2019-2020年人教统编4-3非参数假设检验幻灯片

未落入拒绝域，即认为是均匀的。
例2.试检验每年爆发战争次数分布是否服从泊松分布. 解: 这是一个分布的拟合优度检验，提出假设：H0: X ～P(λ)
由观察值，得参数λ的最大似然估计为
ˆ x 0.69
按参数为 0.69 的泊松分布，计算事件X=i 的概率 pi ，
pi 的估计是 pˆ i e0.69 0.69i i !
(k
r
1)}
(估计r 个参数)
如果根据所给的样本值 x1, x2, .., xn 算得统计量χ2 的实测值落入拒绝域，则拒绝原假设；否则就认为差异不显
著而接受原假设.
注：皮尔逊定理是在 n 无限增大时推导出来的，因而使用时要注意 n 要足够大以及 npi 不太小这两个条件. 根据计算实践，要求 n 不小于 50 以及 npi 不小于 5. 否则应适当合并相邻区间，使 npi 满足此要求 .
2 1
(k
1)

2 0.95
(5)

11.0705
由样本，得检验统计量的值：（其中分子中的10是60*1/6）
2 k (ni npi )2 (7 10)2 (8 10)2 .... (13 10)2 2.8 11.0705
i 1
npi
10
10
10
一、χ2拟合优度检验
χ2 检验法是在总体X 的分布未知时，根据来自总体的样
本，检验关于总体分布的假设的一种检验方法. 基本思想: 提出原假设:
H0：总体 X 的分布函数为 F(x)
然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.这种检验通常称作拟合优度检验，它是一种非参数检验.
i 1
npi
在理论分布已知的条件下,
第三节非参数假设检验
一、总体分布函数的假设检验二、独立性假设检验三、两总体分布比较的假设检验
问题的背景：
前面已经研究了假设检验的基本思想，并讨论了当总体分布已知时，关于其中未知参数的假设检验问题.
然而可能遇到这样的情形，总体服从何种理论分布并不知道，要求我们直接对总体分布提出一个假设.
又α = 0.05，自由度为 2，查χ2分布表得:
2 1
(k

1

1)

2 0.95
(2)

5.9915
由样本，得检验统计量的值：
2 4 (ni npi )2 2.673 5.9915 未落入拒绝域， i1 npi 故认为每年发生战争次数 X 服从参数为 0.69 的泊松分布.
实测频数
ni npi
理论频数
它标志着经验分布与理论分布之间的差异的大小.
4.皮尔逊引进如下统计量表示经验分布与理论分布之
间的差异:
其分布是什么?
2 k (ni npi )2
i 1
npi
在理论分布已知的条件下,
npi 是常量
Pearson证明了如下定理:
若原假设中的理论分布 F(x) 已经完全给定，那么当 n 充分大时，统计量
~ 2 k (ni npˆi )2

2 (k r 1)
i1 npˆi
根据以上定理，对给定的显著性水平α ,
查χ2 分布表可得临界值χ21-α
，使得
P( 2

2 1
)

分别得拒绝域:
W
{ 2

2 1
(k
1)}
(不需估计参数)
W
{ 2论分布,可以算出总体 X 的值落入每
个 Ai 的概率 pi ,于是 npi 就是落入 Ai 的样本值的理论频数.
实测频数
ni npi
理论频数
它标志着经验分布与理论分布之间的差异的大小.
4.皮尔逊引进如下统计量表示经验分布与理论分布之
间的差异:
其分布是什么?
2 k (ni npi )2
基本原理和步骤如下:（总体分布取值有限）
1. 将总体 X 的取值为 a1, a2, …, ak .
2. 把取值为 ai 的样本值的个数记作 ni ，称为实测频数. 所有实测频数之和 n1+ n2+ …+nk 等于样本容量 n.
H0：P(X=ai) =pi , i=1,2,…, k.
3.根据所假设的理论分布,可以算出 npi 就是落入 X 取值为 ai 的样本值的理论频数.
i = 0, 1, 2, 3, 4
将有关计算结果列表如下:
pˆ i
npˆ i
(ni n pi )2 n pi
注:将n pˆi<5 的组予以合
并，即将发
生3次及以上
次数的组归
并为一组.
≥3
13.91
检验的拒绝域为:
W
{ 2

2 1
(k
1 1)}
因假设的理论分布中有一个未知参数，即r = 1,又 k =4, 故自由度为 4-1-1=2.
例1. 掷一颗骰子 60 次，结果如下：试在α= 0.05 水平下检验其是否均匀?
解: 这是一个分布的拟合优度检验，记出现点数 i 的概
率为 pi , 提出假设：
H0
:
p1

p2

...

p6

1 6
检验的拒绝域为:
W
{ 2

2 1
(k
1)}
现在α = 0.05，k = 6,查表得
基本原理和步骤如下:（连续型随机变量总体）
1. 将总体 X 的取值范围分成 k 个互不重迭的小区间（或小组）, 记作 A1, A2, …, Ak .
2. 把落入第 i 个小区间 Ai 的样本值的个数记作 ni ，称为实测频数. 所有实测频数之和 n1+ n2+ …+nk 等于样本容量 n.
H0：P(Ai) =pi , i=1,2,….k.
~ 2 k (ni npi )2

2(k 1)
i1 npi
注: 若在 H0下分布类型已知，但其参数未知，这时需要先用极大似然估计法估计参数，然后作检验.
Fisher证明了如下定理:
若原假设中的理论分布 F(x) 中有 r 个未知参数需用相应的最大似然估计来代替，那么当 n 充分大时，统计量
例如，从 1500 到 1931 年的 432 年间，每年爆发战争的次数可以看作一个随机变量，椐统计，这 432 年间共爆发了 299 次战争，具体数据如下:
战争次数 X
0 1 2 3 4
发生X 次战争的年数
223
142 48 15 4
Poisson分布?
对总体分布进行检验的问题称为分布的拟合检验.

e商务文档

2019-2020年人教统编4-3非参数假设检验幻灯片

相关文档推荐：