当前位置:文档之家› 非参数假设检验

非参数假设检验


npi
312.75 104.25 104.25 34.75
ν i − npi
2.25 -3.25 3.75 -2.75
(ν i − npi ) 2
5.0625 10.5625 14.0625 7.5625
(ν i − npi ) 2 npi
0.0162 0.1013 0.1349 0.2176 0.47
i =1
m
出现的频数,而 ai 出现的频率为
显然 ∑
m
i =1
f i = ν i / n , i = 1,2, " , m f i =1 。根据样本值把 a i 的频数和频率列
成表格,称作频数分布表和频率分布表。频率分布 表近似地给出了总体 X 的分布律。
例 对 100 块焊接完的电路板进行检查,每块 板上焊点不光滑的个数的频数分布表和频率分布表 如下表所示: 频数、频率分布表 ai (不光滑焊点数) 1 2 3 4 5 6 合计
解: 按题意需检验假设
e 2π ( − ∞ < x < +∞ ) ˆ = X = 1.406 , 由于 µ , σ 2 未知,用极大似然估计法得 µ
2 2 ˆ 将 X 的可能取值区间[0,+ ∞ ) σ = S n = 0.002322 。
H 0: X 的分布密度为 f ( x) =
1
−( x − µ ) 2 / 2σ 2
V=
m +1 (ν

i
i =1
− np i ) 2 np i
作为假设检验 H 0 的统计量,并给出了以下定理。 定理 2-3 若 n 充分大( n ≥ 50 ) ,则当 H 0 为真 时, (不论 H 0 中的分布属于什么分布) ,上述统计量
总是近似的服从自由度为 m − r 的 χ 2 分布,其中 r 是 被估计的参数的个数。
nrs
n⋅ s
n⋅ j
n
表 2-6 中
ni⋅ = ∑ nij
j =1
s
n⋅ j = ∑ nij
i =1
r
n = ∑ n i ⋅ = ∑ n⋅ j
i =1 j =1
ν i (频数)
f i (= ν i / 100)
ai (不光滑焊点数)
4
4%
4
4%
5
5%
10
10%

9
9%
15
15%
47 0.47 合计 53 0.53
7 15
15%
8 14
14%
9 9
9%
10 7
7%
11 5
5%
12 3
3%
ν i (频数)
f i (= ν i / 100)
从上表可大体知道这批电路板不光滑焊点的分 布情况, 可近似地作为 “每块板上不光滑焊点个数 X 的分布律。
由于 α = 0.05 ,自由度为 3,查 χ 2 (3) 分布表,得
λ = 7.815 。而 V = 0.47 < 7.815 ,故在 α = 0.05 下接受 H 0 ,
即认为这些植株符合孟德尔所提出的 9:3:3:1 的理论 比例。
四、独立性检验
Y 设随机向量 ( X , Y ) ,X 的可能取值为 x1 , x 2 , ", x r , 的可能取值为 y1 , y 2 , " , y s ,今对 ( X , Y ) 进行 n 次独立观
根据频率和概率的关系, H 0:F ( x) = F0 ( x) 成立时, νi 2 即 应该 ( − p ) ν i / n 与 pi 相差不大( n 较大时) i n 比较小。于是,
n V = ∑ ( − pi ) × (也 应 该 比 较 小 ) pi i =1 n
2
m +1
νi
基于这种想法,皮尔逊使用了
作图区间[ a,b ];
( 3 ) 在区间[ a,b ] 中插入若干个分点,
a = t 0 < t1 < " < t r −1 < t r = b
将区间[ a,b ]划分成 r 个左开右闭的小区间 ( t i −1 ,t i ],一般取等分点,且使落入每个小区间 的数据不少于 5 个;
(4)以 ni 表示落入第 i 个小区间( t i −1 ,t i ]内的 数据个数,计算观测数据落入每个小区间的频率
分为 10 个互不重叠的小区间 (ti , ti +1 ] i = 1, 2," ,9,10 ,
当 H 0 为真时,可得 pi 的估计如下:
ti +1 − 1.406 ti − 1.406 ˆ ˆ i = P{ti < X ≤ ti +1} = Φ ( ) − Φ( ) p 0.002322 0.002322 ˆ1 = 0.0106 , p ˆ 3 = 0.0986 , ˆ 2 = 0.0358 , p 即 p
ˆ 4 = 0.1865 , p ˆ 5 = 0.2426 , p ˆ 6 = 0.2168 , p ˆ 7 = 0.1331 , p ˆ 9 = 0.0163 , ˆ 8 = 0.0561 , p p ˆ10 = 0.0037 ,将结果列如表 2—4。 p
根据每个小区间的样本点不少于 5 个,进行并组后 由于参数个数为 2,对显著性水平 α = 0.05 , m = 6, 查自由度为 4 的 χ 2 ( 4) 分布表得 λ = 9 . 488 .
对于假设检验 H 0:F ( x ) = F0 ( x ) ,通常是进行 χ 2 检验。
若总体 X 是离散型,则假设相当于 H 0 :总体 X 的分布律为 P{ X = xi } = p i ,
若总体 X 是连续型,则假设相当于
i = 1,2, "
H 0: 总体 X 的分布密度为 f ( x ) 。
测,发现 { X = xi , Y = y j } 的次数为 nij ,要据此检验假设
H 0 : X 与 Y 相互独立。
表 2-6 联列表
(2-71)
ys
ni ⋅
n1⋅ n 2⋅ nr⋅
Y
X
x1 x2
xr
y1
n11
n21
y2
n12
n22
"
"
"
……
n1s n2 s
n r1 n⋅1
nr 2 n⋅ 2
" "
显然 V = 2.8761 < 9.488 = λ ,因此接受 H 0 ,即
认为纤度 X 服从正态总体。
表 2—4
[t i , t i +1 )
νi
1 4 7 22 23 25 10 6 1 1
npi
ν i − npi
0.36 -2.86 3.35 -1.26 3.32 -3.31 0.39
(ν i − npi ) 2
0.1296 8.1796 11.2225 1.5876 11.7649 11.0224 0.1521
(ν i − npi ) 2 / npi
0.0279 0.8296 0.6107 0.0654 0.5084 0.8231 0.0200 2.8761
[0,1.295) [1.295,1.325) [1.325,1.355) [1.355,1.385) [1.385,1.415) [1.415,1.445) [1.445,1.475) [1.475,1.505) [1.505,1.535) [1.535,+ ∞ ) Σ
′ , x2 ′ ,", xn ′ ,以便计算机处理。为方便起见,仍把变 x1
′ , x2 ′ ,", xn ′ 记作 x1 , x 2 ," , x n 。 换后的值 x1
( 2 ) 将样本值 x1 ,x2 ," ,xn 依大小顺序重新排 列成:
* * * x1 ≤ x2 ≤ " ≤ xn
* * 取略小于 x1 的数 a 及略大于 x n 的数 b 以确定适当的
用 p i 表示 X 取值落入第 i 段的概率。
如果 H 0:F ( x) = F0 ( x) 成立,则 pi 可以算出来。 p1 = P{ X ≤ t1} = F (t1 )
pi = P{ti −1 < X ≤ ti } = F (ti ) − F (ti −1 ) (2 ≤ i ≤ m)
pm +1 = P{ X > t m } = 1 − F (t m )
ti ti −1
f ( x)dx
其中 f ( x) 为 X 的密度函数,从而 f i ≈ f (ξ i )∆t i , f i / ∆t i ≈ f (ξ i )
由此可见,频率直方图的上部轮廓线即是 X 的密度 函数的良好近似。
二、总体分布函数的假设检验 H 0:F ( x ) = F0 ( x ) 。
当总体 X 是连续型随机变量时, 可用直方图来处 理数据(样本值)。设 x1 , x 2 ," , x n 是总体 X 的一组样 本值。处理步骤如下:
Sample value
(1)简化数据,令
xi′ = d ( xi − c) , i = 1,2, " , n
由于样本值总是在总体 X 的数学期望附近波动, 它们通常是一组数值比较接近的数, 可以选取适当的 常数 c 和 d ,把 x1 , x 2 ," , x n 化简成位数较少的整数
1.06 3.58 9.86 18.65 24.26 21.68 13.31 5.61 1.63 0.37
三、符合性检验
检验实际资料与根据科学假设所得的理论数 据是否吻合的问题,叫做符合性检验问题。 例 2-27 孟德尔在著名的豌豆杂交试验中,用 结黄色圆形种子与结绿色皱形种子的纯种豌豆作 为亲本进行杂交, 将子一代进行自交得到子二代共 556 株豌豆,发现其中有四种类型植株 黄圆 黄皱纹 绿圆 绿皱 315 株 101 株 108 株 32 株 试问: 这些植株是否符合孟德尔所提出的 9: 3: 3: 1 的理论比例(取 α = 0.05 )?
相关主题