当前位置：文档之家› 非参数假设检验

非参数假设检验

(, t1 ], (t1 , t 2 ], , (t k 1 ,)
…,
t1
t2
tk-1
对随机变量取值数轴的分割
记 pi为总体在第 i 个区间上的概率值, 则有
p1 = P (X t1) = F(t1) p2 = P (t1 < X t2) = F(t2) - F(t1)
……
pk-1 = P (tk-2 < X tk-1) = F(tk-1) - F(tk-2) pk = P (X > tk-1) =1 - F(tk-1)
是由 n, m, (显著性水平)所决定的. 威尔可逊 ( Wilcoxon ) 给出了 W 的概率分布表, 对于给定的显著性水平 , 可以由威尔可逊概率分布表, 依据n, m, 查出 W1 , W2 . 若W W1 或 W W2 , 则拒绝H0: F(x) = G(x) (认为两个总体分布不同) 反之, 若W1 < W < W2 , 则接受H0: F(x) = G(x) (认为两个总体分布相同).
U1 nm n(n 1) w1 2
U 2 nm
m(m 1) w2 2
对给定 , 查U 值表, 得 U. 若U < U , 则总体分布相同. 注意: 方法 (1), (2), (3) 是两个总体分布的比较, 与分布的具体形式无关, 所以, 理论上可以用来检验两个任意形式的分布是否相同.
(2) 大样本情况下, 正负号个数检验法的处理
在大样本情况下( 即 mp 10 ), 可以近似地用正态分布来处理. 现在 p =0.5, 所以只要 m 20 即可. 用统计量:
Z U p ~ N (0,1) p (1 p ) m
在计算统计量 Z 的值z 时, 在式中要用 u (即n+ /m)代替U.
3. 检验两个总体的分布是否相同的第三种方法: Whitney 秩和检验法 ( 序号和检验法 )
Mann-
问题: 有两个总体的样本观测值 x1，x2,·,xn 与y1,y2 ,·,ym , · · · · 可能m n . 两组样本是可以各自独立颠倒顺序的. 检验这两组样本是否来自同一个总体 (或两组样本的总体分布是否相同). 同样, 把两组样本放在一起, 按样本观测值的大小重新排序, 那么每个观测值就有一个序号( 秩 ). 把第一组样本x1， x2，·，xn的序号(秩) 加总起来, 记为 w1 .把第二组样本y1 · · ，y2 ,·，ym的序号(秩) 加总起来, 记为 w2 . · · Mann-Whitney U检验的统计量是: U = min {U1, U2 } 式中:
(1) 小样本情况下, 正负号个数检验法的处理
小样本情况下, 正负号个数检验法的处理, 与 5.3.1 小节的处理原理相同, 只不过 5.3.1 节是单尾检验, 我们现在要做双尾检验 (检验两个方向的备择假设). 以计算“xi - yi>0的个数为 r ”的概率为例, 对给定的, 在假设p = 0.5 (H0假设)的前提下, 按照B(m, p) 的概率计算公式, 对 r 从小到大, 求累积概率:
第六章
非参数假设检验
§ 6.1 总体分布的非参数假设检验
非参数假设检验（分布检验）所处理的问题是：（1）两个总体的分布未知，它们是否相同（用两组样本来检验）；（2）（由一组样本）猜出总体的分布（假设），然后用（另一组）样本检验它是否正确。
需要注意的问题是，两种分布是否相同，一般包含了参数（均值、方差等）是否相同的问题。如果两个总体的分布函数形式相同，而参数不同，也将被判别为概率分布不同。
记 ni 为样本 x1，x2,·,xn 中落在区间 i 中的个数（频次或频 · · 数），那么，频率ni /n （n 至少为50，最好100 以上）与概率 pi 之差应当很小，否则就应当拒绝假设H0 (总体的累积概率分布函数为 F(x) ).
可以证明 (K. Pearson), 在 H0 成立的条件下, 统计量:
如果我们把xi = yi 的个数记为n0, 并从样本总数 n 中扣除, 则 m = n – n0 , 表示了n 个样本中 xi yi的个数。 m 个样本对中，把xi - yi > 0的个数记为n+ , xi - yi < 0 的个数记为n- , 则有m = n+ + n- . 设整数 r 满足: 0 r m, 则可以由下式计算出 “xi - yi > 0的个数为n+ ” 的概率 :
配对样本：
是按照问题本身的属性，“天然”配对的。也就是说，不能各自独立地颠倒顺序。
例：用两套问卷测量 20 个管理人员的素质，两套问卷的满分都是200分，两套问卷测得的结果如表：
卷A
卷B
147 150 152 148
146 151 154 147
155
152
146
147
149
148
148
146
151
于是, 我们又假设检验:
H0 : p = 0.5 ( 即 F(x) = G(x) )
H1 : p 0.5 (即 F(x) G(x)) . 对于显著性水平, 只要判断 | z |是否大于 z /2 ( 或者z的显著性水平是否小于), 就可以得出拒绝还是接受H0: p = 0.5 ( 即 F(x) = G(x) )了.
P(r k1 )

2
确保k1的外侧概率小于等于/2, 从而求出k1.
进而, 在假设p = 0.5 (H0假设) 的前提下, 按照B(m, p) 的概率计算公式, 对 r 从小到大, 求累积概率:
P(r k
2
)

2
确保 k2 的外侧概率小于等于/2, 从而求出k2 .
如果实际的“xi - yi > 0的个数n+ ”在(k1 ,k2)中就接受 H0 : p = 0.5 ( 即 F(x) = G(x) ), 否则拒绝H0 ,认为p 0.5, 即 F(x) G(x) .
根据上表, 算得正负号如下表:
+ + + + + + + + + + + 0 +
此时, 正负号的个数 m =19, 所要检验的参数 p =0.5 , mp10,我们这里按大样本类型来处理. 统计出正号的个数 n+ =12 . 设定随机变量 U , 若xi - yi > 0出现, 令U = 1 , 若xi - yi < 0出现, 令 U = 0 . 于是可以计算出 z 统计量的值如下:
16.40
16.00
17.10
16.90
问: 两种激励法的效果有无显著性差异(两种激励方法的总体分布是否相同)?
该检验问题可以用参数检验的方法来检验两种激励方法的平均效果有无显著性差异.
2. 检验两个总体的分布是否相同的另一种方法: Wilcoxon 秩和检验法 (序号和检验法)
设有两个总体的样本观测值 x1，x2，·，xn 与y1，y2 ,·， · · · · ym , 可能 m n . 两组样本是可以各自独立颠倒顺序的. 不妨设 n m , 把两组样本放在一起, 按样本观测值的大小重新排序, 那么每个观测值就有一个序号, 称为秩. 把样本个数少的这组样本x1，x2，·，xn的序号(秩) 加总起来, · · 记为 W . 如果两个总体的分布相同, 那么样本x1，x2，·， · · xn与y1，y2 ,·，ym 应当是均匀混合的, 也就是说, W 不能太 · · 小, 也不能太大. W 太小, 说明样本x1，x2，·，xn较多地集 · · 中在左段. W 太大, 说明样本 x1，x2，·，xn 较多地集中在 · · 右段. 由于n m , W 应当比另一组样本的序号之和小一些. 也就是说, W应当在某两个数字之间: W1 < W < W2. W1 , W2
§ 6.2 一个总体分布的非参数假设检验
1、检验总体分布是否与猜想的分布 F(x) 相同: 拟合优度 2 检验法问题: 假设(猜测)总体的概率密度函数为 f (x) ( 若总体为离散型, 则假设总体的概率分布列为 P {X = xi}= Pi ), 用一组样本 x1，x2,·,xn来检验假设是否成立. · · 作法: (1) 零假设H0 ：总体的累积概率分布函数为 F(x) , 备择假设H1 ：总体的累积概率分布函数不是 F(x). (2) 在数轴上选取 k-1 个分点 t1，t2,·, t k-1 , 将数轴上分 · · 为 k 个区间(可以是不等区间):
152
150
150
卷A
卷B
147 148 147 150
146 146 148 153
149
147
149
146
152
148
147
149
154
152
153
150
正负号检验的一个重要的前提是：样本xi 或 yi 不能各自独立地颠倒顺序。
ቤተ መጻሕፍቲ ባይዱ
例：用两套问卷测量 20 个管理人员的素质，两套问卷的满分都是200分，测得结果如上表。问：两套问卷有无显著性差异（本质是两套问卷的结果的分布是否相同）？
解：依据关于正负号的二项分布B（m，p）来检验 p 是否为0.5 , 即 H0 : p = 0.5 ( 即 F(x) = G(x) ) H1 : p 0.5 ( 即 F(x) G(x) ) .
如果接受 p = 0.5 的假设, 就接受F(x) = G(x)的假设, 否则就拒绝F(x) = G(x)的假设. 这种解决问题的思路是: 把非参数检验的问题转化为参数检验问题来处理.
例: 用两种激励方法, 分别对同样工种的两个班组(每个班组 7 个人)进行激励, 测得激励后业绩增长 (%), 数据如表:

e商务文档

非参数假设检验

相关文档推荐：