第3章 两样本的非参数检验
利用两个相关样本进行研究,对于某些问题是 很方便的。但现实中要做到很好配对并不容易。 若由于配对不当或无法配对,就要使用两个独 立样本的非参数检验方法:Brown-Mood检验 法,Mann-Whitney-Wilcoxon检验法,Wald2 Wolfowitz游程检验法, 检验法, Kolmogorov-Smirnov检验法等。两个独立样 本可以各自从两个总体中随机抽选获得,也可 以对随机抽样的一个样本诸元素随机分别实施 两种处理而形成。
检验步骤:
(1)提出假设: H 0 : MDi 0或P( Di 0) P( Di 0) H 1 : MDi 0或P( Di 0) P( Di 0) H : MDi 0或P( Di 0) P( Di 0) H : MDi 0或P( Di 0) P ( Di 0) (2)计算检验统计量 a.计算 xi yi (i 1, 2......n), 并将n个绝对值排序, 找出各自相应的秩。如果有相同的样本点, 每个点取平均秩。 b.求秩和W 和W _ , 并求W min(W ,W _ )
检验步骤:(1)提出假设
H 0 : P( xi yi ) P( xi yi )对所有i H 1 : P( xi yi ) P( xi yi )对某一i 如果关心的是某一总体 中位数是否大于另一 总体中位数,则可建立 单侧备择: H : P( xi yi ) P( xi yi ) xi有大于yi的趋向 H : P( xi yi ) P( xi yi ) yi有大于xi的趋向
3.2.2 应用
例1
根据3.1.2中的例题,利用Wilcoxon检验法 检验参考资料能否促进学生掌握知识
(a=0.05)
解:()提出假设 1 H 0 : P( xi yi ) P( xi yi ) H 1 : P( xi yi ) P ( xi yi ) (2)计算检验统计量 T 3.5 5.5 9 T 5.5 10 7 8 11.5 2 3.5 1 11.5 9 69 T min(T , T ) 9 (3)做出决策 根据n 12, T 9查表得 P 0.008, 对于 0.05, P值 太小,数据不支持H 0,可以认为参考资料对于学生有用
3.2 Wilcoxon符号秩和检验法( Wilcoxon Signed-Rank Test)
3.2.1基本方法与检验步骤 两个相关样本的 Wilcoxon符号秩和检验法也是用 来 检验配对样本是否有差 异的方法。它不仅借助 于两 个样本差值的符号,而 且利用了差值的大小, 因此它 比符号检验法更精确。 设X , Y是两个连续总体,且均 具有对称的分布,随机 地 分别从两个总体中抽取 个观察值,组成 个数对(x1, y1) n n ( x 2, y 2)......(xn, yn).记D xi yi, 若X与Y具有相同的分布,则 等式:P( Di 0) P( Di 0)成立,即xi大于yi的概率与xi小 于yi的概率相等。这也意味 着全部差值Di的中位数等于 , 0 即MDi 0
3.1.2 应用
例.为帮助学生通过自学提高对知识的掌握, 有关专家编辑了符合教学大纲的教学参考 资料。为了研究“教学参考资料对于指导 学生自学是否有效”这一问题,随机选取 了15名学生进行测试,学生使用参考资料 前的试卷(A)得分与使用参考资料后的 试卷(B)得分列在下表内(A卷与B卷的范 围,内容与难度相当):
3.3.1 检验思想与检验方法 假设 x1 , x2 ,, xm 和 y1 , y2 ,, yn 是两个相互独立
3.1.2 应用
学生编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
A卷成绩
70
75
70
80
70
70
70
76
75
71
75
75
75
82
75
86
75
70
78
80
76
80
75
75
79
80
72
83
75
83
B卷成绩
这些资料能否说明参考资料能够促进学生掌握知识 0.05
解:()提出假设 1 H 0 : P( xi yi ) P ( xi yi ) H 1 : P ( xi yi ) P ( xi yi ) 这里xi为第一次测试的成绩,yi为第二次测试的成绩。 (2)计算检验统计量 S 2, S 10, n 2 10 12, min( S , S ) 2 (3)确定拒绝域 1 2 i a.计算p.P( K k ) P( S 2) 12 c12 2 i 0 1 (1 12 66) 0.019287 4096 ( Excel计算“=BINOMDIST(2,12,0.5,TRUE)” ) p , 数据不支持H 0, 可以认为参考资料能够促进学生掌握知识。 b.查表,查n 12, 0.05得界域(3, 9),所以拒绝H 0,可以认为参 考资料有用。
相关样本的获取有两种方式: 1.让每一研究对象做自身的对照者 2.将研究对象两两配对,分别给每一对两 个成员以不同的处理。在进行配对时,应 让每一对在可能影响处理结果的其他因素 方面尽量相似,以尽量避免和减少附加差 异。一般来说,用研究对象自身作为对照 者要优于配对方法,因为在配对过程中很 难完全控制住其他的影响因素。两个相关 样本的非参数检验方法主要有符号检验法 和Wilcoxon符号秩和检验法。
(3)确定拒绝域 a.根据检验统计量W和a查《Wilcoxon符号 秩和检验表》以得到在零假设下的 p 值 如 果 p小于给定的显著性水平,拒绝零假设 ;反之不能拒绝零假设。 b.如果n很大,要用正态近似,得到一个与 W有关的正态随机变量z值,再查正态分布 表得到 p 值,最后将 p 与a作比较。
本章主要介绍两个相关样本和两个独立样本的非 参数检验方法,包括: 3.1 符号检验法(相关样本) 3.2 Wilcoxon符号秩和检验法(相关样本) 3.3 Brown-Mood检验法(独立样本) 3.4 Mann-Whitney-Wilcoxon检验法(独立样本) 3.5 Wald-Wolfowitz游程检验法(独立样本) 2 3.6 检验法(独立样本) 3.7 Kolmogorov-Smirnov检验法(独立样本)
3.1 符号检验法(Sign Test)
3.1.1 基本思路与检验步骤(同第二章) 设有两个连续总体x,y,累积的分布函数分别为F(x),F(y)。 随机的分别从两个总体中抽取数目为n的样本数据, ( x1, x 2,....... n) x 和 ( y1 , y2 ,, yn ) 将它们 配对得到 ( x1, y1) ( x 2, y 2) ......(xn, yn ) 若研究的问题是它们是否具有相同的分布,即F(x)=F(y) 是否成立,由于x,y的总体分布未知,而研究者也不关 心它们的具体分布形式,只是关心分布是否相同,因而 可以采用位置参数进行判断。若两个样本的总体具有相 同的分布,则中位数应相同,即在n个数对中,Xi大于 yi的个数与Xi小于yi的个数应相差不大。
例2:
用A,B两种材料生产的产品其寿命检测记
录如下:
产品使用寿命统计表
产品编号 A材料 B材料
单位:小时
A材料0
1610
11
1520
1505
2 3 4 5 6 7 8 9 10
1630 1580 1560 1590 1620 1610 1650 1579 1510
1550 1560 1572 1588 1620 1605 1636 1590 1520
(3)确定拒绝域
k k i n
1 i 1 n i P( K k ) ( K i ) c ( ) ( ) 2 2 i 0 i 0 如果2 P , 拒绝H 0; 否则不能拒绝H(双侧) 0 如果P , 拒绝H 0; 否则不能拒绝H(单侧) 0 也可以查表确定拒绝域。
Excel计算“=NORMSDIST(-1.71)” 说明不能拒绝零假设,即两种材料对产品使用寿命 没有显著影响。
3.3 Brown-Mood检验法
Brown-Mood检验法是一种位置参数检验,主 要用来检验两个独立样本的中位数是否相同。 X和Y位置参数相同零假设的表述方法: 1.P(X>Y)=P(X<Y)=1/2 2.分布函数F(X)=F(Y) 3.X+a和Y同分布,且有:当a大于0时,X<Y; 当a小于0时,X>Y 4.中位数 M x M y
12 13 14 15 16 17 18 19 20
1643 1530 1486 1474 1480 1628 1492 1556 1625
1650 1508 1470 1480 1475 1588 1510 1490 1568
试分析两种材料对产品的使用寿命由无显著性影响(a=0.05)
解:
( )提出假设 1 H 1 : 两种材料对产品使用寿 命影响显著( i的中位数 0) D
第三章 两样本非参数检验
在单样本非参数检验中,研究者可以解决诸如一个 总体的中心是否等于一个已知的值,某个随机变量 是否服从某种特定的分布,某个序列是否具有随机 性等问题。然而在实际中,更受注意的往往是比较 两个总体的位置参数。比如,两种训练方法中哪一 种更出成绩,两种汽油中哪一种污染更小,两种营 销策略中哪种更有效,两种药物哪一种的治疗效果 更好等等,这就需要使用两样本的非参数方法,第 三章中所介绍的方法大都适用。
在抽取样本时有两种形式:相关的和独立 的。若第一次抽样的所有样本某一属性的 测量结果,不影响第二次抽样的所有样本 同一属性的测量结果,则这种抽样是独立 的,若第一次抽样的测量结果影响另一次 抽样测量结果,则这种抽样是相关的。为 了避免或者尽量减少由于其他因素影响引 起的两组之间的附加差异,得到更准确地 结论,研究中通常采用两个相关的样本。