当前位置:文档之家› Brown-Mood中位数检验

Brown-Mood中位数检验


X M xy M xy 总和 a ma m
Y b nb n
总和 tab ( m n ) (a b ) N mn
xy
令A表示列联表中左上角取值a的X 样本中大于 M 的变量,在m、n及t固定时,A的分布在零源自设 下为超几何分布(对于不超过m的k)
m ( P (A k ) k ( t )( n tk ) ) ,k m mn
0
Mx My
Mx My
Mx My
PH (A a )
0
Mx M
A
2 m in(PH (A a ), PH (A a ))
0 0
对于水平 ,如果p-值小于 ,那么拒绝零假设 , 否则不能拒绝。 在m≠n时因A不对称,双边检验结果不那么理想。
例题3.1的解法
在例3.1中,a=6,b=10,m=17,n=15用备择假设 H 1: M X M Y 作单 边检验时,可以根据R软件超几何分布的语句phyper(6,17,15,16), 即p值=P(A≤a)等于phyper(a,m,n,a+b),得到p值为P(A≤a)= P(A≤6)= 0.07780674。根据这个p值,无法对常用的显著性水平0.05来拒绝零 假设。对于二个方差差不多相等的正态总体,该检验相对于t检验的 ARE为2/π=0.637.显然,它和单样本情况的符号检验同属一类这检 验为一般列联表的Fisher精确检验在2×2表情况的特例。如果用C表 示上面表中的矩阵
传统上,人们假设总体是正态分布或近似的正态分布, 然后利用两样本的T检验。但是关于总体是正态的假设并 不一定合理。在小样本时,近似也不一定合适。本章的 目标就是在对总体不作任何分布假设的前提下,解决两 样本检验问题。
两样本位置检验
例3.1 (数据:salary.txt, salary.sav)我国两个地区一些(分别为 17个和15个)城镇职工的工资(元): 地区1:6864 7304 7477 7779 7895 8348 8461 9553 9919 10073 10270 11581 13472 13600 13962 15019 17244 地区2:10276 10533 10633 10837 11209 11393 11864 12040 12642 12675 13199 13683 14049 14061 16079 人们想要知道这二个地区城镇职工工资的中位数是否一样, 这就是检验二个独立总体的位置参数是否相等的问题。
X样 本 M xy M xy 总和 a 6 m a 11 m
Y样 本 b 10 nb5 n
总和 t a b 16 N t 16 N m n 32
这里如果有和MXY相同的观测值,可以去掉它, 也可以随机地把这些相等的值放到大于或小于 MXY的群中以使得检验略微保守一些。 就本例来说,二个样本的中位数不很相同,如何 做正式的检验呢?可以看出上表是一个2×2的列 联表,由初等概率可知,对于一般的2×2列联表
计算
现在可以用上面A的分布,直接进行前面所提的单边检 验 ( H 1: M X M Y ) 。在给定m,n和t的时候,如果A的值a太 大或太小时就应该怀疑零假设。下表列出了Brown-Mood 中位数检验的基本内容。
检验基本内容
H0
Mx My
H1
Mx My
检验统计量
A A
y
P-值
PH (A a )
K mn
来进行检验,它有近似的自由度为1的卡方分布。
另外如果X和Y+θ有同样的分布,可求得
Mx My
[X 置信区间为: t c ' 1 Y c ' , X t c Y c 1 ]
其中c和c’满足: PH (A c) PH (A c ') 0 0
Brown-Mood中位数检验
假设(X1, X2, … ,Xm)~X, (Y1, Y2, … ,Yn)~Y,地区1样 本数据所代表的总体中位数为 M ,而地区2的为M
X
Y
H 0 : M x M y H1 : M x M y
检验原理:在零假设成立时,中位数如果一样的话,它 们共同的中位数,即这(15+17=)32个数的样本中位数(记 为MXY)。也就是说,在X1, X2, … ,X17或在Y1, Y2, … ,Y15 的 二个样本中,大于或小于混合后的中位数MXY的样本点应 该大致一样多。容易算得MXY =11301 ,在用两个样本和 MXY比较之后得到各个样本中大于和小于它的数目(见下 表)
第三章 两样本位置检验
第一节 Brown-Mood中位数检验
在单样本位置问题中,人们想要检验的是总体的中心是 否等于一个已知的值.但在实际问题中,更受注意的往 往是比较两个总体的位置参数;比如。两种训练方法中 哪一种更出成绩,两种汽油中哪一个污染更少,两种市 场营销策略中哪种更有效,两种药物中哪种更有效……
b 6 10 a C 5 m a n b 11 〃less〃)得到和 那么,可以用R软件的函数fisher.test(C,alt=
上面两样的p值。
可以看出,前面2×2表中a较大等价于m-a较
小,b较大等价于n-b较小,也就是说,根据形成2×2表 时的对称性(即行列可互换,行间及列间可互换),用a,b, m-a, n-b的任何一个数目都可以根据超几何分布语句 得到p值。
检验的大样本近似
在零假设下,在大样本情况时,可以使用检验统计 量所服从超几何分布的正态近似进行检验(包括连续性 的修正):
Z A 0 .5 m t / N m nt(N t) / N ~ N (0,1)
3
研究表明,该近似在min(m,n)≥12时相当精确。 另外,在双边检验时,对于大样本情况,可以用 2 Pearson卡方检验统计量 (2 a m ) ( m n )
相关主题