当前位置:文档之家› Wilcoxon符号秩检验

Wilcoxon符号秩检验

第二节Wilcoxon符号秩检验
Wilcoxon符号秩检验
符号检验只用了差的符号,但没有利用差值的
大小。

1
2 3Wilcoxon符号秩检验(Wilcoxon signed-rank test) 把差的绝对值的秩分别按照不同的符号相加作为其检验统计量。

显然,相比较于符号检验,Wilcoxon符号秩检验利用了更多的信息。

Wilcoxon符号秩检验:条件
u Wilcoxon符号秩检验需要一点总体分布的性质;它要求假
定样本点来自连续对称总体分布;而符号检验不需要知道
任何总体分布的性质。

u在对称分布中,总体中位数和总体均值是相等的;因此,
对于总体中位数的检验,等价于对于总体均值的检验。

u Wilcoxon符号秩检验实际是对对称分布的总体中位数(或
均值)的检验。

Wilcoxon符号秩检验:基本原理
u计算差值绝对值的秩。

u分别计算出差值序列里正数的秩和(W+)以及负数的秩和(W-)。

u如果原假设成立,W+与W-应该比较接近。

如果W+和W-过大或过
小,则说明原假设不成立。

u将正数的秩和或者负数的秩作为检验统计量,根据其统计分布计
算p值,从而可以得出检验的结论。

具体步骤
设定原假设和备择假设。

分别计算出差值序列中正数的秩和W+以及负数的秩和W-。

根据W+和W-建立检验统计量,计算p值并得出检验的结论。

在双侧检验中检验统计量可以取为W=min(W+,W-)。

显然,如果原假设成立,W+与W-应该比较接近。

如果二者过大或过小,则说明原假设不成立。

秩的计算注意问题
计算差值绝对值的秩时,注意差值等于0值不参与排序。

下面一行R i就是上面一行数据Z i的秩。

Z i159183178513719 R i75918426310
数据中相同的数值称为“结”。

结中数字的秩为它们所占位置的平均值
Z i159173178513719 R i758.518.5426310
关于P值
u有了检验统计量W,我们就可根据其统计分布计算p值了,双侧
检验的p值等于,式中w为检验统计量的样本观测值。

W的统计分布比较复杂,小样本时应使用精确检验的结果或者查
专门的表格,大样本(n>50)时可以按照正态分布进行近似计算。

u左侧检验时(备择假设为差值总体的中位数<0)检验统计量可
以取为W=W+,右侧检验时(备择假设为差值总体的中位数>0)
检验统计量可以取为W=W-。

这时检验中的p值等于P(W w)。

u由于W+与W-的对称性(W++W-=n(n+1)/2),检验统计量的取法也
可以不同于以上设置。

案例
下面是10个家庭一年的教育支出占
一年的总消费支出的比例(%),
数据以升序排列。

有人估计,家庭
消费中教育支出占比的中位数为
8%,这种说法是否可靠?
家庭12345678910比例% 4.12 5.817.639.7410.3911.9212.3212.8913.5414.45
秩符号
4.12 3.885-
5.81 2.193-7.630.371-
9.74 1.742+
10.39 2.394+
11.92 3.926+
12.32 4.327+
12.89 4.898+
13.54 5.549+
14.45 6.4510+秩和W-=9 W+=46
检验统计量W=W-=9
P值=0.06445
对a=0.05不能拒绝原假设如果使用符号检验
S-=3 S+=7
检验统计量S=S-=3
P值=0.34375
对a=0.05不能拒绝原假设
Wilcoxon符号秩检验不但利用了符号,还利用了数值本身大小所包含的信息。

当然,Wilcoxon符号秩检验需要关于总体的对称性和连续性的假定,在这样的假定下, Wilcoxon符号秩检验比符号检验更加有效,如果对称性不成立,还是符号检验更有效。

u在大样本的情况下,n太大而无法查表时,可用正态近似。

u由此可以构造大样本渐近正态统计量,其公式为:
u计算出Z值后,可由正态分布表查出p值。

R实现
R软件中,关于中位数的wilcoxon符号秩检验可以使用wilcox.test()函数。

以上一案例为例,假定样本数据为x,原假设为中位数是8,则双边检验的命令为wilcox.test(x-8)。

对于右侧单边检验1:>8,用命令wilcox.test(x-8,alt=“greater”)。

对于左侧单边检验1:<8,用命令wlicox.test(x-8,alt=“less”)
> x<-c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)
> wilcox.test(x-8)
Wilcoxon signed rank test
data: x - 8
V=46, p-value=0.06445
altrnative hypothesis: true location is not equal to 0。

相关主题