论文投稿领域:数理经济与计量经济学非参数统计检验方法的应用阮曙芬1 程娇翼 1 张振中2(1.中国地质大学数理学院,武汉 430074;2.中南大学数学科学与计算学院,长沙 410075)摘要:本文对非参数统计中常用的三种假设检验方法进行了简单的介绍。
运用Kruskal-Wallis 检验方法对2002年前三季度的上海股市综合指数收益率数据进行了周末效应的检验,结果表明2002年上海股市综合指数收益率不具有周末效应。
关键字:符号检验;Wilcoxon 秩和检验;Kruskal-Wallis 检验1引言非参数统计是统计分析的重要组成部分。
非参数假设检验是在总体分布未知或者总体分布不满足参数统计对总体所做的假定的时候,分析样本特点,寻找相应的非参数检验统计量。
本文就是以此为出发点,介绍了非参数统计中假设检验常用的几个检验方法:符号检验、Wilcoxon 秩和检验和Kruskal-Wallis 检验,然后结合具体的问题和数据,在统计软件SAS 中作相应的非参数检验。
2非参数假设检验介绍2.1 配对样本的符号检验符号检验是根据正、负符号进行假设检验的方法。
这种检验方法用于配对设计数值变量资料的假设检验,常常是差值不服从正态分布或者总体分布未知的情况下不能用t 检验的时候使用。
其原理是对差值进行编制并冠以符号,然后对正负秩和进行比较检验。
设随机变量12,,...,n X X X 相互独立同分布,分布为()F x ,()F x 在0x =连续。
假设检验问题2.2 两独立样本的Wilcoxon 秩和检验Wilcoxon 秩和检验的理论背景如下:有两个总体,一个总体的样本为12,,...,n X X X ,相互独立同分布,分布为()F x ;另一个样本为12,,...,n Y Y Y ,相互独立同分布,分布为()G x ,()F x ,()G x 连续。
问随机变量Y 是否随机大于随机变量X ,即检验0H :()()F x G x ≡,1H :()()F x G x ≥,且有某些点不等号成立。
将12,,...,n X X X ,12,,...,n Y Y Y 共m n +个随机变量一起排序,产生对应的秩11(,...,;,...,)m n R Q Q R R =。
则Wilcoxon 秩和检验统计量为:1ni i W R ==∑即12,,...,n Y Y Y 在混合样本中的秩的和为Wilcoxon 秩和检验统计量。
2.3多样本的Kruskal-Wallis 检验Kruskal-Wallis 检验一般对多个总体的分布情况进行检验。
其理论基础为:假设有m 种处理,对于第j 个检验体实行第i 种处理产生的效果记为ij x ,其分布函数为()i F x 。
即0H :12()()...()n F x F x F x ===;1H :存在i 和'i ,'()()i i F x F x ≠。
设观测值为{,1,2,...,;1,2,...,}ij x i m j n ==。
全体样本数为N ,ij x 的顺位记为ij r。
假定检验方法为:00,N N k k H k k H >→≤→拒绝不拒绝。
k 近似服从自由度为1m -的2χ分布。
因此2(1)m αχ-,2(1)N k m αχ=-为自由度为1m -的2χ分布的右侧的α分位数点。
3 Kruskal-Wallis 检验的应用股市的周末效应是指周一的收益率比其他交易日收益率低,且风险较大;周五的收益率比其他交易日高,且相对风险较小。
下面分别对2002年的前三季度的上证综合指数进行周末效应的分析。
本实证分析中,样本为2002年1月4日到2002年9月27日的上海股市综合指数(数据来源于/stock/company/sh000001/20031012.html )。
指数收益率的计算公3.1收益率分布状况的分析首先计算收益率序列的方差,均值,偏度和峰度初步判断该序列是否服从正态分布。
然后利用Kolmogorov-Smirnov 等检验结果对收益率进行正态性检验。
[SAS 程序]创建数据集:将excel 数据导入SAS 中,然后在分析家中利用数据计算得到: r0=p/lag1(p)和r=log(r0);data sasuser.chx1 sasuser.chx2 sasuser.chx3 sasuser.chx4 sasuser.chx5; set sasuser.ch01; select (w);when(1) output sasuser.chx1;when(2) output sasuser.chx2;when(3) output sasuser.chx3;when(4) output sasuser.chx4;when(5) output sasuser.chx5;end;run;proc univariate data=sasuser.ch01;var r;run;[SAS结果输出]见表1汇总偏度和峰度分别为0和3,所以我们可以初步断定指数收益率序列为非正态分布。
为了进一步图1 上证综合指数收益率分布的直方图图2 上证综合指数收益率分布的概率图包括Kolmogorov-Smirnov检验统计量在内的四种检验正态分布的检验统计量均表明上海综合指数收益率序列不服从正态分布,图1和图2也说明了这一点。
所以要采用非参数方法进行以后的周末效应的检验。
3.2周末效应存在性的Kruskal-Wallis检验我们利用Kruskal-Wallis检验2002年前三季度上证综合指数收益率的周末效应的存在性。
[SAS程序]proc npar1way wilcoxon data=sasuser.ch01;class w;var r;run;[SAS结果输出]-------------------------------------------------------------------------T he NPAR1WAY ProcedureWilcoxon Scores (Rank Sums) for Variable rClassified by Variable ww N Sum of Scores Expected Under H0 Std Dev Under H0 Mean Score5 33 2576.0 2805.0 252.150749 78.0606061 34 2610.0 2890.0 255.000000 76.7647062 34 3206.0 2890.0 255.000000 94.2941183 34 2996.0 2890.0 255.000000 88.117647 4 34 2977.0 2890.0 255.000000 87.558824Kruskal-Wallis Test Chi-Square 3.0846 DF 4 Pr > Chi-Square 0.5438------------------------------------------------------------------------- K -W 检验得2χ=3.086,df =4,p =0.53480.05>,所以不能拒绝0H ,即周一到周五得上证综合指数收益率得分布125()()...()F x F x F x ===,所以我们认为在2002年的前三季度中,上海市股市综合指数收益率不存在周末效应。
参考文献:[1] Damodar N. Gujarati. Basic Econometrics.北京:中国人民大学出版社,2005. p791-p800. [2] George E. P. Box, Gwilym M. Jenkins, Gregory C. Reinsel. Time Series AnalysisForecasting And Control.[3] 何书元. 应用时间序列分析. 北京:北京大学出版社, 2003. p218-p226. [4] 张卓. SAS 软件的应用. 统计与信息论坛(2005),Vol.20, No.4. p104-p106. [5] 樊欣,邵谦谦.SAS 8.X 经济统计.北京:北京希望电子出版社,2003. p28-p60.[6] 岳朝龙,黄永兴,严钟. SAS 系统与经济统计分析. 合肥:中国科学技术大学出版社, 2004. p469-p487 [7] 李彦萍.发达与非发达地区收入与消费非参数统计分析.山西农业大学学报(2005),Vol.4, No.4.p334-p339.[8] 刘彤.利用非参数方法对上海股市周末效应的研究.数理统计与管理(2003),Vol.22,No.1.p69-p71.Application of Nonparametric statistical MethodRUAN Shu-fen ,CHENG Jiao-yi ,ZHANG Zhen-zhong(School of Mathematics and Physics, China University of Geosciences, Wuhan 430074) Abstract: In this paper, we simply introduce three common hypothesis tests. Using the Kruskal- -Wallis test, we do week effect test about the shanghai synthetic index of which we take the first three quarters of 2002 for samples. Showing that during the year of 2002, the yield of shanghai stock market synthetic index has no week effect.Keywords: singed test; wilcoxon rank sum test; Krtuskal-wallis test.。