收益率分布的实证分析
摘要: 本文从实证出发多角度考察了上证综指和深证综指收益的分布特性。 在拒绝了正态性 假设以后,我们利用国际上考察股票收益分布所使用的几个分布函数——逻辑斯谛分布、 Scaled-t 分布、指数幂分布、混合正态分布——对股指收益数据分别进行拟合。然后对拟 合出来的分布函数运用拟合优度检验, 并比较各种拟合分布下 VaR 值与历史模拟的差别, 我 们发现 Scaled-t 分布和混合正态分布能够较好地模拟股指收益。特别地在尾部 Scaled-t 分布比混合正态分布拟合效果更好,能够更好地帮助投资者正确估计市场风险。此外,我们 比较了正态分布和 Scaled-t 分布的差别,由此量化用正态分布模拟股指收益可能带来的对 高收益和高损失可能性的低估。 关键词: 股指收益 正态分布 分布 VaR 逻辑斯谛分布 Scaled-t 分布 指数幂分布 混合正态
表 2 的结果表明,与国际及国内的实证经验一样,我们的检验结果也说明股指收益的 正态性分布假设不能成立。这促使着我们去寻找更合理的分布假设。
三
股指收益的备择分布
为了分析究竟何种分布更确切地描述了股指收益,下面将考虑另外四种分布,并对其 拟合的效果进行分析。 (1) 逻辑斯谛分布(Logistic Distribution)
Var ( Rt ) = σ 2 。
(3)指数幂分布(Exponential 2
1 x − µ 1+ β exp[− ] 2 α 指数幂分布的密度函数可以写成 f ( x) = 3+ β ( ) 3+ β 2 2 αΓ( ) 2
其中 µ ( −∞ < µ < ∞ )是位置参数, α ( α > 0 )是离散化参数, β ( −1 < β ≤ 1 ) 是描述形状的参数。 β 反映了分布的峰度, −1 < β < 0 意味着低峰态; β = 0 时即为正态 分 布 ; 0 < β ≤ 1 表 示 尖 峰 态 。 如 果 股 指 收 益 Rt 满 足 指 数 幂 分 布 , 则 E ( Rt ) = µ ,
一
引言
研究中国股市收益分布, 不仅有助于我们认识中国证券市场的内在运行规律, 从而采取 正确的证券市场监管措施, 而且可以帮助市场参与者进行资产定价与资产组合, 正确进行风 险度量,更好地使用现代风险管理技术,因此有着重要的实践意义。 西方的计量经济学家们对于证券资产收益率分布的研究由来已久。早在1950年代, Kendall(1953)和Osborne(1959)就通过对英国和美国股市收益率的数据分析研究认为: 股票 资产的收益率近似服从正态分布。 这种观点符合统计学中的大样本思想, 再加上正态分布的 性质容易处理,从而广为研究人员和业界所接受。比如1973年提出的Black-Scholes公式就 是以对数收益率满足正态分布为基础建立起来的;资本资产定价模型(CAPM)假定收益是关 于时间独立同分布的,其联合分布为多变量正态;1994年 J. P. Morgan公司推出的VAR 系 统Risk Metrics, 实质是假设有价证券的收益率服从正态分布。 股票收益的正态分布假设被如此广泛地应用着,但反对它的声音却从未间断过。 Alexander(1961)对 Osborne 的数据重新进行了分析,认为尖峰、厚尾是证券资产收
[v /(v − 2)]1/ 2 。迄今为止国内的文献中大多用的是 t 分布这个名词,但是涵义并不相同,林
美艳、薛宏刚、赵凤群(2003)文中的 t 分布就是学生 t 分布,封建强、王福新(2003)中 将 Scaled-t 分布直接翻译为 t 分布。 这些文章主要利用 t 分布拟合收益, 本文在用包括 Scaled-t 分布在内的 5 种分布拟合收益并相互比较的同时, 还将详细分析 Scaled-t 对市场风险的正确 评估以及与收益的正态分布假设的本质缺陷。
从表 1 第 6 列可以看出上证综指、 深证综指均为负偏, 显示收益分布曲线向负轴方向倾 斜,深证综指的偏斜程度更大一些。 从第 7 列可以看到 A 股股指收益均有很明显的尖峰特征, 从而比正态分布厚尾。 这说明 了存在一些大幅度偏离均值的异常值。 表 1 的数据为股指收益偏离正态性分布提供了证据, 但是我们可以通过正态性检验来得 到更正式的结论。我们采用国家标准 GB4882-85《正态性检验》中提供的 D 检验方法,D 检 验的适用范围是样本量在 50 以上。D 检验的数据结果如表 2: 表 2:股指收益的正态性检验(D 检验) 股指 上证综指 深证综指 样本量 n 1400 1400 统计量 Y -35.08 -34.22 分位数 Y0.005 -2.91 分位数 Y0.995 2.25 结论 拒绝正态性假设 拒绝正态性假设
逻辑斯谛分布密度函数可以写成 f ( x) =
exp(
x−µ
α
) )]2
α [1 + exp(
x−µ
α
其中 µ ( −∞ < µ < ∞ )是位置参数,α ( α > 0 )是离散化参数。如果股指收益 Rt 满 足逻辑斯谛分布,则 E ( Rt ) = µ , Var ( Rt ) = π (2)Scaled-t 分布 Scaled-t 分布的密度函数可以写成 f ( x) =
* †
本研究由国家自然科学基金和 MADIS 的资助。 单位:中国科学院管理决策与信息系统重点实验室。 ‡ 单位:中国科学院管理决策与信息系统重点实验室、中国科学院研究生院虚拟经济与金融研究中心。
益率的基本特征,用正态分布来描述金融资产的短期收益率是不太合适的。 Peters(1991)发现 1928 到 1989 年的 S&P500 股票收益呈现负偏、尖峰、厚尾的特征。 从学术的角度去看, 当信息没有及时为整个市场所知或者投资者没有对信息做出及时反 应的时候,正态分布假设确实是值得怀疑的。如果信息按照一簇一簇传到市场,而不是按照 线性方式及时地到达,从而导致信息的分布呈尖峰态,股票收益的分布将因此受到影响。另 外,即使信息能够流畅地传到市场,但投资者并没有及时做出反应,而是当一些信息堆积起 来的时候,投资者才会消化这些信息,这样也能导致股票收益分布的尖峰态。对此,Peters (1991)做出了理论性的推导。 近年来很多学者, 对这一问题作了进一步的研究,尝试了用一些各不相同的分布来描述 股票资产的对数收益率,从而考虑到它的尖峰、厚尾、负偏特征。 Smith(1981)首先提出用逻辑斯谛分布来模拟股票收益,这种分布近似于正态分布, 不过比正态分布厚尾。其后,Gray 和 French(1990) 、Peiró(1994)对逻辑斯谛分布的拟合 优劣性作了进一步的分析。 Hsu(1982) 、Gray 和 French(1990)曾经讨论过指数幂分布,这种分布具有尖峰和厚 尾的特征,尾部以指数级的速率缩小,因而可以给股票收益分布给出一个不错的拟合。 Press(1967)认为证券收益由一个连续的扩散(布朗运动)和一个间断的跳跃(泊松 过程)组成:前者造成了证券价格的连续变化,后者反映了消息面带来的较大的震动。Kon (1984)为这种混合正态分布找到了实证的证据。 Praetz (1972) 、 Blattberg 和 Gondes (1974) 、 Gray 和 French (1990) 、 Felipe 和 Javier (1997) 认为 Scaled-t 分布比其它分布更好地拟合了股票收益。当自由度增大到较大时, Scaled-t 分 布趋同于正态分布。特别地,Praetz(1972)在假设证券收益波动性是一个时变的随机变量 的条件下,从理论上推导出证券收益的分布满足 Scaled-t 分布。遗憾的是,他的理论推导微 有瑕疵。 近年来人们对中国股票市场收益的分布特征也进行了一些相应的分析与研究。 闫冀楠、张维(1998)分别用指数幂分布、ARCH 模型、混合正态分布拟合了 1990 年 至 1996 年上证综指收益的分布,结果显示这三种分布都比正态分布更具刻画力,且其中混 合正态分布为最佳。 陶亚民,蔡明超,杨朝军(1999)分别运用柯氏检验法和异方差的 t 检验法对上海股票 市场股票收益率的分布特征进行了实证分析。 研究认为在排除异常事件干扰的情况下, 收益 率服从正态分布。 陈启欢(2002)认为中国的股票市场的收益率从整体上完全不符合正态分布,而大体上 符合自由度 5~9 的 t 分布。 封建强、 王福新 (2003) 考察了描述股票收益率的多类分布函数的基础上, 以稳定 Paretian 分布与 t 分布为备择分布,研究了沪、深股市综指收益率的分布函数的形式。 林美艳、薛宏刚、赵凤群(2003)用 JB 检验法,得出了上证综合指数收益率分布与正 态分布有明显的偏差,用 t 分布对日收益率进行拟合的效果比较好。 有关中国股市收益分布的其它研究, 还可参见张维、 黄兴 (2001) , 李亚静、 朱宏泉 (2002) , 马玉林、施红俊、陈伟忠(2003)等。 本文中将会考察上证综指、 深证综指的分布特性。 首先对数据的基本统计量作些分析, 接着我们通过 D 检验验证正态分布假设。接下来利用国际上考察股票收益分布所使用的几 个分布函数——逻辑斯谛分布、Scaled-t1分布、指数幂分布、混合正态分布——对股指收益 本文重点考察的 Scaled-t 分布有别于我们通常所说的 t 分布(student's t distribution , 又作学生 t 分布) 和非中心 t 分布(noncentral t distribution)。Scaled-t 分布的密度函 数(见本文第三部分)与具有相同自由度 v 的非中心 t 分布的密度函数相差一个系数
二
数据简介和正态性检验
本文中采用的原始数据为上证综指(999999)和深证综指(399106)每日收盘指数,时
间区间为 1997 年 1 月 2 日到 2002 年 10 月 31 日。 股指收益定义为 R t = 100*log( I t / I t −1 ) , 其中 I t 为 t 时刻股票指数。本文中不考虑周一效应(Monday effects)等问题,因此可以将 数据直接排成时间序列,不用考虑周末和假期休市。 表 1:股指收益的基本统计结果 股指 上证综指 深证综指 最小值 -9.3353 -10.2657 最大值 9.4015 9.2438 均值 0.0353 0.0196 标准差 1.6419 1.7808 偏度 -0.1506 -0.4116 峰度 9.1062 8.7582