股票市场分形特征实例分析
分形理论的创始人美籍法国数学家Mandelbrot1967年在美国《科学》杂志
上发表了“英国的海岸线有多长”的划时代的论文。1975年他出版了分形几何的
第一部著作《分形:形状、机遇和维数》,标志着分形理论的诞生。分形是用以
描述那种不规则的、破碎的、琐屑的几何特征。分形是相对于整形而言的,它的
基本特征是不可微性、不可切性、不光滑性,甚至是不连续性。
很多学者研究了我国股票市场的混沌特征,不仅说明了股市运行过程中的混
沌特征,而且还给出了混沌特征的数量指标。但他们并没有给出混沌吸引子的结
构,而它却是混沌状态的基本特征,是描述混沌的基本工具。混沌吸引子具有分
形结构,混沌与分形是密切相关的。本论文以上海股市为例,来分析我国股票市
场的分形特征。
股市混沌吸引子的分形维
我国股市具有复杂的混沌结构,而且我们还给出了股票指数收益率序列的混
沌结构的数量指标。“这些数量指标都是混沌度的特征指标”。混沌的另一个特征
是具有混沌吸引子,吸引子是一个分形,而分形维是刻划分形最重要的指标。
分形维数有多种定义,两种最常用的分形维数是豪斯道夫(Hausdorff)维数和
盒维数。1983年,Grassberger和Procaccia利用了嵌入理论和相空间重构技术,
提出了从时间序列直接计算关联维数的算法。本文也是用此法来计算我国股市混
沌吸引子的分形维。
设{xk:k=1,…N}是观测某一系统得到的时间序列,将其嵌入到m维欧氏空间
中,得该空间中的点集,其元素为:xn(m,τ)=(xn+τ,xn,…,xn+(m-1)τ),n=1,…Nm,
其中:Nm=N-(m-1)τ.
从Nm个点中任选一个点xi计算其余每个点到该点的距离rij,对所有
xi(i=1,…,Nm)重复这一过程,可得到关联积分函数
其中的H(x)当x>0时取1,当x≤0时取0,关联维数D为当r→0时函数
logCm(r)/logr的极限。
Grassberger和Procaccia证明了当嵌入维数大于分形维时,所求的分形维不
因嵌入维数的增加而增加。
股市波动的Hurst指数
Hurst指数可衡量一个时间序列的统计相关性。当H=0.5时,时间序列就是
标准的随机游走,即在EMH下出现的状态。当0.5在分形理论中,R/S分析法
是研究分形时间序列的一种常用方法,它是Hurst在大量实证研究的基础上提出
的一种分析方法,其基本思路如下:
对股票价格形成的时间序列xt,分为A个长度为N的等长区间,对于每一
个子区间,令 X(a,t)=∑(xN(a-1)+i-Ma),i=1,…t。其中,X(a,t)为第a个区间的累
积离差,xN(a-1)+i为区间a的第i个观测值,Ma为区间a的平均值,t=1,2,…N。
对于每一个子区间,可得到N个累积离差,N个离差中的最大值和最小值之差
即极差R=Max(X(a,t))-Min(X(a,t))。为了比较不同类型的时间序列,赫斯特用每
个区间所测得的标准差去除极差,得到“重标极差”,并且有R/S=(bN)H ………1)
其中,R/S表示重标极差,N为区间长度,b为某一常数,H为赫斯特指数,
且0≤H≤1。
对每个子区间计算R/S,可得A个R/S,求出这A个R/S的平均值,可得出
用N来等分时间序列下的R/S估计值。用不同常数N来等分,便可得到不同的
R/S。根据R/S随N的变化关系,可研究时间序列不同时段的统计特性,由ln(R/S)
相对于lnN的函数变化斜率得出赫斯特指数H。
对1)式两边取对数,得ln(R/S)=Hln(N)+ln(a)。
由ln(R/S)相对于ln(N)的斜率便可估计出H。通过ln(R/S)-ln(N)图,很容易
观察出赫斯特指数在何处发生突变,并进一步估计出周期长度,一般用统计量
V(N)=(R/S)/来估计周期长度。对于独立随机过程的时间序列,统计量V-ln(N)图
是平坦的;对于具有状态持续性的过程,该图向上倾斜;对于逆状态持续性
(H<0.5)的过程,该图向下倾斜。故根据V-ln(N)图可判断时间序列某一时刻的
值对后面观测值的影响时间长度界限。
实证分析
上海股市混沌吸引子的分形维
本文运用分形理论,选取上证综合指数日收盘值的对数收益率序列,对上证
股票市场结构进行实证分析。选取从1990年12月19日至2003年10月19日的
数据作为分析的基础,然后计算对数收益率样本时间序列X(n),n=1,2,……3234。
为了计算关联积分和关联维数,我们先针对时间延迟重构m维相空间。这里我
们选取=5,而嵌入维数m分别取2,3,4,5,……等正整数。按照G-P算法计
算关联积分C。我们将关联积分和距离r分别取自然对数,然后以lnr为横轴,
以lnC为纵轴将其绘成图1。
由图1可知,存在一个关联积分lnC(r)对度量尺度ln(r)的线性依赖区域,表
明在该区域中维数的定义被很好地满足了,而这些直线段的斜率就是关联维数的
估计值。在实际操作中,我们调整嵌入维数m,随着m的增大,关联维数趋于
饱和,即直线趋于平行,斜率趋于相等。我们利用最小二乘法去估计这些直线的
斜率,得到关联维数的结果见表1。
上述结果表明,上证指数收益率序列的关联维数为3.06,其饱和嵌入维数为
10。这些结果还表明我国的股票市场是一个具有分数维结构的低自由度混沌系
统,股票收益率的变化遵循着某种确定性的规律。上证市场日收益率序列的分形
维数在3到4之间,虽然我国证券市场的运行系统很复杂,决定我国证券市场的
运行的因素非常多。但由于分形维代表了决定系统的混沌吸引子的自由度,说明
该系统最终将收缩到维数为3至4之间的吸引子上,即决定这一复杂系统的本质
因素只有4个,需要的基本变量数目在4个到10个之间,且主要变量有4个。
上海股市收益率序列的R/S分析及Hurst指数
下面仍以上证综指日收盘值的对数收益率序列为例,对上证股票市场结构进
行分析。按照前述方法进行计算,将序列进行分组,每组有5个元素。图2给出
了日收益率序列的ln(R/S)-ln(N)双对数图。
在横坐标取5.01之前,数据几乎在一条直线上,对ln(R/S)-ln(N)进行回归计
算,得出 H的值为0.683,大于0.5,说明上证综指的波动不是随机游走的,而
是有偏随机游走,即具有持久性。当指数上一个时刻是上升(下降)的,则下一
个时刻上升(下降)的可能性比较大。而从相对长的时间跨度来看,日收益率序
列H指数明显下降,接近0.5,即基本遵循随机游走。
再考察V-统计量,它的定义为V(N)=(R/S)/。如图3, 在横坐标为5.01附近
明显出现转折,而此数值是取对数得到的。转换成天数为exp(5.01),即大约150
天。对照上图,在150天循环中,上证综指的波动具有明显的持久性。超过150
天,持久性减弱,系统的特征明显改变。
结论
本文利用G-P算法估计了证券指数收益率序列的混沌吸引子的分形维是介
于3到4之间,表明市场在局部的随机性的背后具有全局决定性,即证券市场的
运行系统最终会收敛于四个变量决定的混沌吸引子。Hurst指数可衡量一个时间
序列的统计相关性。通过实证分析得到上证综指的H指数为0.683,大于0.5,
说明上证综指收益率序列具有明显的持久性。