2013年第6期 (总第377期) 吉林金融研究 No.6,2013 General No.377 基于上证指数的标准差系数时问序列 预测模型分析 刘希原 (北方工业大学,北京 1 001 44) 摘 要:证券市场的风险可以通过很多种方式测度出来,其中,稳定性是衡量股票市场风险程度的 一个重要的指标,而对于稳定性的度量主要是通过方差的计算来实现的。所以通过预测方差就可以 提供另一种描述股票市场未来风险的方式。本文通过对上证指数2009年3月 ̄2012年1月每月的全部 交易日收盘价的标准差系数进行研究,运用ARIMA时间序列技术,得出预测模型,对未来的标准 差系数进行了预测。 关键词:上证指数;ARIMA时间序列技术;标准差系数 中图分类号:F832 文献标识码:A 文章编号:1009—3109(2013)06-0006-07 金融市场周期性的危机引起全世界的关注。 无论是经济学家,统计学家,还是金融数学家, 都在尽最大努力开发各种金融风险预警指标和方 法,以求规避风险。以往人们研究金融市场时总 是倾向于把股票价格的概率分布描述成正态分 布,可是本文在分析数据时发现,股票价格的 标准差系数是上下随机波动。基于这一点,通过 对历史数据的分析,完全有可能通过时间序列的 预测功能得到未来某时点上的标准差系数值,从 而对未来短期内股票市场总体风险有可量化的估 计。这就为金融监管者提供了一种对金融市场风 险的直观认识,以期在危机到来之前做好准备。 一、数据介绍 本文所用数据来自于上证指数2008年l 2月到 2012年1月每月的全部交易日收盘价,由于股票价 格指数的时间序列的每月均值和方差都在变化, 本文将不直接使用每月的全部交易日收盘价的方 差来进行分析,而是先对原始收盘价数据求完方 差后,再计算出每月全部交易日的均值,通过这 两个数据得出标准差系数,数据来自新浪网的上 证指数历史数据,它们的标准差系数数据如下: 表1 上证指数收盘价标准差系数统计数据 收稿日期:2013—05—15 作者简介:刘希原,男,汉族,本科,北方工业大学理学院。
6 基于上证指数的标准差系数时间序列预测模型分析 (续表) 上证收盘价标准差系数
数据来源:http://vip.stock.finance.sina. corn.cn/COrp/go.php/vMS——MarketHistory/ stockid/000001/type/S.phtml 二、时间序列中ARIMA模型的建立 (一)序列图描述 由于本文所采用的数据是根据时间顺序排列 的,所以处理数据的方法可采用时间序列分析技 术。因为时间序列数据是随机过程的一个特殊样 本,所以在时间序列分析中,常用时间序列数据 样本对其背后总体的随机过程进行推断。其中 我们最感兴趣的就是对时间序列的数字特征的推 断。在ARIMA分析中,我们常用到的数字特征 有:均值函数,自协方差函数,自相关函数和偏 自相关函数。下面就要使用以上数字特征对数据 进行平稳性检验,白噪声检验,最终得出模型方 程。 平稳时间序列是指时间序列的统计特征不会 随时间的推移而发生改变,即:生成时间序列数 据的随机过程的统计特征不随时间变化而变化。 平稳时间序列分为严平稳和弱平稳,严平稳的条 件在现实生活中很难实现,而弱平稳却是较为 普遍。弱平稳的条件是(1)E(Yt)=lJ,即期望 为常数(2)Var(Yt)=cr ,即方差也为常数(3) Cov( ,,,/I,*)=E(( 一 )(/1,。一 ))=y(t,t-k),耳口随 机过程两个间隔为k的随机变量间的协方差只与 间隔k有关,与两变量所处的时点t无关。这些是 从数学角度的验证标准,我们在进行严格验证 之前往往可以通过序列图的形状初步判断,一般 地,平稳时间序列的序列图如果为一条围绕其均 值上下波动的曲线,则可以认为它是平稳时间 序列。由本文中的数据得到的时间序列图如下图 l: 2008年l2月2012年1月上证指数收盘价标准差系数时间序列图 6 5 垛 3 蜷 2 l 、 图1 上证指数收盘价标准差系数时间序列图 可以看出,标准差系数是从2008年12月以前 的高位骤然下跌的,这直观的表明金融危机后期 上证指数标准差系数的波动逐渐回稳,总体序列 图成尖状脉冲图形,具有一定的上下波动性,但 不是非常明显,需要做进一步的样本自相关函数 检验。标准差系数作为衡量金融市场波动性的手 7 4 0 0 3 7 1 8 4 8 6 6 82 24 3 8 l 29 9 9 91 3 B 53 7 4 哪 揪 蛳眈 咖 耋萋 ㈣ ㈣ 姗嬲 伽 伽 姗 堇耋 _二 一8 9 ¨ 。2 3 4 5 6 7 8 9 m¨ 2 3 4 5 6 7 8 9 ¨ 分一 0 0 O 0 0 O O 0 0 0 O 1 1 l 1 1 1 l 1 1 l l 1 2 1一(((C C}}{}}}}}【 铜一掀 掀 Ⅻ埘 埘 拟埘 ⅫⅫ捌埘 Ⅻ 吉林金融研究 段之一,本文认为反映了外界信息对金融市场的 冲击,无论是利好还是利空消息,都可能导致股 票价格的突发性猛烈波动,由于整个金融市场中 的不良贷款的积累可能每20年出现一个整个金融 市场难以容忍的峰值,这时候如果恰好遭遇标准 差系数的波动峰值,若是利好消息引起的猛烈波 动,则将加大不良贷款的违约风险,使系统崩溃 提前发生;若是利空消息引起的,则可能导致极 短时间内股价不可逆转的暴跌,在不良贷款和系 统内波动的共同影响下,触发股市崩盘,引发金 融危机。这种标准差系数的波动还反映了投资者 的非理性投机行为。中国的金融市场刚刚兴起不 久,政府干预力量巨大,相关法律不够健全,交 易规则不够合理,对于风险管理的意识淡薄,尤 其是股票市场,以小股民为多数,他们往往缺乏 投资的专业知识,盲目凭感觉炒股,对消息的敏 感度大得超乎我们想象,当随机发生的信息进入 股票市场时,就可能会引起投资者的强烈反应, 所以序列图呈现尖状脉冲。 (_-)ARIMA模型介绍 A R I M A模型是自回归单整移 动平均时间序列的英文缩写,记为 ARIMA(p,d,q),其中P是指组成ARIMA模型 的自回归模型部分(AR(P))的阶数,记作 y (pl y (p 2 y … (p y f,(p o、(p 2、 引入滞后算子 ,定义: 同理: 】, =Y ,…’, y Y, ,对M A模型也是一 样:Z .u, .“ ,……, , , 于是,ARIMA 模型可化作: Z一 …一 Z ) “一 一9。 ……一0 Z ,。 定义差分算子 V yl:y .Y ,d阶差分与滞后算子L之间有如下 关系:Vd=(1一L 。所以对于非平稳时间序列 ARIMA(p,d,q),ARIMA模型可化简为: (L)(1也 y|=o(£)uf (三)平稳性严格检验的数学原理及检验效果 上文提到,对于时间序列平稳性严格检验, 我们采取样本自相关函数(AFC)来进行判 断,自相关函数写作: ∑[(yf一 一 )l Y 旦————-(k=0,1,2n ,……) h ∑(y 一 )f 、 ~’ 通过自相关函数可以看出,当K增大时,1, 的分子将急剧减小,导致自相关函数减小,很快 趋近于零,这种现象叫做截尾或拖尾。当出现截 尾或拖尾现象时,可以认为时间序列是平稳的。 用这种方法检验的ACF结果如图2: 称为自回归系数,.“,为随机干扰项,是 誊 一个白噪声过程;q是指A R I M A模型的 移动平均模型部分(MA(q))的阶数,记作 Iu,一9 Iu 一9:.u …… 9 Iu, , ,、Iu 、 、Iu, 为滑动平均系数,是一组白噪声过程;d是指对 原始数据差分的次数,在这里, “d阶单整”是 指非平稳过程的时间序列数据d阶差分后是平稳 的。所以ARIMA模型可写作AR模型与MA模 型的合成,即: . 。 一。一…+ 1I, + ,一 “~0 ……0 , 为了简化模型。 2 3 4 5 6 7 8 9 10”12 13 14 15 t6 LagNumber 图2标准差系数自相关函数图(ACF) 可见,图2并不是拖尾或截尾的,说明原始 数据并不是平稳的,所以需要通过差分技术来对
非平稳数据平稳化。经过尝试后认为三阶差分后 吉林金融研究 正数,所以取0.415014。从上证指数2012年1月 的数据算出的实际标准差系数为0.304233,结果 差距不大,从拟合图中可以看出,拟合值比观测 值略向前平移了一个月的时间间隔,所以在实际 应用中本文认为应将预测值对应的时间倒退1个 月才是实际值对应的月份,在预测时应注意这一 点。预测图较好表现出尖状脉冲现象,对于短期 的股票价格标准差系数预测具有较好的应用价 值。 本文认为,标准差系数的波动主要反映的是 股票市场外的信息对于股票价格的冲击程度,更 深层次的,反映的是信息对于投资者心理的影 响。如果可以测量各大股票指数如道琼斯工业平 均指数、标准普尔500指数、纳斯达克指数、日 经指数、香港恒生指数及上证指数的标准差系数 的方差,或许可以比较各大股票市场投资者对于 信息的敏感程度、理性程度以及投机成分含量, 为未来中国金融改革提供数据支持。更深远的, 由于信息是随机进入股票市场的,如果有一种方 法能够测出信息发生的概率分布,将是对风险预 警领域的一种巨大贡献,而标准差系数能够间接 反映信息对投资者乃至整个股票市场的影响程度 大小,或许可以以此为一种测度方法,对影响市 场的信息进行更深层次的研究。 参考资料: 【11http://vip.stock.finance.sina.com.cn/corp/ go.php/vMS—MarketHistory/stockid/O0000 1/type/ S.phtml [2]张龙,王文博,曹培慎.计量经济学【M】.北京:清华大学 出版社,北京交通大学出版社,2010:323页. [3]宇传华.SPSS与统计分析[M】.北京:电子工业出版社, 2007:579-580页. The Analysis of the Time Sequence Prediction Model of Standard Deviation based on the Shanghai Composite Index Liu Xiyuan Abstract:the risk of the securities market can through a variety of ways to measure out,among them,the stability iS an impo ̄ant index to measure the degree of the risk of stock market.and for the stability of the measurement iS realized mainly through variance calculation.So the forecast variance can provide another Way to describe the stock market future risk.Based on the standard deviation coefficient of the Shanghai Composite Index in 2009 March to 20 1 2 January monthly full trading day closing price.by using the ARIMA time series technology,we figure out the forecast model and conduct the prediction of the future standard deviation coe伍cient. Key Words:Shanghai Stock Index Time Series;ARIMA Technology;Coe伍cient of Standard Deviation 1 2 (责任编辑:何昆烨)