当前位置:文档之家› 社会媒体环境下基于EMD-DSVR的股票市场预测方法研究

社会媒体环境下基于EMD-DSVR的股票市场预测方法研究

第24卷第5期 2016年10月安徽建筑大学学报Journal ofAnhui Jianzhu UniversityVol .24 No .5 Oct .2016DOI :10.11921/j .issn.2095-8382.20160519社会媒体环境下基于EMD -D S V R 的股票市场预测方法研究梁坤\张理政2(1.合肥工业大学管理学院,合肥230009,2.安徽建筑大学管理学院,合肥230022)摘要:现有的利用社会媒体预测股票市场的研究未能考虑股指时间序列所具有的多尺度特征。

为了解决 这一问题,运用e m d 分解法、混沌分析理论和支持向量回归机,提出一种e m d -d s v r 股票市场预测方法。

首先分析股指时间序列多尺度与社会媒体变量序列多尺度间的内在联系,运用E M D 分解法将社会媒体变量 序列分解成不同尺度的基本模态分量;然后运用混沌分析理论和支持向量回归机对各模态分量进行建模和 预测;最后利用社会媒体变量序列的各模态分量对股票市场进行预测。

运用所提出的e m d -d s v r 模型,对 上证指数和深成指数的日收盘值进行预测,实验结果表明,所提出的方法能有效提高对股指时间序列的预 测精度。

关键词:经验模态分解;股票收益;混沌理论;支持向量回归中图分类号:TP 391 文献标识码:A 文章编号:2095-8382(2016)05-106-05Prediction Method of S tock Market Based on EMD-DSVR under Social Media EnvironmentLIANGKun 1,ZHANGLizheng2(l.SchoolofM anagem ent ,H efeiU niversityofTechnology ,H efei ,230009,China,2.SchoolofM anagem ent,A nH uiJianzhuU niversity ,HeFei,230022,C hina)Abstract : The existing relevant research of social media-based market performance analysis fails to consider themulti-scale of stock time series. To solve this problem, by employing the empirical mode decomposition (EMD), chaos theory and support vector regression, this paper presents an EMD-DSVR method to predict stock market. First, the intrinsic link between stock time series multi-scale and social media time series multi-scale has been analyzed; and by using EMD method, this paper decomposes the social media time series into many intrinsic modal function (IMF) which can significantly represent potential information of original time serial. Then, by using chaos theory and support vector regression, this paper predicts and sets models for each IMF. Finally, market performance is predicted by using the IMF of social media time series. In order to verify the effectiveness of EMD- DSVR model, the close value of Shanghai Composite Index and Shenzhen component index are predicted by using this model. The results show that our approach can effectively improve the prediction accuracy of stock time series. Keywords : empirical mode decomposition; stock time series; chaos theory; support vector regression引言股票市场是金融市场的重要组成部分,也是 国家经济运行状况的晴雨表。

合理分析并预测股 票市场不仅能够引导股民进行正确投资,还可以为政府提供股票市场宏观调控的理论依据,进而 保障经济平稳健康发展。

传统的股票市场分析与预测主要有基本面 法和技术分析法[1]。

随着论坛、博客和内容社区 等社会媒体的快速发展与广泛应用,基于社会媒收稿日期:2015-10-12基金项目:国家自然科学基金重点项目(71331002),教育部博士学科点专项科研基金(20120111110027),安徽省软科学重大项目(1302053009)作者简介:梁坤(1985-),男,博士生,主要研究方向为社会媒体分析与预测.第5期梁坤,等:社会媒体环境下基于E M D-D S V R的股票市场预测方法研究107体的股票市场预测逐渐成为新的研究热点[2]。

已有研究表明,社会媒体中的用户生成内容能够显 著影响投资者的投资决策行为,进而造成股票价 格、交易量和收益率等的变化[3-6\Frank的研究 指出,社会媒体的信息数量与股票价格波动成正 比,与股票收益率成反比[\Bollen利用文本处理技术分析Twitter上的公众情绪,并指出公众 情绪的变化能显著影响道琼斯工业平均指数[4]。

Hsinchun Chen的研究表明,通过分析投资者论坛 上的讨论话题和干系人组成,能够更加细粒度的 反映股票的市场行为[5]。

Jiang研究了突发事件 不同阶段雅虎金融论坛上的发帖数量和情感倾向 与股票收益率间的关系,研究结论表明,社会媒 体变量与股票收益率间的关系在突发事件不同阶 段是不同的[6]。

上述研究主要从社会媒体内容方 面对股票市场预测展开研究,也有学者从社会网 络分析视角研究社会媒体对股票市场的影响。

例 如,Zhang指出,Twitter上有关股票主题的被转发 次数与标准普尔500指数呈显著的正相关关系[7]。

然而,现有的关于利用社会媒体预测股票市 场的研究很少考虑股指时间序列所具有的多尺度 特征[8]。

不同时间尺度的交易者对股票市场和社 会媒体关注的时间尺度是不同的:短期投资者一 般关注短时间内的社会媒体股票信息;而长期投 资者一般综合分析较长时间内的社会媒体股票信 息,更关注股票收益的长期走势[9]。

为了综合考 虑不同类型交易者对股票市场产生的整体影响,并提高社会媒体对股票市场的预测性能,需要相 应的对社会媒体变量序列进行多尺度分析。

小波分析在时域和频域均具有良好的分析能 力,因此,基于小波分析的股指时间序列预测逐 渐受到学者们的青睐[10-15]。

然而,小波分析具有 以下两点不足[16]:第一,小波分解不能根据信 号本身特性进行自适应分析,通常会产生很多虚 假的谐波;第二,小波分解需预先人为设定时间 尺度,导致小波分解不能客观反映信号中所包含 的各尺度上的信息。

经验模态分解(Empirical mode decomposition,E M D)能够基于信号局部特 征,将原始序列中不同尺度的波动或趋势逐级分 解开来,产生一系列模态函数(Intrinsic mode function,IM F),其中每个模态函数均可以反映 原始序列在不同尺度上的波动特征。

由于emd方法可以更准确的反映原始序列的物理特性,因此 在处理非线性、非平稳时间序列时,EM D较之小波分解更加有效[17]。

本文将EM D方法与支持向量回归(Support vector regression,SVR)相结合,对中国股票市场进行预测。

首先利用emd方法将社会媒体变 量序列分解成若干个imf;然后针对每个MF进行 混沌序列的支持向量回归建模;最后,利用社会 媒体变量序列的各imf和股指时间序列的前期值 对股票市场进行预测。

由于emd方法能将复杂的 社会媒体变量序列分解成若干个彼此间影响甚微 的基本模态分量,从而使得支持向量回归机能更 加准确的把握社会媒体变量序列的多尺度特征,而且还能综合考虑不同类型交易者对股票市场产 生的整体影响,从而最终提高模型的预测精度。

1基于emd的双重支持向量回归预 测模型为了提高社会媒体对股票市场的预测性能,考察社会媒体变量序列的各尺度模态分量对 交易者产生的综合影响,提出一个基于emd的双重支持向量回归预测模型(Empirical mode decomposition and double support vector regression,E M D-DSVR),该模型的预测流程分 为三个阶段,如图1所示。

首先利用emd分解法 将社会媒体变量序列SM(t)分解成不同时间尺度 的模态分量和长期趋势项;然后通过计算各模态 分量的嵌入维数和延迟时间,建立各模态分量的 混沌模型CM i,并利用前层支持向量回归机对各模 态分量进行预测,对于长期趋势项的预测则采用 拟合函数法;最后将股指时间序列的前期值和上 一阶段中各序列的预测值Pi —同输入后层支持向 量回归机中,预测股指时间序列的下一个数据点。

I M F i I M F21 ’C M i C M2,S(t)~I~s v r1/s(t+1)/图1E M D-SVR预测模型整体框架e m d分解g第一阶段第二阶段第三阶段设sm⑴和S(t)分别为t时刻的社会媒体变量序列和股指时间序列,sm(t)和s(t)分别为108安徽建筑大学学才艮第24卷S M(t)和S(t)在t时刻的取值,则E M D-D S V R预测方法的数学模型和具体实现步骤如下:{t+1)=F{s{t),s{t-1),L,s{t- {m -1));P(sm imf(i) (t+1)),P(sm r(t +1)))'P(S m lm/(i)(t+ !))=f(i)(t),Smimf(i)(t-T),L,Smimf(i)(t-(M -1)T))^P{s m r{t+1)) =g{sm r{t+1))步骤1:利用e m d方法将社会媒体变量序列S M(t)分解为有限个基本模态分量S M i m f(i)(t) (i=1,…,n)和长期趋势项S M r(t)。

相关主题