中国证券市场股票价格预测模型综述王 浩(洛阳理工学院工程管理系,洛阳 471023)*摘 要:中国金融市场的证券价格存在着可预测成分。
现有的各种统计预测方法基本都可以归纳为时间关系模型和因果关系模型两大类,详细分析了各种模型的实现方法并总结了其特点。
关键词:预测;股票价格;统计模型;综述do:i 10.3969/j .issn .1000-5757.2009.07.058中图分类号:F830191 文献标志码:A 文章编号:1000-5757(2009)07-0058-03一、证券市场可预测性有效市场理论指出,证券价格呈现随机游走特征,因此技术分析和掷骰子选出的股票,最终表现相差无几。
大量分析却发现中国股票价格波动具有长期记忆性,拒绝了随机游走假设,即股市涨跌存在自身的规律,无论长期和短期都存在着可预测的成分,因而技术分析是有用的,通过采用相应策略,投资者可以获得超常利润。
[1]中国证券市场呈现弱有效性的原因可能在于,作为一个新兴市场,法制、监管等因素造成市场信息传递效率低下,投资者在博弈中存在严重的信息和资金实力不对称,而且这种不对称状态并不能在市场中迅速消除,因此F a m a 所描述的概率上的/瞬时性0还无法达到,而这种市场结构的特点,使得某些/技术分析0成为信息挖掘的成本。
由于股票指数序列呈现高度的非线性,经典计量经济模型和时间序列模型的有效性受到了挑战。
现代预测理论和统计学、信息技术、优化算法紧密结合,向复杂化和智能化方向发展。
至少目前在我国,各种预测技术方兴未艾,投资者按照自己的经验采用各不相同的指标作为决策依据,在市场上低买高卖,获得了成功,也经历过失败。
二、主要预测模型1.神经网络模型神经网络是一种大规模并行处理系统,具有良好的自学习能力、抗干扰能力和强大的非线性映射能力,能够从大量历史数据中进行聚类和学习,自动提取样本隐含的特征和规则,进而找到某些行为变化规律,可以实现任何复杂的因果关系。
BP (反向传播)和RBF (径向基函数)神经网络是最常见的股市预测模型。
崔建福等发现BP 模型普遍显著优于GARCH (广义自回归条件异方差)模型,从而认为对股票价格这样波动频繁的时间序列,从非线性系统角度建模略胜于从非平稳时间序列角度建模。
[2]由于传统算法收敛速度慢且全局寻优能力差,更多研究将精力放在对神经网络结构和参数的改进上。
丁雪梅等发现改进后BP 算法的预测结果比回归预测、指数平滑预测和灰色预测都要好。
[3]神经网络预测方法的应用有两个明显特点。
一方面,统计模式识别和数字信号处理等领域的特征选择和提取方法,如小波包最优分解方法、混沌吸引子理论、K a l m an 滤波算法、主成分分析、灰色系统理论,广泛用于神经网络输入参数的甄别。
另一方面,新的网络模型不断被应用于证券预测实践以提高映射效率,如模糊神经网络和小波神经网络。
预测结果明显优于普通神经网络模型。
神经网络的缺陷在于,网络结构只能事先指定或应用启发式算法在训练过程中寻找,需要在充分了解待解决问题的基础上,主要依靠个人经验来确定,没有统一的规范,往往需要通过反复改进和试验,最终才能选出一个相对较好的设计方案,并且网络训练过程易陷入局部极小点。
不过,神经网络最致命缺点在于,无法表达和分析预测系统的输入输出之间的关系,难以解释系统输出结果。
2.灰色系统和随机过程模型灰色预测普遍采用灰色系统模型,经由累加过程削弱原始数据的随机干扰,突出系统所蕴涵的内在规律,然后建立动态预测模型。
马尔可夫过程是无后效性的随机过程,是一种应用极为广泛的传统方法。
灰色系统GM (1,1)模型的解为指数型曲线,几何图形较为平滑,比较适用于具有增长趋势的问题,而对随机性波动较大的数据进行预测,会58第25卷 第7期V o.l 25四川教育学院学报J OURNAL OF S I CHUAN C O LLEG E OF EDU CAT I ON2009年7月Ju.l 2009*收稿日期:2009-02-23作者简介:王浩(1973)),男,河南西峡人,副教授,硕士,研究方向:区域经济发展理论与数量分析。
影响预测精度。
马尔可夫模型通常只能用于对数据波动区间的估计,不能进行具体数值的精细预测。
因此,实际应用中两种方法常常结合在一起。
王露璐等证实灰色马尔可夫模型可以显著改善预测效果。
[4]3.分形和混沌模型金融市场公认具有典型的分形和混沌特性。
分形方法使我们能分层次地了解复杂体系的内部精细结构和所富含的信息,有望找到多重分形参数和金融数据中大幅涨落间的关联性,从而以一定的概率反映和预测金融市场的剧烈动荡。
周孝华等对金融资产价格持续大幅波动的开始及结束做出预测。
[5]彭继兵等提出一种实时跟踪预测算法。
[6]混沌指由非线性系统所产生的复杂不规则行为。
到目前为止,对于混沌尚未有统一明确的定义,通常由系统的初值敏感性、非周期性、存在奇怪吸引子、确定性的随机现象、长期行为的不可预测性等特征来加以确定。
分形和混沌方法运用于金融时间序列的研究具有巨大的优势和潜力。
不仅如此,分形和混沌作为一种极其有效的非线性分析工具,广泛用于时序特征的提取,为神经网络输入变量选择提供依据。
龙建成等对行情的高低点进行了较准确的预测。
[7]人们常称中国股市是/政策市0和/消息市0,这的确反映了国内市场的某些特征。
宏观上看,进出资金流量确实对整个市场的运动起到决定性作用,政策变化势必会改变资金流向,从而形成某一阶段的/趋势0,影响人们对价格的未来预期,进而改变投资者的投资选择,这种能量在价格系统里的释放往往服从一定的规律,这就是非线性预测模型兴起的原因。
对非线性动力系统进行背景分析和研究,将神经网络、混沌理论、遗传算法、系统理论等最新理论与方法应用于金融领域,已成为一大热点。
4.统计模式识别模型证券市场是一个呈现高度复杂性的非线性系统,直接预测价格波动的具体数值难度很大。
如果将价格波动的方向按照一定的标准划分为不同的类别,如大幅上涨类、轻微下跌类等,这样就将价格预测问题转化为类别判断问题,就可以运用统计模式识别方法。
首先分析影响证券价格波动的因素,根据识别对象的特征运用聚类或分类算法将其划分为不同类别,然后对于需要预测的未知样本,利用某种判别规则将其归入已知的类别中去,从而实现预测。
王浩等应用改进的近邻算法进行了中长期预测。
[8]聚类方法的优越性体现在模型输入变量的选择极为自由,既可以从价格时序中提取特征,又可以选择影响价格变动的原因变量。
金融市场特有的高度复杂性,使得传统聚类分析方法遇到强有力的挑战,如对高维空间稀疏数据以及不规则分布数据的分析。
新兴的SVM(支持向量机)理论,能将很多现有方法纳入其中,为解决有限样本学习问题提供了一个统一的框架,具有比神经网络更好的拟合精度和泛化能力。
[9]三、预测模型简要评价各种预测方法虽然手段各异,但基本都可以归纳为时间关系模型和因果关系模型两大类。
时间关系模型中,预测对象的演变过程与时间相联系,如混沌时序模型、灰色模型、随机过程模型等。
因果关系模型认为被预测事物与其影响因素之间,在一定时间内保持着某种固定关系,如神经网络模型以及聚类模型等。
时间模型直接从价格自身历史运动轨迹中寻找规律;因果模型则寻找影响价格变动的可能原因,试图在原因和结果之间建立某种有效和稳定的联系。
不难发现,本文提及的众多模型具有许多共同的特点。
1.重大盘综合指数预测轻个股预测大部分预测方法都是以上证或深证综合指数作为预测对象,而不是选择个股。
大盘指数综合反映股市整体的涨跌变化情况,和个股相比,因不易受人为因素控制而更加稳定,波动幅度明显要小得多。
夏景明等认为大盘指数的预测相对容易,方法如果在个股中推广中则有一定的难度。
[10]个股中大量存在假突破、振荡洗盘、短期飙升和暴跌等现象,导致预测的正确率较低。
[11]个股预测困难的实质在于,由于价格波动剧烈,可能导致不同时间段各自包含不同的数据结构,从而割裂历史和未来之间的联系。
2.重历史数据拟合轻未知数据预测通常对模型性能的检验包括历史数据拟合能力和未知数据预测能力两方面。
只要网络节点和隐层足够多,神经网络能以任意小的误差逼近任何函数。
遗传程序设计方法同样能以极小的误差逼近任何非线性函数。
其实,即便是最简单的高阶多项式也能够以零误差拟合任何离散数据。
不过,模型的预测能力往往和拟合能力背道而驰,如神经网络。
个股交易数据如果波动剧烈或包含太多的噪声,直接作为神经网络输入,一些特异样本会对网络参数产生显著影响,从而降低其预测性能。
于是,时序分析中常常不得不采用变换和滤波方法。
3.变量选择对模型成败具有至关重要的影响股价波动是诸多因素的综合反映,由于人们对非线性系统的内部运行机制缺乏深刻认识,很难判断哪些变量对预测目标有较大的影响。
因此,有效地选取输入变量成为决定模型预测准确性的关键因素。
常用的变量选择方法可划分为技术分析和基本分析两大类。
小波分析、K-L变换、分支定界算法、粗集约简理论、因子分析等方法,广泛用于特征的选择和提取。
4.没有提供关于预测结果的风险估计所有模型都没有区分不同预测结果的风险。
看涨和看跌预测对投资者的现实影响是不相同的,其根本原因在于中国股市的现有交易制度,只有做多机制而没有做空机制,从而限制了可能的获利空间。
并且,仅仅预测一个价格数59第25卷(总第196期)王浩:中国证券市场股票价格预测模型综述值是远远不够的,还必须同时提供该预测结果的可信度指标,也即该预测准确的概率。
5.预测方法的长期有效性没有得到完全检验大部分预测方法都是对10个交易日以内的价格进行预测,这本无可厚非。
随着预测时间的延长,误差从总体上是上升的。
其不妥之处在于,仅给出了对于极少数预测结果的验证,而没有在更大的范围或更长的时间段内进一步实证。
通常认为,既然模型已经对历史数据进行了准确的拟合,并且短期预测成功的可能性很大,似乎随着时间的推移,不断将新数据纳入模型中,不就可以实现滚动预测了吗?其实只要看一下证券的历史走势就能发现,不同时期的波动特点差异甚大,此时需要改变的就不仅仅是模型参数,甚至还有模型结构本身。
短期预测的成功往往包含太多的偶然因素,只有滚动预测结果才能够对模型的普适性提供更严格的检验。
6.重常规模式预测轻异动模式捕捉证券预测的目的显然不是为了求得误差率的降低,而是据以发现能够以很大概率成功的获利模式,这意味着真正有意义的预测应该是异动点捕捉,也就是说发现股票价格出现异动(如大幅飙升)时的数量特征。
熟悉中国股市的人都知道,的确有为数不多的情况出现了买入和卖出信号,相应地,这些信号可以带来极高的收益。
真正的获利机会恰恰隐藏在波动剧烈的非平稳个股中间,而这却正是大多数预测方法无能为力的情况。
对此,模式识别和智能化方法可能具有良好的效果。