时间序列模型在股票预测方面的应用摘要股票市场作为国民经济的重要组成部分,股票市场的发展对国民经济的发展起到重要的推动作用,同时股票市场的运行又受到整个国民经济发展形势的制约。
中国股票市场自建立起到现在取得了长足的进步,但市场表现出的波动幅度和风险性要大大高于国外成熟的资本市场。
因此,在我国股票市场即将取得重大发展的时期对其进行波动特征研究就显得尤为重要。
本文以上证综合指数月市盈率作为研究对象,采用ARMA模型并结合Eviews8.0统计软件对样本数据进行分析。
针对寻找影响市盈率多种因素的困难,提出从市盈率的的数据本身出发,利用B-J时间序列分析方法建立自回归滑动平均模型ARMA,对股票市盈率分析并预测。
对上证综合指数的市盈率的数据实证研究并短期预测,结果表明其预测效果良好。
关键词:股票时间序列分析市盈率 ARMA模型预测ABSTRACTThe stock market is an important part of the national economy, its development plays a critical role in national economy, at the same time, the operation of the stock market is restricted by the developing situation of the whole national economy. Chinese stock market grows fast and has made great progress since it was founded, and the market risk and volatility is much larger than that of foreign markets. So it is necessary to study the volatility character of stock market when it is on the developing way. In this text, we will regard Shanghai stock composite price-earning ratios as the main study object, and try to use the ARMA models to describe the volatility character with the statistic software EViews8.0. As for the difficulties of looking for a variety of factors influencing the price-earning ratios, the model built by the data itself with B- J’s method of time series is presented to analyze and to forecast. A stock’s price-earning ratios empirical research is carried out, which is included short-term forecast. The result shows that the method gives a good short-term predict.Key words: stock, analysis of the series, price-earning ratios, ARMA models, forecast0 引言市盈率是投资者分析股票价值的重要指标,其定义为每股股票价格与每股税后利润的比率,全称为“市价盈利比率”。
它可估计股票的投资报酬和风险,如果能对股票市盈率进预测有助于投资者做出合理的投资决策,使社会财富在不同投资者之间进行优化分配。
许多学者对市盈率已进行研究。
吴世农和吴育辉指出了企业及所在行业的发展前景、未来的收益和风险是影响市盈率的三大影响因素。
丁忠明指出了创业板股票月均发行市盈率与场指数正向相关,与上市溢价率负相关。
蔡玉兰在固定增长股利贴现模型的基础上,结合资本资产定价模型和改进的杜邦分析法,指出股利发放率、无风险报酬率、贝塔系数、市场组合的预期报酬率等九大因素影响市盈率。
王春丽通过建立面板模型探究在市净率( P/B) 、系数和流通股比例( CSP) 等因素共同影响下行业整体业绩增长对市盈率水平的影响。
吴树畅就股价与股价的驱动因素关系分析构建动态市盈率模型,来揭示不同类型市场不同类型公司市盈率大小的驱动因素。
以上学者大体上都是从影响市盈率的因素进行研究但是市盈率是企业在资本市场上一系列复杂活动共同作用所形成的结果,很难从某一个或几个因素对市盈率正确的分析。
经济运行过程从较长时间序列看,由于市场机制的作用,呈现一定的规律。
影响股价的政治、经济、企业状况、股民心理等多方面因素都会在股票价格反映出来,股票的市盈率是股价与税后利润的比率,因此在预测股票的市盈率可从其数据本身出发,而不必考虑各种因素的影响。
本文利用博克斯和詹金斯( Box and Jenkins) 创立著名的B-J 方法对股票市盈率已有的历史数据建立ARMA模型。
由于它考虑到市盈率在时间序列上的变化规律性,又考虑了随机波动的干扰性,故可较准确预测股票的市盈率短期变化。
1 模型的建立1.1 ARMA 模型简介如果时间序列{yt}满足:其中: 是独立同分布的随机变量序列,并且对任意的t,则称时间序列{yt}服从(p,q)阶自回归移动平均模型,记为ARMA(p,q)。
为自回归系数,为移动平均系数。
对于ARMA(p,q)模型,当q=0时,模型即为AR(q); 当p=0时,模型即为MA(p)模型。
B-J 方法的ARMA 建模步骤:第一步判断时间序列是否是平稳序列,如果不是平稳序列可以经过差分转化为平稳序列。
第二步利用样本数据自相关函数和偏自相关函数的工具进行时间序列模型阶数的识别。
第三步确定模型阶数后可对模型参数估计。
第四步对模型的适合性进行检验,即对模型的残差序列进行白噪声检验。
若残差序列不是白噪声序列,意味着残差序列还存在有用的信息没被提取,需要进一步改进模型。
第五步若模型经检验是合适的,同时也符合实际意义,可用于短期预测。
1.2 ARMA模型对单支股票市盈率实证分析和预测由于受众多因素的影响,股票的价格经常处于不断的变化之中,股票的每股收益受到公司的经营及一些国家法令政策的影响也在随机地变化,这样计算出来的每天的股票市盈率是随机的,故可以把它作为一个时间序列,通过研究它的统计特性,预测市盈率的发展情况,为投资决策者提供参考。
股票的价格及其每股净收益在股票的报刊杂志及其许多网站均可以查到,为本论文研究方便地提供了数据,本文选取上证综合指数股票月市盈率数据189个( 1999.01-2014.09,数据来源于大智慧) ,通过以下公式计算股票市盈率,即: 股票市盈率= 股票的收盘价/税后的每股收益,结果见图1。
图12 模型的计算2.1 模型平稳性检验为了对上证综合指数股票的市盈率建立适宜模型,首先对其序列的统计特性进行分析。
通过利用软件Eviews8.0做出股票的市盈率线图。
从图2可直观看出皖维高新股票的市盈率先开始迅速下滑然后再缓慢上升,其市盈率表现波动,初步说明此时间序列具有不平稳性。
1020304050607080图2再从图3样本的自相关和偏自相关图发现其样本的自相关函数 AC 是拖尾,并且衰减非常缓慢的,又进一步表明此股票的市盈率数据序列为非平稳序列。
行单位根检验。
从图4可看出,检验统计量 ADF 样本值分别大于 1%、5% 以及 10% 的显著性水平下的临界值,说明此序列是非平稳序列。
图3图4为了进一步从理论上证明其不平稳性,对其进行一阶差分。
从差分过后的序列的线图看出其波动较未差分之前的数据平缓许多图5,再对其进行单位根检验从发现一图6阶差分后单位根的样本统计量值分别小于 1%、5%、10% 各自水平的临界值,可拒绝原假设,即该序列是平稳序列。
-20-15-10-5051015SER02图5图62.2 模型的阶数的识别按照 B-J 理论对序列进行平稳处理后要对模型阶数识别。
本文选取上证综合指数股票的市盈率序列通过单位根检验发现是非平稳序列,然后对此序列进行一阶差分后转为平稳序列。
从一阶差分序列的自相关分析图(图7)中发现自相关与偏自相关图并不具备明显拖尾或截尾性质,很难辨别模型ARMA(p,q)的阶数,导致这样结果可能对原序列差分时丢失许多信息。
由于一般经济系统中在没有季节周期因素情况下,其自回归的阶数一般不超过 5,移动平均阶数不超过2。
在模型识别中,允许一定的灵活性是一个一般原则。
现实世界几乎不存在真实模型。
模型识别中只要所选模型既在统计上合理,又有实际意义就行。
故本文对上证综合指数股票市盈率序列采用如下措施进行模型识别。
图7ARMA 的自相关函数:当p=0时,ARMA(p,q)退化为MA(q)则,ARMA的自相关函数具有截尾性质当q=0时,ARMA(p,q)退化为AR(q)则,ARMA 的自相关函数具有拖尾性质当p≠0时,即ARMA(p,q)函数具有拖尾性质2.3 参数估计(1)用普通最小二乘法回归的结果为:Method: Least SquaresDate: 04/23/16 Time: 15:02Sample (adjusted): 1999M03 2014M09Included observations: 187 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob.Y(-1) 0.043027 0.073262 0.587305 0.5577R-squared 0.000663 Mean dependent var -0.117754Adjusted R-squared 0.000663 S.D. dependent var 3.421928S.E. of regression 3.420794 Akaike info criterion 5.302956Sum squared resid 2176.540 Schwarz criterion 5.320234Log likelihood -494.8263 Hannan-Quinn criter. 5.309957Durbin-Watson stat 2.017191图8(2)有时用普通最小二乘法回归时,也可加入常数项。