当前位置:
文档之家› 上证指数的统计特点及其预测模型研究
上证指数的统计特点及其预测模型研究
2 上证指数的统计量及分布
2.1 直方图与描述统计量 运用 Eviews5.0 对上证指数(sp)1990 年 12 月至 2008 年 3 月的 208 个月度数据(取 收盘价)进行分析,可以得到其直方图与描述统计量如下:
40 Series: SP Sample 1990M12 2008M03 Observations 208 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis Jarque-Bera Probability 0 1000 2000 3000
上证指数的统计特点及其预测模型研究
郭俊艳 山东经济学院统计与数学学院,济南 250014,中国 摘要:本文运用 Eviews5.0 对上证指数 1990 年 12 月至 2008 年 3 月的 208 个月收盘价格指 数的数据进行分析,得到的描述统计量表明:该样本不是来自正态总体,与标准正态分布相 比,明显具有尖峰厚尾的特征;利用 QQ 图观察发现,上证指数更接近指数分布;经多次实 验设定了一个预测模型并用样本数据进行了估计,预测精度较高,检验发现其随机扰动项并 不具有一般金融时间序列模型中的 ARCH 效应。 关键词:描述统计量,QQ 图,单位根检验,预测模型,ARCH 效应
8
7
6
5
4
图3
模型预测图
观察图 3 右侧给出的指标,MAPE(平均绝对百分误差)的值若低于 10,一般认为预测精度 较高,而用该模型预测的 MAPE=1.316214,远远低于 10;Theil 不等系数 0.010109,CP(协 变率)为 0.989891 很接近 1,说明此次回归的预测精度相当高,预测很接近真实值。 利用该回归方程,代入 2008 年 3 月的 lsp 及 t=208,则 2008 年 4 月的收盘价格指数预测 结果约为 3439,与实际收盘价格指数 3693 相比,误差率约为 6.9%,效果还可以;再将 2008 年 4 月的结果与相应的 t=209 代入,可预测 2008 年 5 月的收盘价格指数在 3643 点左右。
4 结论与说明
4.1 结论 (一) 上证指数月度数据的统计量表明:该样本不是来自正态总体,与标准正态分布相比, 明显具有尖峰厚尾的特征;从 QQ 图来看,上证指数更接近指数分布。 (二) 取自然对数后,该时间序列是一个趋势平稳过程。
(三) 模型估计结果中,系数 0.931625 是弹性系数,说明上证指数的涨跌幅度均会以 0.931625 的比例衰减。 (四) 本文建立了一个上证指数的预测模型,就回归结果看,预测精度较高,而且其随机扰 动项并不具有一般金融时间序列模型中的 ARCH 效应。 4.2 说明 如果采用其他时间标度的样本数据,可能会得到不同的结论。
上证指数的统计特点及其预测模型研究
作者: 作者单位: 郭俊艳 山东经济学院统计与数学学院,济南 250014,中国
本文链接:/Conference_7157976.aspx
Theoretical Quantile-Quantile 6 5 4 Normal Quantile 3 2 1 0 -1 -2 -3 0 1000 2000 3000 4000 5000 6000 7000 SP
Theoretical Quantile-Quantile 2.4 2.0 1.6 1.2 0.8 0.4 0.0 0 1000 2000 3000 4000 5000 6000 7000 SP 12
表1 ADF 检验 t-Statistic Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level -4.467715 -4.005562 -3.432917 -3.140265 Prob.* 0.0022
(1)
用样本数据对该模型进行估计,运行结果可表示如下(限于篇幅,此处不再列出原始运 行结果):
ˆ t 0.443766 0.000499 t 0.931625 ls p ˆ (t 1) ls p S e (0.133915 ) (0.000265 ) (0.021947 ) 虽然时 间变量 t 的 t (3.3138 ** ) (1.880446 ) ( 42 .44807 ** )
Uniform Quantile
4
0
-4
-8 0 1000 2000 3000 4000 5000 6000 7000 SP
图2
上证指数(sp) 的 QQ 图
由图可以看出, 上证指数的分位数分布与指数分布的情况比较一致, 基本上在一条线上; 而与其它三种分布不在一条线上,由 QQ 图也可以看出该时间序列的右拖尾或称厚尾特征。 由 QQ 图我们发现上证指数(sp)的分布与指数分布基本相同,这一点对我们的建模是很有 用的。
Theoretical Quantile-Quantile 7 6 5 Exponential Quantile 4 3 2 1 0 -1 0 1000 2000 3000 4000 5000 6000 7000 SP
Theoretical Quantile-Quantile
8 Logistic Quantile
参考文献
[1]易丹辉.数据分析与 Eviews 应用.中国统计出版社,2002 [2]高铁梅等.计量经济分析方法与建模.清华大学出版社,2006. [3]罗伯特 S.平狄克,丹尼尔 L.鲁宾费尔德.计量经济模型与预测(英文版.第 4 版 ) ,机械 工业出版社,1998. [4]Ruey S.Tsay 著,潘家柱译.金融时间序列分析.机械工业出版社,2006. [5]彭作祥.金融时间序列建模分析.西南财经大学出版社,2006.
F-statistic Obs*R-squared 表3 ARCH 效应检验结果 1.052409 Probability 1.057272 Probability 0.306168 0.303838
3.4 模型预测 用该模型进行预测,效果可由下图形象直观地看出。
9 Forecast: SPF Actual: LOG(SP) Forecast sample: 1990M12 2008M03 Adjusted sample: 1991M01 2008M03 Included observations: 207 Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion 92 94 96 98 00 SPF 02 04 06 0.141561 0.090028 1.316214 0.010015 0.000000 0.010109 0.989891
3.2 模型设定与参数估计 因为 lsp 是一个趋势平稳过程,所以模型中应将时间变量 t 作为一个自变量,又鉴于 上证指数(sp)与其滞后变量之间存在较为密切的关系,建模时也将其滞后变量引入模型, 经过用 Eviews 对滞后变量的阶数进行多次试验,发现模型的最佳形式为:
lspt t lsp(t 1) u t
表2 序列自相关检验结果
F-statistic Obs*R-squared
0.2robabi lity
0.592790 0.588842
更进一步,对上述估计出来的回归方程作 ARCH 效应检验,发现并不存在许多金融时间序列 模型中较普遍存在的扰动项的条件异方差现象。(见表 3)
1 引言
伴随着我国金融市场的迅速发展与成长,股票市场的价格波动与变化规律越来越成为金 融机构、经济学家与广大投资者的长期关注的热点问题。而我国证券市场自成立至今不足二 十年,有着自己的独特发展规律。下面将对我国上海证券市场的上证综合价格指数 1990 年 12 月至 2008 年 3 月 208 个月的月收盘指数进行分析,研究其统计特点,并进一步给出预测 模型。鉴于数据比较多,本文不再列出原始数据,数据来源于大智慧实时交易软件的导出数 据,所有的统计分析结果均是运用软件 Eviews5.0 得到的。
图1
30
20
10
1401.204 1254.159 5954.765 113.9400 979.3528 2.221984 9.313978 516.6647 0.000000
0 4000 5000 6000
上证指数的直方图与描述统计量
其中直方图显示了该时间序列的频率分布特征,右侧是根据样本数据计算的标准的描述统计
( 2)
T- 检 验 R 2 0.959981, F 2471 .797 (Pr ob 0.000000 ); Prob=0.0615 比 0.05 略 AIC 1.043185 , SC 0.994885 大,但因为上证指数确有上升趋势,所以模型中应该保留。模型的 F-检验显著,拟和优度较 高,AIC、SC 都较小。 系数 0.931625 表示上证指数对其前一个月指数的弹性,即上月指数每增加(或减少) 一个百分点,会引起该月指数平均上涨(或下跌)0.931625 个百分点。 3.3 随机扰动项的自相关检验、ARCH 效应检验 对上述估计结果作 LM 自相关检验,由表 2 的概率较大可看出不存在随机项的序列自相 关,从而说明模型的设定还是比较正确的。
3 预测模型
3.1 单位根检验 由于 sp 非常接近指数分布,所以我们构建的模型中应该包括 log(sp)关于时间变量 t 的 线性形式,而建模前需要对 log(sp)的平稳性进行检验。令 lsp=log(sp),用 ADF 方法对 lsp 作单位根检验, 结果见表 1, 该结果是基于包含常数项和时间变量 t 的相应形式的模型作 ADF 检验得到的, 可以看出,lsp 是一个趋势平稳过程。