当前位置:文档之家› 基于改进多元线性回归的股票价格预测模型

基于改进多元线性回归的股票价格预测模型

科技·经济·市场612019年第8期

经济研究基于改进多元线性回归的股票价格预测模型李俊豪(辽宁师范大学数学学院,辽宁 大连 116021)摘 要:当前股票市场价格波动剧烈,不论是专业股票投资者以及相关从业人员还是二级市场中的散户都希望找到一条行之有效的路径进行股票价格预测,这不仅能帮助投资者控制风险,也可以帮助其减少不必要的损失。本文以当前比较流行的多元线性回归法为基础,并使用因子分析将这一方法进行改进对贵州茅台(SHSE. 600519)这一支股票进行股价预测,最终通过比较预测效果,推行出适用于该股票的股价预测模型。关键词:量化投资;多元线性回归;因子分析;股价预测;数学建模

0 引言事实上,量化投资就是使用数学的方法与手段在经济现象中找到数据存在的内在联系,通过K线图的观察,可以看到当前某些股票有明显的时间序列上的线性关系,那么进而可以大胆的假设,实际上股票价本身是否与自身的各个指标之间有着较强的线性关系。本文建立了多元线性回归模型,把股价作为被解释变量,其他影响因素作为解释变量,进行模型模拟。[1]我们在对该模型进行共线性诊断时会发现,开盘价、最高价、最低价、收盘价、总手数、次日开盘价这些自变量间存在严重的多重共线性,影响了模型的预测效果。事实上,计量经济学理论给出了多种消除多重共线性有多种处理方式,本文选择使用较为简便的方式,即因子分析来消除多重共线性。在进行因子分析后,我们将多个解释变量最终分为两个因子,分别是价格因子和数量因子,以这两个因子为自变量,次日收盘价为因变量进行多元线性回归,得到的回归方程模型进行预测的结果远远优于之前的回归模型。[2]本文最终使用东方财富软件上的日K线图上的数据作为数据来源,选取贵州茅台(SHSE.600519)这只绩优的白马股作为目标股票,把2018.10.30-2019.4.17共计114个交易日作为模型建立的训练集,把2019.4.18-2019.4.30共计9个交易日作为模型检验回测期。1 多元线性回归1.1 模型建立多元线性回归使用当日开盘价、最高价、最低价、总手数,次日开盘价为自变量,次日收盘价为因变量作出多元线性方程进行求解预测。

表1 模型汇总b

模型RR 方调整 R 方标准 估计的误差更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改

1.994a.989.98812.49938.9891569.4876107.0002.092

a. 预测变量: (常量), 次日开盘价, 总手数, 当日开盘价, 收盘价, 最低价, 最高价;b. 因变量: 次日收盘价表2 系数

模型B非标准化系数标准系数tSig.容差共线性统计量标准 误差试用版VIF

1(常量)-8.0997.652-1.058.292当日开盘价-.082.236-.080-.347.729.002501.052最高价.296.348.294.852.396.0011133.479最低价.412.292.3951.413.161.001743.459收盘价-.724.304-.713-2.383.019.001852.180总手数3.722E-007.000.008.540.590.50731.974次日开盘价1.112.1671.0986.673.000.004257.667

设次日收盘价为Y,当日开盘价为X1,最高价为X2,最低价为X3,收盘价为X4,总手数为X5,次日开盘价为X6,可以得到多元回归方程为:Y=-8.099-0.082X1+0.296X2+0.412X3-0.724X4+ 3.722*10-7X5+1.112X6其中R2为0.988,说明数据的拟合程度相当好,并且根据DW检验数值显示,由于DW值在2左右,该模型不具有自相关性。1.2 模型预测将各解释变量的数值代入多元线性回归方程中有:

Y=-8.099-0.082X1+0.296X2+0.412X3-0.724X4+

3.722*10-7X5+1.112X6

次日收盘价(2019.04.18-2019.04.30)的预测值是:

942.59,948.55,961.15,962.3,981.01,973.27,956.91,956.03,967.04与观察值的绝对误差分别为:2.91,4.01,11.95,科技·经济·市场622019年第8期

经济研究12.65,11.01,20.9,11.91,15.94,9.96平均绝对误差为:11.22平均绝对误差百分比:1.18%可以看到所得到的模型的预测效果非常好,绝对误差的百分比只有1.18%,估计值几乎已经无限接近于实际观察值。2 模型改进2.1 模型建立由表2可以看到该模型具有非常强的多重共线性,VIF值远远大于10,所以本文采用因子分析法来减少多重共线性对模型的冲击,首先要进行因子分析的前提条件假设。

表3 相关矩阵当日开盘价最高价最低价收盘价总手数次日开盘价

相关当日开盘价1.000.996.998.994.330.990最高价.9961.000.997.999.276.996最低价.998.9971.000.997.628.994收盘价.994.999.9971.000.465.998总手数.330.276.628.4651.000.373次日开盘价.990.996.994.9598.3731.000

可以看到绝大多数的相关系数均超过了0.6,并且由接近70%的相关系数在0.9以上说明当前各变量之间有较强的相关性。基于这样的强相关性,可以看出当前各组数据比较适合进行因子分析,但是本文还对该组数据进行了其他相关检验保证数据的合理性。表4 KMO和Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量.812Bartlett 的球形度检验近似卡方2604.772df15Sig..000根据检验结果可以看出由表知巴特利特球度检验的检验统计量为2604.772,该观测值较大,且对应的概率P值小于给定的显著性水平,且KM0值为0.812,表明原有变量适合作因子分析。在基于该模型适合做因子分析的情况下,本文使用spss软件进行了数据的因子分析:两个因子对总变量的解释程度达到了99.762%,解释效果良好,可以形成两个因子。由此就得到了两个因子,第一个因子的方差贡献率是5.013,第二个因子的方差贡献率是0.973。从而可表5 解释的总方差

成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %15.01383.55383.5535.01383.55383.5534.95982.65482.6542.97316.20999.762.97316.20999.7621.02617.10899.7623.011.18199.9434.002.03199.9745.001.01899.9916.001.009100.000提取方法:主成份分析。

表6 成份矩阵a成份12当日开盘价.996-.063最高价.999-.016最低价.997-.065收盘价.999-.027总手数.192.981次日开盘价.987-.018提取方法 :主成份。a. 已提取了2个成份。

以对两个因子进行命名,因子一:价格因子,因子二:数量因子。F1=0.996X1+0.999X2+0.997X3+0.999X4+0.192X5+

0.997X6

F2=-0.063X1-0.016X2-0.065X3-0.027X4+0.981X5-

0.018X6

2.2 改进模型回测

根据下表可以看到调整后的R方为0.984,说明模型拟合程度相当好,并且significant-F值为0.000<0.05。该模型经过DW检验后,DW值为1.761在2附近,可以认为不存在自相关性。 (下转第64页)科技·经济·市场642019年第8期

经济研究中小型企业盈利过分依赖于存贷款业务收入的现状。1.5 提高发展效率中小企业进行融资后,有利于提高中小金融企业的发展效率。针对于金融机构的发展效率大多是指金融机构在未来发展中以及日常工作中的创新能力[6]。想要在日益激烈的市场竞争中占有一席之地,中小金融机构就需要不断提升自身创新能力,顺应社会经济的发展需求,有效防范市场化带来的一系列风险。中小金融机构的创新能力是对中小金融机构的有效体现。中小企业融资加剧了金融机构的市场竞争,要求中小金融机构不断进行金融创新,通过创新手段提高自身竞争力,保证正常的利润收入,增加自己的市场份额。另一方面中小企业融资为金融机构产品的创新提供基准,融资股东为提高创新能力奠定基础,有助于金融机构在日后的发展大力发展创新能力,不断引进新型技术,提高金融机构的发展效率。2 结束语 在一带一路的时代背景下,通过国家政策的扶持,在中小型企业的发展中进行融资,“一带一路”给中小企业的发展提供了一个重要的契机,同时,也给予中小型金融结构一个发展的机会。金融机构想要抓住这个机会进行自我发展,就需要不断进行改良。这不仅是对金融机构的考验,也是对融资企业的一种挑战。通过中小型金融结构的不断完善,为中小型金融机构的发展提供坚定的基础。

参考文献:[1]杨蕾, 张恒瑄, 刘静怡. “一带一路”背景下中小型外贸企业融资困境破解策略——基于北京“政保贷”案例[J]. 农村金融研究, 2018(3):25-26.[2]侯冠平. “一带一路”背景下的物流业发展与社会结构变迁——基于对城镇化和城乡收入差距影响[J]. 江苏农业科学, 2018, 46(11):288-296.[3]曾之明, 汪晨菊, 张琦. 金融发展对中国中小板上市公司融资约束的影响[J]. 财经理论与实践, 2017, 38(4):15-20.[4]雷蕾, 刘健露, 杨恺钧. “一带一路”背景下中国进出口贸易影响因素及发展潜力研究——基于包含碳生产率的引力模型分析[J]. 金融与经济, 2018(2):55-60.[5]闫贝贝, 张强强, 刘军弟,等. “一带一路”倡议背景下的中波苹果贸易及其对中国苹果产业发展和市场的影响[J]. 北方园艺, 2017(20):200-205.[6]黄凌云, 郑淑芳, 王珏. “一带一路”背景下对外投资企业的合作共赢机制研究——基于社会责任视角[J]. 管理评论, 2018, 30(2):172-182.

(上接第62页) 表7 模型汇总(改进)b模型RR 方调整R方标准估计的误差更改统计量Durbin-WatsonR方更改F 更改df1df2Sig. F 更改

1.992a.985.98414.34196.9853561.4782111.0001.761

a. 预测变量: (常量), REGR factor score 2 for analysis 1, REGR factor score 1 for analysis 1;b. 因变量: 次日收盘价。

相关主题