基于时问序列分析的网络流量预测模型研究周德懋,李舟军,康荣雷(北京航空航天大学计算机学院北京100191)
摘要:通过对网络流量数据作为时间序列进行小渡变换建模,应用于未来时间的网络流量数据预测。首先对流量数据序列进行多尺度分解,对分解到不同尺度上的数据分别利用不同的时间序列模型进行分析,然后进行预测数据的折衷处理,得到网络流量多尺度预测模型。仿真结果表明与单一应用RBF神经网络的时间序列预测模型相比,该模型预测效果良好,具有较高的预测精度和很好的模型适应性。关键词:网络流量;时间序列分析;径向基神经网络;小波变换建模中图分类号:P228.41;TP393文献标识码:A文章编号:1004—373X(2009)08—115一03
StudyonPredictionModdofNetworkTrafficFlowBasedonTimeSeriesAnalysisZHOUDemao,LIZhoujun,KANGRonglei
(SchoolofComputerScienceandEngineering,BeihangUniversity,Beijing,100191,China)
Abstract:Thenetworktrafficflowistobemulti—scalediscomposedtimeseriesbythewavelettransformmodelingisfirstintroduced,andthendifferenttimeseriesanalysismodelsbuilttoanalyzedataofdifferentscale,sothemulti—scale
predictionmodelisusedinnetworktrafficflowprediction.Theexperimentdataindicate:comparedwithothersingletime—seriespredictionmodelswithRBFnetworktheory,thismodelprovidebetterapproximateandpredictioneffort,andhashigherprecisionofpredictionandbetteradaptability.Keywords:networktrafficflow;timeseriesanalysis;RBFnetwork}wavelettransformmodeling
0引言对通信网络流量的预测,已有的方法主要建立在数理统计的基础上,其中较为成功的预测方法有:基于FARIMA(P,d,q)模型的预测方法uo;C.Bor—Sen提出的模糊自适应方法[2];基于分数整合滑动平均模型的预测方法口“1;利用模糊判断规则预测网络流量的方法[53等。目前,利用小波理论处理时间序列问题已经是一个热点,在许多领域得到应用并取得较好的成果,如物流、生物学、经济等[6]。而国内基于小波理论研究网络流量的研究工作开展甚少,因此,这里着重于讨论基于小波理论的网络流量预测新方法。在此将网络流量作为时间相关序列进行分析,提出将时间序列多尺度分辨分析方法应用于网络流量预测中,以期建立更合理、可行的网络流量预测模型,得到精确、可信的网络流量预测结果。1基本理论1.1多尺度系统分析理论多尺度系统分析理论的研究基于4个基本出收稿日期:2008—08—28基金项目:国家自然科学基金的资助项目(60573057,90718017)发点N]:(1)所研究的现象或过程具有多尺度特征或多尺度效应;(2)无论现象或过程是否具有多尺度特性,通常观测信号是在不同尺度(或分辨率)上得到的;(3)无论现象或过程是否具有多尺度特征,观测信号是否在不同尺度或分辨率上得到,利用多尺度算法往往能获得更多信息,从而降低问题的不确定性及复杂性;(4)无论现象或过程是否具有多尺度特性,观测数据是否在不同尺度上得到或者观测目标是否在多尺度上描述,总有一个不可忽略的原因考虑多尺度模型算法,那就是利用多尺度算法往往能够获得更多信息,从而降低问题的不确定性和复杂性。在实际应用中,分析和识别发生在不同尺度上的现象是很有意义的。多尺度分析建立在小波变换和多尺度表达理论的基础上,由于尺度分解直观、结构灵活并能提供良好的数学框架,使得基于小波的多尺度技术成为许多基础和应用研究的有力工具。多尺度建模和估计方法的灵活性可以在快速并行算法中对噪声和分辨率进行折衷。1.2时间序列多尺度混合预测模型建立在时间序列上的多尺度分析以小波分析与】】5 万方数据Mallat算法f8】为基础,其分析方法的核心内容是正交小波分解和重构。而Mallat算法为这一方法提供了便捷的递推公式。其基本思想是:将待处理的时间序列在不同的尺度上分解为细节和轮廓两部分,分解到细尺度上的部分称为细节序列部分,反映时间序列中高频部分变化;分解到轮廓尺度上的部分称之为平滑序列部分,反映时间序列中低频部分变化。通过分析序列所分解的细节和轮廓的部分,实现对时问序列的多尺度分析。在应用多尺度分析方法处理实际问题时,首要问题必须构造正交小波。1998年,I.Daubechies提出具有紧支集的正交小波系列:Daubechies小波。该正交小波的提出具有重要的意义。它使有限长度的时间序列进行正交小波分解和重构。利用DB为母小波对时问序列进行多尺度分解,将时间序列分解为趋势成分、随机成分和周期成分。趋势成分可以看作周期长度比实测序列长度长的长周期成分,因此该成分属于大尺度高频成分;随机成分由一系列人为随机因素引起,属于小尺度高频成分;周期成分由确定性因素引起。在频谱分析中介于趋势成分和随机成分之间。因此,将时间序列进行多尺度小波分解可以识别3种成本并将其进行分离。将分解后具有不同特征的时间序列分别利用相应的分析模型进行参数识别和估计,建立各自的相关模型,再将各模型的分析结果进行线性叠加得到最终结果。实现时间序列的耦合预测会得到比单一时间序列预测模型更好的分析预测结果。这是因为小波分解将非平稳时间序列分解成适当的多个平稳时间序列,提高了数据变化的稳定程度,从而提高了预测经精度。分析上述分解成分,将近似平稳的低频趋势项用AR模型来进行预测,因为AR模型对于分析平稳时间序列有较好的预测效果;将周期项和高频随机项分别利用RBF神经网络进行参数估计和建模;将三者的预测结果进行线性叠加得到最终的多尺度混合预测模型。2网络流多尺度混合预测模型网络流量的多尺度混合预测模型的具体实现步骤如下:2.1小波分解利用实际应用广泛且应用效果较好的db3小波对网络流量{Z,}进行3尺度分解,得到含有周期项和高频随机项的序列{H,},以及低频部分{L,}。2.2RBF网络的模型建立过程对分解之后得到的周期项和高频随机项{H。)采用RBF神经网络进行预测,具体实现步骤如下:(1)将输入的时间序列{H,}进行归一化处理,有:h,=(^i—h。i。)/(矗。,一h。i。)(1)116(2)对于时间序列hi,希望通过前夕个时刻的值预测下一个时刻的值,因此可将P作为神经网络的输入向量维数。P也称为神经网络的阶数,它的确定可遵循如下的步骤:对于非线性时间序列,一般的动力学表达式为:h,一f(h,1,h.2,…,矗.。)+e,(2)
用RBF神经网络进行函数逼近后的一步预测为:h,一f(h,I,h.2,…,h。。)(3)根据一步预测误差确定模型的阶次P。大量的数据试验表明,当P超过一定的值时,预测精度不会随着P的增加而提高,相反会增加计算量。因此在实际应用中,需要在低阶次和高精度之间进行折衷。(3)选用径向基函数为高斯函数的RBF网缓、,神经网络的输出为:
多一∑牡exp(一忪一c;㈣2砰)(4)
式(4)中:参数Ci为基函数的中心;毋为宽度;毗为权值;优为隐层感知器个数。(4)给定样本集[z;,Yi],根据梯度下降法进行网络训练,确定相关的参数值。取性能指标函数为:,一扣一耋岬pc等,]2㈣
求指标函数,关于Ci,吒以及∞i的偏导数,基于梯度下降法进行网络训练。(5)根据神经网络的训练结果,得到高频部分的载波相位预测值五。。2.3AR模型建立
对分解之后得到的低频序列{L,)采用AR时间序列建模。AR模型表述如下:l,一妒lZ,1+他Z,_2+…+%Z,。+蛳(6)式中:鸭相互独立同分布,体现了序列的随机性;q代表模型的阶数。AR模型建模具体实现步骤如下:(1)根据已经建立的AR模型,利用AIC准则函数[1¨进行定阶:AIC=一2log(模型的极大似然度)+2(模型的独立参数个数),预先给定上界lgN,其中N表示样本个数。根据AIC极小点确定模型的阶数。(2)根据最小二乘法对参数P进行估计:将式(6)写成矩阵形式,有:Y=却+(cJ(7)
依据最dx--乘估计公式计算得:妒一(LTL)一1LTy(8)(3)根据建立的AR模型,估计k时刻网络流量低频部分的预测值为:Z^=仍lk-1+仇Z卜2+…+%Z卜口(9)
万方数据王现岱虫壬撞苤之圣QQ皇笙墓墨翅盏羞星!墨翅垒盐篡垫廛旦堇盔g2.4预测结果输出预测k时刻的网络流量为:乞=左。+2。(10)
3仿真分析按照上述理论和方法,通过Matlab仿真检验多尺度混合预测模型对网络数据流预测的准确性。根据3000个历史网络数据流,预测未来300个网络数据流,并且与实际数据进行比较,得到预测的误差。传统的基于OLS算法的RBF神经网络应用于时间序列预测后的误差如图1所示,而这里所提出的多尺度混合预测模型的预测误差如图2所示。
图1OLS算法RBF神经网络预测误差图图2多尺度混合预测误差图仿真结果表明,多尺度混合预测模型应用于网络数据流的预测,比传统的OLS算法RBF神经网络预测模型,能得到更好的预测结果。
4结语这里根据时间序列分析理论,提出基于小波理论的网络流量混合预测模型。模型首先对网络流量序列进行多尺度分解,得到低频部分,高频部分和随机项;然后对得到的低频部分建立AR模型,对高频部分和随机项采用RBF神经网络进行预测;最后对各个模型的预测结果进行线性叠加,得到网络流量混合预测模型。仿真结果反映预测的准确性,验证了方法的可行性与有效
性。因此,将小波理论应用于网络流量预测中,具有很好的应用前景。
参考文献[13GarrettMW,WilhingerW.Analysis。ModelingandGenera—
tionofSelf—similarVBRVideoTraffic[A].Proceedings
SIGCOMM’94[C].NewYork:ACMPress,1994:269—280.
[2]ChenBorsen,YangYusuarg,BotekuenLee,以a1.FuzzyAdap—