宝鸡文理学院论文题目:校园网络流量估算模型09级姓名:王军涛系别与专业:数学系数学与应用数学09级姓名:李静系别与专业:数学系数学与应用数学09级姓名:马华璐系别与专业:物理系测控技术与仪器校园网络流量估算模型摘要随着时代的发展,校园网已经在各个高校相当普遍,由于网络互联环境的复杂,导致了网络的可靠性越低,网络服务越容易出现问题,网络的性能就更容易受到影响。
传统的网络管理是在网络报警之后,根据网络日志或网络提示解决潜在的或已经出现的问题,是一种响应式的行为。
这个时候的网络服务可能已经受到影响。
为了使学校的网络部门提前处理掉潜在的问题,从而使校园网络能更好的服务学校的教学和生活,我们必须精确地估计和预测校园网流量的数据高峰,从而对校园网流量的周期性、突发性作出准确地预测,以达到防患于未然。
为此,我们以某学院某个周期(一周内)按照固定时间间隔统计的两个核心服务器的网络发送请求数据(单位:字节)和收到数据(单位:字节)以及平均发送和收到的数据(单位:字节)信息为依据,通过数学建模提出了一套完整的预测方案。
具体做法如下:首先,我们基于自相似性提出了校园网络模型为:1,5 1.5 1.5() 2.6(121)1,2,3r k k k k k=⨯+-+-=其次,从所给数据我们分析得到了每天各个时间段的网络流量有较大的差别,为此根据数据流量的多少,我们将每天划分为网络高峰期,正常期,空闲期三个时期,并采用了R/S分析法表示出了自相似性参数H的表达式,然后通过MATLAB软件编程计算出了上述三个时期H的值分别为10.844H=,20.735H=30.713H=接着我们通过相关的流量数据和每天各个量得数据关于时间的走势图对校园网络实际流量数据周期性、突发性进行了分析,得到结论是七天中每天都是有周期的,但是每天的最高峰,最低峰都是不同的,每天的流量都会对本周的流量产生影响,而且波峰总在星期六和星期日之间游动,波谷总在星期二和星期四之间游动随后我们通过题中所给的数据对我们的预测模型进行了验证与检验,发现我们预测的与实际测量的比较接近。
最后我们通过所建的模型以及得出的结论对相关部门提出了如下建议1.加强校园网络安全管理;2.构建多功能校园网络系统,实现网络资源高度共享;3.网络速度慢,稳定性差,制约了社会对学校的关注度;4. 师生共同建设高水平的管理团队,取长补短,完善网络应用及维护;5.实行同域内高校共建主干网,分而自治,加强网络信道的建设。
关键词:自相似性长相关性 Hurst参数 R/S分析方法一问题重述随着时代的发展,校园网已经在各个高校相当普遍,精确地估计和预测校园网流量的数据高峰,可以对校园网流量的周期性、突发性作出预测,以便于学校的网络部门提前做好预案,更好的服务学校的教学和生活。
本题给出了某学院某个周期(一周内)按照固定时间间隔统计的两个核心服务器的网络发送请求数据(单位:字节)和收到数据(单位:字节)以及平均发送和收到的数据(单位:字节)信息的详细统计资料。
按照这个实际统计资料完成下列题目:1、提出校园网流量模型(可以基于自相似性);2、基于小波构造与小波包分解估计Hurst自相似性参数H的算法;3、利用MATLAB求解校园网络实际流量数据的自相似性参数H,并给出实现过程;4、给出校园网络实际流量周期性、突发性分析;(参见《基于流量特性的校园网网络性能分析与研究',》第三章)5、利用所给数据对你所建立的校园网络流量预测模型进行检验与验证;(参见《基于流量特性的校园网网络性能分析与研究',》第四章)6、根据你所做的模型对学院网络相关部门给出一些合理的建议。
二问题分析要对校园网流量的周期性、突发性作出预测,我们必须提出一种可以预测校园网流量的周期性、突发性的模型,并且对模型的正确性进行检验和验证,从而便于学校的网络部门提前做好预案,更好的服务于学校的教学和生活。
对于第一问,我们基于自相似性,在网络流量分析中,根据在时间维度上表现出自相似性的流量时间序列,由表中所给流量数据,将一周期七天的数据进行拟合,具体是分别拟合出这七天的的最大接收数据流量、最大发送数据流量、最小接收数据流量、最小发送数据流量、平均接收数据流量、平均发送数据流量。
由图象初步判断网络流量不管在哪个分辨率上都表现出相同的特征,具有自相似性。
我们通过建立自相似的模型得出自相关函数对于第二问得求解,要估计Hurst的自相似性参数H,有以下几种方法:小波分析法;频域潽法,R/S方法。
由于小波分析法只用了分解得到的小波系数,丢失了对尺度系数的信息分析,因此,估计出的参数不太准确,会偏大,所以我们采用比较精确且操作简便的R/S方法。
并利用MATLAB编程,求解校园网络实际流量数据的自相似性参数H。
对于校园网络的周期性、突发性,主要采用Hurst参数H描述随机过程的自相似程度,反映流量的突发特征,当1/2〈H〈1时随机过程是自相似的。
H越大,则流量越呈现为突发。
若H=1/2则,随机过程是不相关的。
第五问,我们采用表中所给数据,从中抽取几组数据,通过所抽取的数据,我们建立了季节预测模型,并采用上述模型对6月15日的流量变化图与实际流量图进行比较,从而验证了预测流量的合理性。
第六问我们通过所建的模型以及得出的结论进行了阐述。
三 模型假设1.所有监测数据无误,校园网长期运作情况符合7天监测数据的统计规律。
2.连接到每一个节点的网络用户总数在一定时期内几乎不变。
3.就每一个节点而言,连接到该节点的用户没有差别,即他们对流量(包括流入和流出两个方面)的贡献相同。
4.把网络用户按网络使用流量的多少不同分类,各类别中用户使用的流量无差别。
5.所考虑的网络故障问题仅由用户数量或流量引起,与其他因素无关。
6.正常运行时的网络流量保持相对平稳,即只在统计平均值上下作小范围波动。
四 符号说明1、H :Hurst 参数2、[]i E x :经过平滑后的X 期望3、 u :X 的恒定均值4、j : 每日得时间段序号5、t :代表总的时间段序号6、 ij T :每个时间段流量的大小7、i T :日平均值8、ij g :每个时段流量与当日流量的比例系数9、m :任意的自然数五 模型建立及求解5.1 模型的建立与分析:5.1.1.自相似校园网络模型:(选取的计算数据见附录1)设},2,1:{⋅⋅⋅⋅⋅⋅==j X x j 为协方差平稳的随机过程,即X 具有恒定均值][x i E u =,和有限方差)][(u x E i -=2δ,其自相关函数 2)])([()(δu x u x E k r k i i --=+ 仅与k 有关,假设X 的相关函数具有如下形式:)()(1k L k k r β-≈,当,满足,其中0x L 10,1〉∀〈〈∞→βk 有11lim ()/()1t L tx L t →∞=令()(1)/(1,2,3)m k km m km X X X m k -=+++=为{}i X 的m 阶平滑过程,并记时间序列()()()12(,,)m m m X X X =的自相关函数为()(1,2,3)m r m = 由自相似定义1:过程X 被称为严格二阶自相似的且由自相似系数1/2H β=-,如果m 阶平滑过程()m X 具有与原过程X 相同的相关函数,即()()()m r k r k =对所有(1,2,3)m =都成立。
有定义2我们知道过程被称为渐进二阶自相似的,且具有相似系数1/2H β=-如果1()21,r m β-→-当m →∞()221()2m r k k βδ-=当m →∞(2,3)k =式中2(())f k δ表示作用在f 上的二次差分算子,即2(())(1)2()(1)f k f k f k f k δ=+-+-最后再以AMAR 参数为滤波器系数进行滤波的结果,分型高斯噪声的自相关函数满足:2222()(121)1,2,32H H H r k k k k k δ=+-+-=当时,分形高斯噪声为具有Hurst 系数为H 的严格二阶自相似过程。
代入表格中的数据我们得到:1,5 1.5 1.5() 2.6(121)1,2,3r k k kk k =⨯+-+-=5.2模型的建立与分析: R/S 分析法的基本内容是:(计算所用数据见附录2)对于一个时间序列{x t },把他分为A 个长度为N 的等长子区间,对于每一个区间,设∑=-=t u n u n t M x x 1,)( (1)其中,M i 为第n 个区间x u 的平均值,X n t ,为第n 个区间的累积离差,令)min()max(,,x x n t n t R -= (2)若以S 表示x u 序列的标准差,则可定义重标极差R/S,他随时间而增加,Hurst 通过长时间的实践总结建立如下关系:H u k S R )(/= (3)对(3)式两边取对数得到(4)式)log()log()/log(k n H S R n += (4)因此,对)(和S n /R log )log(进行最小二乘法回归就可以估计出H 的值我们将6月13日至6月20日每天的各时段的网流量与时间进行拟合,并得到拟合函数的图像,通过图像我们得到了每天中繁忙时段、正常时段、空闲时段的时间点,其中:每天中繁忙时段为:11:30—12:00 22:00—22:30每天中正常时间段为:14:00—15:30 17:30—18:00每天中空闲时间段为:0:00—1:00并对各个时间段得数据进行整理,(具体数据见附录表格),最后我们.采用第二问,我们采用R/S 分析估值法估算出H 的值,其程序见附录5.4模型的建立与分析:5.4.1流量周期性:周期性变化特性反映的是网络流量时间序列随着时间变化而表现出来一种季节性的变化规律。
由于影响网络流量行为长期不变化的因素比较多,如果间期较长,那么这些周期性流量特性还可以存在其他的非严格周期行为,这些周期是统计与模糊概念上的周期,本题中我们选择6月13日一整天的学生发送的数据量拟合出图像,分析其周期性。
流量周期性对校园网性能的影响(图见附录4)在对校园网进行连续7天的流量统计中,我们可以明显的看到流量呈现规律性分布,从图中可以很容易看出流量的每天都有周期性的变化,但每天的最高峰不同。
通过观察与分析,我们可以得到网络流量在每一天中有周期性变化,每天的流量对一周中的流量有不同影响,而且这种趋势一直存在。
在一个周期内,从宏观上分析,峰顶在星期六与星期日之间波动,而峰谷在星期二和星期四之间波动,峰顶和峰谷之间隔三天到四天,即知校园网存在7天周期性。
这种行为周期在一定程度上反映了学生对网络的依赖性和使用的有效性。
因此如果一天为周期的话校园网的流量在每天都呈现出这种不严格的周期变化。