网络流量行为的态势分析与预测
作者:汤霖
来源:《电脑知识与技术》2011年第21期
摘要:在不断变化的现实网络环境中,流量参数之间的关系是相当复杂的,呈现的一般都是非线性规则,所以我们根据人工神经网络理论构造出以BP神经网络为核心的流量预测模型,对网络流量行为进行有效的态势分析进而产生预测流量的方案,并结合公司日常的网络管理加以应用,为企业用户提供更好的体验服务。
关键词:网络;预测模型;BP神经网络
中图分类号: TP393 文献标识码:A文章编号:1009-3044(2011)21-5098-02
Network Flow Behavior of the Situation Analysis and Prediction
TANG Lin
(Communication and Information Engineering College, Shanghai University, Shanghai 200072, China)
Abstract: Real network environment is constantly changing, the flow relationship between variables is complex, usually showing a strong non-linear law. This article is introducing the series forecast within the theory and human nerve cell network based on BP neural network was designed based on the traffic forecasting model, given an effective traffic prediction programs, and applied to the company's network management, to provide users with better services.
Key words: network; forecast model; BP neural network
随着网络技术日新月异的发展和网络规模的不断扩大,网络体系结构越来越复杂,网络设备的类型和网络上所承载的业务种类不断增加,这些因素都导致网络出现各种性能或故障问题的可能性大大增加。
本文就是在这样的研究背景及意义下,提出了一个网络流量分析与预测模型。
该模型采用了BP (Back Propagation 反向传播)神经网络技术,具有自学习能力,可以有效地解决现有的许多流量采集系统中的问题。
该模型的流量采集部分基于MRTG软件,同时在流量图生成模块里结合数据库工具RRD,并在某公司网络环境下,用试验结果来验证该预测分析模型,即可获得相对准确的预测精度和较强的适应力。
1 网络流量分析预测模型
1.1 确立预测对象
某公司网络中出口防火墙的流量信息是进行预测分析的基础,我们采取对防火墙流量的流入和流出情况进行系统分析,选用适合的方法进行预测,进而产生预测结果。
尽管导致网络设备上实际带宽变化的条件具有多重性和量化困难,但是带宽变化的态势在时间上是一种逐步推进的过程,有一定的规律可循。
基于网络流量带宽的这一特征,我们通过预测网络节点端口带宽占有率,从而间接达到网络节点端口流量预测的目的。
1.2 预测模型的构造设计
公司为了达到网络管理的有效性,通常网络流量模式是它们所运用的一个非常必要的方法,因此,准确、严格的数据采集方式,是能够建立一个很好的模型为网络流量,这样才能够满足模型对数据的采集的需求。
以预测模型为例,它的核心网络系统能够分为三个独立的模块,这是按照系统的功能来划分,它们是:流量数据采集、流量图生成、流量预测。
见图1。
当采集到的网络数据,需要对它的数据进行流量图的生成,以便测试需求,而且更加直观地观察到。
究竟采用何种方法来对网络进行监控,才能提高它的安全性,这是快速网络发展的今天必须面对的,而其越来越多的人希望通过简单的网络操作,来达到对网络中的数据或者信息监控,本文将介绍一种高效的管理手段:MRTG。
它其实是一个管理工具,通过SNMP网络协议来监控网络中的一些信息,最终会把一些有用的信息很直观的反馈给用户,主要是以包含PNG图形的HTML文档来表示的。
当然,MRTG也有它定时刷新数据流量的功能弊端,首先,MRTG它不能够将需要的信息长时间的进行保存,这样一来,会给以后对数据的查询以及统计带来了困难,同样,它的运行效率不高也是其中一个问题。
但是还会有其他一些工具来弥补这些弊端和不足,那就是MRTG与RRDTOOL这个工具的完美结合,通过这2个工具的搭配使用能够很好的解决这个问题。
2 实验结果分析
2.1 实验数据的采集
我们采用公司局域网,所以,核心的采集技术是使用公司网络中出口防火墙进行数据采集。
数据采集使用MRTG+RRD来进行的,MRTG的数据流量是设计两个方面,简单介绍下,一是,接受数据的过程量,二是,进行写的过程量。
2.2 实验结果
见表1。
我们可以使用带宽的占有率来进行预测模型,在测试过程中,主要采用时间回返法来进行取样,比方说,可以往上推10分钟,并且取得每1分钟的网络节点的时刻的网络数据流量,并且把获得到得前10个数据作为标准的输入,并且和第11个的数值作为比较,并且把得到的神经元个数作为输出。
下面有图表为例,可以参考下它们之间的关系,也就是针对输入、输出为例:
1)网络节点端口在t-25分钟时刻的带宽占有率;
2)网络节点端口在t-20分钟时刻的带宽占有率
3)网络节点端口在t-15分钟时刻的带宽占有率
4)网络节点端口在t-10分钟时刻的带宽占有率
5)网络节点端口在t-5分钟时刻的带宽占有率
6)网络节点端口在t分钟时刻的带宽占有率
7)网络节点端口在t+5分钟时刻的带宽占有率
要尽可能多,但是也不限于最多的样本取样,就以2500个样本为例,用它们来进行网络进行训练,并把1000个样本作为测试的输出样本,知道的数据会被保存在两种模式下,一是数据库,二是文本文件。
我们在进行测试之前,都会对从网络节点端口获得到得数据进行规定的function进行处理,实现统一功能化管理和处理,并且使它们的输入范围保留在0到1之间,这样做,是为了防止网络出现意想不到的错误,更甚者会出现网络的麻痹等相关问题。
3.3 实验分析
一般情况下,会对选取的网络模型进行一些测试性质的操作,主要包含以下几点:对模型进行训练、进行测试操作并且进行结果数据的预测。
所以,在预测模型正在进行测试操作的时候,期望测试中的带宽的占有率,能够与实际中获得到的带宽占有率保持一致性,这样也就代表它们之间的差别很少,只有在这样的网络结构中,可以通过对模型进行训练,这是一种重复性质的训练,直到它得到的误差达到了满意的结果。
对当前网络数据的带宽进行预测,得出的效果图2所示。
通过图2获得图形和数据,要对它进行训练,直至它的数据显示得到收敛,也就是使它们的图形更为接近,当的训练次数是大约200次及以上的时候,获得的图形如图3所示。
通过图3可以很清楚地看到,这两条线具有很高的接近度,但是图形中会出现峰值过高的现象,这是可以理解的,主要原因分析是因为公司局域网络的不稳定性造成的。
3 结束语
通过我们的实验数据,可以分析出当预测模型在对网络采集到的数据进行模拟分析时,只有当预测模型的网络带宽占有率的数值,与网络数据节点的各个流量数据的占有率之间,它们之间的误差出现最小值时,才能达到的要求,也就是说,当它们的误差超出所预期的范围时,可以使用BP神经网络系统,对它们进行实时的训练模拟,尽量大地降低它们的误差范围,而且,当这两个占有率数据惊奇地接近的时候,这才是预测模型达到了效果,所以,在那个时候才能够对的网络数据预测模拟模型,使用采集测试样本的数据进行测试,当得出的结果符合上面的条件时的模型的评价才是合适有效的模型。
参考文献:
[1] Borgnat P,Dewaele G,Fukuda K.Seven years and one day: Sketching the evolution of Internet traffic[C]//Proc Of the 28th Conf.on Computer Communications (INFOCOM 2009). Rio de Janeiro: IEEE, 2009:711-719.
[2] 刘杰,黄亚楼.基于BP 神经网络的非线性网络流量预测[J].计算机应用,2007,27(7):1770-1772.
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。