基于复杂网络的城市交通网络特征分析胡全(西北师范大学数学与统计学院730070)摘要:随着城市道路交通的增加和交通问题的日益严重,城市公交网络网络特征的研究显得越来越重要。
客观合理地对城市路网特征进行分析评价,对于提高城市公交网络的运行效率具有重要意义。
近年来随着复杂网络理论研究的不断深入,为研究分析城市公交网络提供了新的方法和手段。
本文重点研究了兰州市区公交站点复杂网络的网络特征,采用了以兰州市公交网为复杂网络模型,研究该模型的网络特征。
用平均最短路径长度和平均集聚系数来描述网络的特征,并绘制相关示意图,由此分析得出兰州市公交站点网络的一般特征。
关键字:复杂网络,公交网络,特征Study on Characteristic of Urban Public Transit Network Based on Complex Network TheoryHuQuan(College of Mathematics and Statistics ,Northwest Normal University 730070)Abstract:With the increase of the urban road traffic volume and the seriousness of the traffic problems, research on the characteristic of urban road network appears more and more important. It is quite important to improve the work efficiency of urban road network to evaluate the characteristic of urban road network reasonably and objectively. With the deep-going research on the complex network theory in recent years, it provides a new method for us to analyze urban road network. This paper focuses on the study of characteristic of the complex network in Lanzhou . Taking the bus transfer in Lanzhou as the complex network model, this model uses the average shortest path length and average clustering coefficient to measure characteristic of the network .Keywords:Bus network; The complex network ; characteristic0 引言自然界和社会领域中存在着许多复杂系统,这些系统均可用复杂网络进行描述和研系。
在国内外,一些学者将城市公究,其中节点表示个体或组织,边表示它们之间的联2]-[1共通系统抽象成由公交线路和停靠站点构成的复杂网络,并在实证研究方面做出了许多有作,这些研究工作对于揭示公交网络的拓扑特性,理解公交网络的功能与效影响力的工6]-[3率具有重要的参考价值。
随着应用复杂网络研究城市公共交通系统的深入,公交网络特征研究的重大理论意义与应用价值日益突显出来。
基于此,本文兰州市的公共交通系统为研究对象,分析公交站点网络的特征,为分析兰州公交网络的特性做基础。
1 相关基本理论1.1 复杂网络学界关于复杂网络的研究方兴未艾。
特别是国际上有两项开创性工作掀起了一股不小的研究复杂网络的热潮。
一是1998年Watts 和Strogatz 在Nature 杂志上发表文章,引入了小世界(Small-World)网络模型,以描述从完全规则网络到完全随机网络的转变。
小世界网络既具有与规则网络类似的聚类特性,又具有与随机网络类似的较小的平均路径长度。
(Watts&Strogatz,p.440-442)。
二是1999年Barabási 和Albert 在Science 上发表文章指出,许多实际的复杂网络的连接度分布具有幂律形式。
由于幂律分布没有明显的特征长度,该类网络又被称为无标度(Scale-Free)网[7]络。
而后科学家们又研究了各种复杂网络的各种特性。
(Strogatz ,p.268-276)国内学界也已经注意到了这种趋势,并且也开始展开研究。
(吴金闪、狄增如,第18-46页)加入复杂网络研究的学者主要来自图论、统计物理学、计算机网络研究、生态学、社会学以及经济学等领域,研究所涉及的网络主要有:生命科学领域的各种网络(如细胞网络、蛋白质-蛋白质作用网络、蛋白质折叠网络、神经网络、生态网络)、Internet/WWW 网络、社会网络,包括流行性疾病的传播网络、科学家合作网络、人类性关系网络、语言学网络,等等;所使用的主要方法是数学上的图论、物理学中的统计物理学方法和社会网络分析方法。
在网络理论的研究中,复杂网络是由数量巨大的节点和节点之间错综复杂的关系共同构成的网络结构。
用数学的语言来说,就是一个有着足够复杂的拓扑结构特征的图。
复杂网络具有简单网络,如晶格网络、随机图等结构所不具备的特性,而这些特性往往出现在真实世界的网络结构中。
复杂网络的研究是现今科学研究中的一个热点,与现实中各类高复杂性系统,如的互联网网络、神经网络和社会网络的研究有密切关系。
1.1.1 复杂网络定义所谓复杂网络,一般认为要满足以下几个特[8]征:(l)网络的大规模性和行为的统计性。
网络节点数可以有成百上千万,甚至更多,大规模性的网络行为具有统计特性。
(2)节点动力学行为的复杂性。
各个节点本身可以是非线性系统(可以由离散的和连续微分方程描述),具有分岔和混沌等非线性动力学行为。
(3)网络连接的稀疏性。
一个有N 个节点的具有全局祸合结构的网络的连接数目为o(N2),而实际大型网络的连接数目通常为。
伽)。
(4)连接结构的复杂性。
网络连接结构既非完全规则也非完全随机,但却具有其内在的自组织规律。
(5)网络的时空演化的复杂性。
复杂网络具有空间和时间的演化复杂性,展示出丰富的复杂行为,特别是网络节点之间的不同类型的同步化运动,包括出现周期、非周期(混沌)和阵发行为等运动。
.1.3 复杂网络的基本静态几何量网络的静态几何量又称为拓扑参数,是研究复杂网络的基础。
对于一个给定的图或网络,称所有节点的集合为V,所有边的集合为E,于是这个图可表示为G(V,E),其中V={1,2,…,i,…,N},E={ij ij W ,δ},而⎩⎨⎧=⎩⎨⎧=之间是多连接,之间是单连接,,之间无连接,之间有连接j i m j i W j i ij ,,1j i,0,,1δ(1.2) 式(1.2)中i,」为网络中任意两个节点,m 为节点i 和节点j 之间的连接边数。
1度与度分布(Degree and Degree Distribution)一个节点的度k 通常定义为该节点连接的所有边的总和,写成数学表达式为:ij Gj ij i w k .∑∈=δ该网络的平均度数定义为:∑==N i i kN k 11网络的度分布可以揭示网络的类型及性质,是网络的重要几何性质。
网络的度分布P(k)定义为网络中度为k 的节点的数量占节点总数的比例。
现实世界中,大多数网络的节点度分布都远远偏离Poisson 分布,明显向右倾[9]斜,这表明其分布的右边尾部要长且值远大于平均数。
事实上,要测量此尾部非常难:理论上只需画出节点度的直方图即可,然而,要获得此尾部中较好的统计数据,合适的测量方法却很少。
因此,直接画出来的直方图一般会有很多噪音存在。
为了避免这个问题,一般采用累积分布函数:()()∑==k k k P k P ,,即节点度大于或等于k 的概率。
按照传统的方法,通过画直方来构建直方图时,落入同一直方内的数据点的值间所存在的差异均被丢失。
采用累积分布函数作图的优点是考虑了所有的原始数[10]据。
2路径长度(path Length)一个全连通网络中,任意两个节点j i , 之间存在着一定的路径,在这所有的路径中最短的路径称为节点i, j 之间的路径长度ij l 。
路径长度描述了任意两个节点之间最少要经过的边数,也就是说,如果节点a 和b 节点之间的路径长度为d,那么从a 节点出发去b 节点的过程中至少要经过d-1个节点。
在网络中各节点间路径长度的最大值称为网络的直径(Diameter):ij ji l D m ax ,=一个全连通网络的平均路径长度(average path length)定义为所有的节点i,j 之间的路径长度的平均值。
即:∑∑-=+=+=111)1(211N i Ni j ij l N N l 式中,N 为网络中的节点数。
网络的平均路径长度也称为网络的特征路径长度(characteristic path length)。
为了便于数学处理,在式中包含了节点到自身的距离(当然该距离为零)。
如果不考虑节点到自身的距离,那么要在式的右端乘以因子(N+ l)/(N-l)。
在实际应用中,这么小的差别是完全可以忽略不计的。
平均路径长度可以从整体上刻画网络节点间通信链路的长短。
一个含有N 个节点和M 条边的网络的平均路径长度可以用时间量级为O(MN)的广度优先搜索算法来确定。
3聚类系数(Clustering Coefficient)聚类系数用来描述网络中节点的聚集情况,即网络有多紧密,也即网络的集团化程度,对于网络中每一个节点i,找到其邻近的ij k 个节点,在i k 个节点中找出互相连接的节点对数i m 。
节点i 的聚类系数定义为:)12-=ii i i k k m C ( 从几何特点来看,上式的一个等价定义为:相连的三元组的数量与节点相连的三角形的数量与节点i i C i = 式中,与节点i 相连的三元组是指包括节点i 的三个节点,并且至少存在从节点i 到其他两节点的两条边。
图1给出了以节点i 为顶点之一的三元组的两种可能形式。
图1.以节点i 为顶点之一的三元组的两种可能形式我们可以得到所有节点的聚类系数,其平均值称为平均聚类系数或整个网络的聚类系数。
用公式表示为:∑==Ni i C N C 11 很明显, 10≤≤C 。
当且仅当所有的节点均为孤立节点时,C=O;当且仅当所有的节点全局祸合时,即网络中任意两个节点都直接相连时,C=l 。