第二章复杂网络的基础知识2.1 网络的概念所谓“网络”(networks),实际上就是节点(node)和连边(edge)的集合。
如果节点对(i,j)与(j,i)对应为同一条边,那么该网络为无向网络(undirected networks),否则为有向网络(directed networks)。
如果给每条边都赋予相应的权值,那么该网络就为加权网络(weighted networks),否则为无权网络(unweighted networks),如图2-1所示。
图2-1 网络类型示例(a) 无权无向网络(b) 加权网络(c) 无权有向网络如果节点按照确定的规则连边,所得到的网络就称为“规则网络”(regular networks),如图2-2所示。
如果节点按照完全随机的方式连边,所得到的网络就称为“随机网络”(random networks)。
如果节点按照某种(自)组织原则的方式连边,将演化成各种不同的网络,称为“复杂网络”(complex networks)。
图2-2 规则网络示例(a) 一维有限规则网络(b) 二维无限规则网络2.2 复杂网络的基本特征量描述复杂网络的基本特征量主要有:平均路径长度(average path length )、簇系数(clustering efficient )、度分布(degree distribution )、介数(betweenness )等,下面介绍它们的定义。
2.2.1 平均路径长度(average path length )定义网络中任何两个节点i 和j 之间的距离l ij 为从其中一个节点出发到达另一个节点所要经过的连边的最少数目。
定义网络的直径(diameter )为网络中任意两个节点之间距离的最大值。
即}{max ,ij ji l D = (2-1) 定义网络的平均路径长度L 为网络中所有节点对之间距离的平均值。
即∑∑-=+=-=111)1(2N i N i j ij lN N L (2-2)其中N 为网络节点数,不考虑节点自身的距离。
网络的平均路径长度L 又称为特征路径长度(characteristic path length )。
网络的平均路径长度L 和直径D 主要用来衡量网络的传输效率。
2.2.2 簇系数(clustering efficient )假设网络中的一个节点i 有k i 条边将它与其它节点相连,这k i 个节点称为节点i 的邻居节点,在这k i 个邻居节点之间最多可能有k i (k i -1)/2条边。
节点i 的k i 个邻居节点之间实际存在的边数N i 和最多可能有的边数k i (k i -1)/2之比就定义为节点i 的簇系数,记为C i 。
即)1(2-=i i i i k k N C (2-3) 整个网络的聚类系数定义为网络中所有节点i 的聚类系数C i 的平均值,记为C 。
即∑==Ni iC N C 11 (2-4) 显然,0 ≤ C ≤ 1之间。
当C =0时,说明网络中所有节点均为孤立节点,即没有任何连边。
当C =1时,说明网络中任意两个节点都直接相连,即网络是全局耦合网络。
2.2.3 度分布(degree distribution )网络中某个节点i 的度k i 定义为与该节点相连接的其它节点的数目,也就是该节点的邻居数。
通常情况下,网络中不同节点的度并不相同,所有节点i 的度k i 的的平均值称为网络的(节点)平均度,记为<k >。
即∑==〉〈N i i kN k 11 (2-5)网络中节点的分布情况一般用度分布函数P (k )来描述。
度分布函数P (k )表示在网络中任意选取一节点,该节点的度恰好为k 的概率。
即∑=-=Ni ik k N k P 1)(1)(δ (2-6) 通常,一个节点的度越大,意味着这个节点属于网络中的关键节点,在某种意义上也越“重要”。
2.2.4 介数(betweenness )节点i 的介数定义为网络中所有的最短路径中,经过节点i 的数量。
用B i 表示。
即n m i n m,g g B n m n m n i m i ≠≠=∑ ,, (2-7)式中g mn 为节点m 与节点n 之间的最短路径数,g min 为节点m 与节点n 之间经过节点i的最短路径数。
节点的介数反映了该节点在网络中的影响力。
描述网络结构的特征量还有很多,这里就不一一介绍,在使用到它们的地方再给出详细的说明。
2.3 复杂网络的基本模型人们在对不同领域内的大量实际网络进行广泛的实证研究后发现:真实网络系统往往表现出小世界特性、无标度特性和高聚集特性。
为了解释这些现象,人们构造了各种各样的网络模型,以便从理论上揭示网络行为与网络结构之间的关系,进而考虑改善网络的行为。
下面介绍几类基本的网络模型。
2.3.1 规则网络(regular network)常见的规则网络有三种:全局耦合网络(globally coupled network)、最近邻耦合网络(nearest-neighbor coupled network)和星型网络模型(star coupled network),如图2-3所示。
图2-3 三种典型的规则网络(a) 全局耦合网络(b) 最近邻耦合网络(c) 星型网络图2-3(a)所示为一个含有N个节点的全局耦合网络。
网络中共有N(N-1)/2条边,其平均路径长度L=1(最小),簇系数C=1(最大)。
度分布P(k)为以N-1为中心的δ函数。
模型的优点:能反映实际网络的小世界特性和大聚类特性。
模型的缺点:不能反映实际网络的稀疏特性。
因为一个具有N个节点的全局耦合网络的边的数目为O (N 2),而实际网络的边的数目一般是O (N )。
图2-3(b )所示为一个含有N 个节点的最近邻耦合网络。
网络中的每个节点只和它周围的邻居节点相连,其中每个节点都与它左右各K /2个邻居节点相连(K 为偶数)。
对于固定的K 值,网络的平均路径长度为:)(2∞→∞→≈N K N L (2-8) 对于较大的K 值,最近邻耦合网络的簇系数为:43)1(4)2(3≈--=K K C (2-9) 度分布P (k )为以K 为中心的δ函数。
模型的优点:能反映实际网络的大聚类特性和稀疏特性。
模型的缺点:不能反映实际网络的小世界特性。
图2-3(c )所示为一个具有N 个节点的星型网络。
网络有一个中心节点,其余N -1个节点都只与这个中心节点相连,且它们彼此之间不连接。
网络的平均路径长度:)(2)1()1(22∞→→---=N N N N L (2-10) 网络的簇系数为:)(11∞→→-=N NN C (2-11) 网络的度分布为:⎪⎪⎩⎪⎪⎨⎧-==-=其它 0)1()1(1)(11N K K K P N N (2-12) 规定:如果一个节点只有一个邻居,那么该节点的簇系数为1。
也有些文献规定只有一个邻居的节点的簇系数为0,若依此定义,则星型网络的簇系数为0。
模型的优点:能反映实际网络的小世界特性和稀疏特性。
模型的缺点:不能反映实际网络的大聚类特性。
2.3.2 ER 随机网络(random network )该模型由匈牙利数学家Ed ös 和Rényi 在上世纪50年代最先提出,所以被人们称为ER 随机网络模型。
ER 随机网络的构造有两种方法。
第一种方法:定义有标记的N 个节(网络中的节点总数),并且给出整个网络的边数n ,这些边的选取采用从所有可能的N (N -1)/2种情况中随机选取。
第二种方法:给定有标记的N 个节点,以一定的随机概率p 连接所有可能出现的N (N -1)/2种连接,假设最初有N 个孤立的节点,每对节点以随机概率p 进行连接。
如图2-4所示。
图2-4 ER 随机网络的演化示意图(a )p =0时,给定10个孤立节点;(b )~(c )p =0.1,0.15时,生成的随机图 ER 随机网络模型具有如下基本特性:(1)涌现或相变如果当N →∞时产生一个具有性质Q 的ER 随机图的概率为1,那么几乎每一个ER 随机图都具有性质Q 。
以连通性为例,若当连接概率p 达到某个临界值p c ∝(ln N )/N 时,整个网络连通起来,那么以概率p 生成的每一个网络几乎都是连通的,否则,当p 小于该临界值时,几乎每一个网络都是非连通的。
(2)度分布对于一个给定连接概率为p 的随机网络,若网络的节点数N 充分大,则网络的度分布接近泊松(Poission )分布,如图2-5所示。
〉〈----〉〈≈-=k k k N k k N e k k p p C k P !)1()(11 (2-13) 式中<k >=p (N -1)≈PN 表示ER 随机网络的平均度。
图2-5 ER 随机网络的度分布(取自文献[ ])(3)平均路径长度假定网络的平均路径长度为L ,从网络的一端走到网络的另一端,总步数大概为L 。
由于ER 随机网络的平均度为﹤k ﹥,对于任意一个节点,其一阶邻居的数目为﹤k ﹥,二阶邻居的数目为﹤k ﹥2,以此类推,当经过L 步后遍历了网络的所有节点,因此对于规模为N 的随机网络,有﹤k ﹥L =N 。
由此可以得到网络的平均路径长度为:〉〈==k N pN N L ln ln )ln(ln (2-14)由于ln N 的值随N 增长较慢,所以规模很大的ER 随机网络具有很小的平均路径长度,如图2-6所示。
图2-6 ER 随机网络的平均路径长度与网络规模的关系(取自文献[ ])(4)簇系数在ER 随机网络中,由于任何两个节点之间的连接概率p 都相等,所以ER 随机网络的聚类系数为:Nk p C 〉〈== (2-15) 可见,当网络规模N 固定时,簇系数随着网络节点平均度<k >的增加而增加,如图2-7所示。
当网络节点平均度<k >固定时,簇系数随着网络规模N 的增加而下降,如图2-8和所示。
显然,当N 较大时,ER 随机网络的簇系数很小。
图2-7 (N=104)ER随机网络的簇系数与连接概率的关系(取自文献[ ])图2-8 (p=0.0015)ER随机网络的簇系数与网络规模的关系(取自文献[ ])模型的优点:能反映实际网络的小世界特性。
模型的缺点:不能反映实际网络的大聚类特性。
2.3.3 小世界网络(small-world network)作为从完全规则网络向完全随机网络的过渡,美国学者Watts和Strogatz于1998年设计了一个具有小的平均路径长度和大的聚类系数的小世界网络模型(small-world network),简称WS小世界网络模型。
WS小世界网络模型的构造算法:(1)从规则网络开始:考虑一个含有N个节点的最近邻耦合网络,它们围成一个环,其中每一个节点都与它左右相邻的各K/2个节点相连,K是偶数。