当前位置:文档之家› 03-社会网络分析与算法研究

03-社会网络分析与算法研究

19
3.2.3 随机网络的直径和平均距离
n
随机网络的平均最短距离可以进行如下估计:考虑随机 网络的平均度<k>,对于任意一个节点,其一阶邻接 点的数目为<k>,二阶邻接点的数目为<k>2。也就 是说,在ER随机图中随机选择一个节点vi,网络中大约 有<k>Lrand个节点与节点vi的距离为Lrand。依此类推 ,当l步后达到网络的总节点数目N,有N=<k>l,故
25
3.3.1 小世界网络模型
2.NW小世界模型 NW小世界模型是通过用“随机化加边”取代WS小 世界模型构造中的“随机化重连”而得到的,具体构造 算法如下: ①从规则图开始:考虑一个含有N个点的最近邻耦合网络 ,它们围成一个环,其中每个节点与它左右相邻的各K/ 2个节点相连,K是偶数。参数满足N>>K>>ln(N)>>1。 ②随机化加边:以概率p在随机选取的一对节点之间加上 一条边。其中,任意两个不同的节点之间至多只能有一 条边,并且每一个节点都不能有边与自身相连。
n 各节点的度均为N-1,因此度分布为单尖峰,可以表示为Delt a函数P(k)=δ(k-N+1)。 n 每个节点vi的聚类系数均为Ci=1,故整个网络的聚类系数为 C=1。 n 从任意一个节点到另外一个节点最短路径长度都为1,故整个 网络的平均距离为L=1。 n 在具有相同节点数的所有网络中,全局耦合网络具有最小的 平均距离和最大的集聚系数。该模型作为实际网络模型的局限性 很明显:全局耦合网络是最稠密的网络,然而大多数大型实际网 络都是很稀疏的,它们边的数目一般至多是O(N)而不是O( N2) 。 4
17
3.2.2 随机网络的度分布
对于大范围内的p值,最大和最小的度值都是确 定性的和有限的。例如,若p(N)∝N-1-1/k,几乎 没有图有度大于k的节点。另外一个极值情况是,若 p=[ln(N)+kln(ln(N))+c]/N,几乎每 个随机图都至少有最小的度k。下图给出N=1000, p=0.0015时随机网络的度分布,其中图中的点代表X k/N(度分布),而连续曲线代表期望值E(Xk)/ N=p(ki=k),可以发现两者偏离确实很少。
n
3.3 小世界网络
¢ 3.3.1 ¢ 3.3.2 ¢ 3.3.3 ¢ 3.3.4
小世界网络模型 小世界网络的度分布 小世界网络的平均距离 小世界网络的集聚系数
22
3.3.1 小世界网络模型
1.WS小世界模型 WS小世界模型的构造算法如下: ①从规则图开始:考虑一个含有N个节点的最近邻耦合 网络,它们围成一个环,其中每个节点与它左右相邻的各 K/2个节点相连,K是偶数。参数满足N>>K>>ln(N )>>1。 ②随机化重连:以概率p随机地重新连接网络中的每条边, 即将边的一个端点保持不变,而另一个端点取为网络中随 机选择的一个节点。其中规定,任意两个不同的节点之间 至多只能有一条边,且每个节点都不能有边与自身相连。 这样就会产生pNK/2条长程的边把一个节点和远处的节 23 点联系起来。
15
3.2.2 随机网络的度分布
在连接概率为p的ER随机图中,可知其平均度为 而某节点vi的度ki等于k的概率遵循参数为N-1 和p的二项式分布 值得注意的是,若vi和vj是不同的节点,则P(ki =k)和P(kj=k)是两个独立的变量。为了找到随 机图的度分布,需得到度为k的节点数Xk。为此,需 要得到Xk等于某个值的概率P(Xk=r)。连接度为k 的平均节点数为
24
3.3.1 小世界网络模型
最近邻耦合网络(对应p=0)是高度集聚的(C(0)≈3 /4),但平均距离很大(L(0)≈N/2K>>1)。当p较 小时(0<p<<1),重新连线后得到的网络与原始的规则 网络的局部属性差别不大,从而网络的集聚系数变化也不 大(C(p)∝C(0),但其平均距离下降很快(L(p )<<L(0))。 这个结果是不难想象的:一方面,只要几条边的随机 重连就足以减小网络的平均距离;另一方面,几条随机重 连的边并不足以改变网络的局部集聚特性。 这类既具有较短的平均距离又具有较高的集聚系数的 网络就是典型的小世界网络。
社会网络分析与算法研究
第三章 规则网络与随机网络模型
n 社会网络的研究大致可以描述为以下密切相关但又依次深入的 方面: ① 大量的真实网络的实证研究,分析真实网络的统计特性; ② 构建符合真实网络统计性质的网络演化模型,研究网络的形成机
3.3.1 小世界网络模型
在上述模型中,p=0对应于完全规则网络,p=1则对 应于完全随机网络,通过调节p值就可以控制从完全规则 网络到完全随机网络的过渡,如下图所示。
由上述算法得到网络模型的集聚系数C(p)和平均距 离L(p)都可看作是重连概率p的函数,如下图所示。图 中对集聚系数和平均距离作了归一化处理。
3.1 规则网络
n 最近邻耦合网络:对于拥有N节点的网络来讲,通常将每个节 点只与它最近的K个邻居节点连接的网络称为最近邻耦合网络, 这里K是小于等于N-1的整数。 n 若每个节点只与最近的2个邻居节点相连,这样所有节点相连就构成
了一维链或环,如下图(a)所示。如下图(b)所示的二维晶格也是 一种最近邻耦合网络。一般情况下,一个具有周期边界条件的最近邻 耦合网络包含N个围成一个环的节点,其中每个节点都与它左右各K/ 2个邻居节点相连,这里K是偶数,如下图(c)所示。
13
3.2.1 随机网络模型
②二项式模型: n 给定N个节点,每一对节点以概率p进行连接。这样, 所有连线的数目是一个随机变量,其平均值为 M=p N(N-1)/2。 n 若G0是一个节点为v1,v2,…,vN和M条边组成的图 ,则得到该图的概率为 P(G0)=p M(1-p)N(N-1)/2-M 其中p M是M条边同时存在的概率,(1-p)N(N-1)/2-M 是 其他边都不存在的概率,二者是独立事件,故二概率相 乘即得图G0存在的概率。
26
3.3.1 小世界网络模型
在NW小世界模型中,p=0对应于原来的最近邻 耦合网络,p=1则对应于全局耦合网络,如下图所示 。在理论分析上,NW小世界模型要比WS小世界模 型简单一些。当p足够小和N足够大时,NW小世界 模型本质上等同于WS小世界模型。
27
3.3.1 小世界网络模型
5
n 每个节点vi的度均为K, 因此度分布为单尖峰,可以 表示示为Delta函数 P(k)=δ(k-K) 。 n 最近邻耦合⺴网网络的平均集聚系数就是每个节点的集聚 系数: C=Ci=3(K-2)/[4(K-1)] 。对较大大 K值,容易得到C≈0.75 。可⻅见,最近邻耦合⺴网网络集聚 程度还是很高高的。 n 最近邻耦合⺴网网络不是小小世界⺴网网络,因为对固定K值, 该⺴网网络直径D和平均距离L分别为D=N/K,L≈N/(2 K);当N →∞,L→∞。
返回 目录
11
3.2 随机网络
¢ 3.2.1 ¢ 3.2.2 ¢ 3.2.3 ¢ 3.2.4
随机网络模型 随机网络的度分布 随机网络的直径和平均距离 随机网络的集聚系数
12
3.2.1 随机网络模型
随机网络构成有两种等价方法: ① ER模型:
n
给定N个节点,最多可以存在N(N-1)/2条边,从 这些边中随机选择M条边就可以得到一个随机网络, 显然一共可产生 种可能的概率相同。 种可能的随机图,且每
10
n 中心心节点的度为N--1,而而其它节点的度均为1,所以 星型耦合⺴网网络的度分布可以描述为如下函数 n 星形⺴网网络的平均距离为L=2-2/N 。当N→∞,L→2。 n 假设定义一一个节点只有一一个邻居节点时,其聚类系数 为1,则中心心节点的聚类系数为0,而而其余N-1个节点的 聚类系数均为1,所以整个⺴网网络的平均聚类系数为C=( N-1)/N 。当N →∞,C→1。 n 由此可见,星型耦合网络是比较特殊的一类网络,它具 有稀疏性、集聚性和小世界特性。
6
【例3.1】用用Matlab程序绘制最近邻耦合⺴网网络,并给出具体程序 代码。 解:(1)最近邻耦合⺴网网络绘制的Matlab程序如下:
7
8
最近邻耦合网络
(2Байду номын сангаас当N=20,K=6时,该程序的仿真结果如下图所示示。
9
n 星形耦合网络:它有一个中心点,其余的N-1个点都只与这
个中心点连接,而彼此之间不连接,如下图所示。
制和内在机理;
③ 研究网络上的动力学行为,如网络上的信息传播机制等。 ④ 研究预测网络性质的模型:采用机器学习算法研究网络节点的
分类与聚类,预测网络链接及拓扑结构的发展趋势等。
n 本章针对第二个方面,研究网络演化的机制与模型。
16


3.2.2 随机网络的度分布
Xk值的概率接近如下泊松分布 这样一来,度为k的节点数目Xk满足均值为λk的泊松分布 。上式意味着Xk的实际值和近似结果Xk=N·P(ki=k) 并没有很大偏离,只是要求节点相互独立。这样,随机图 的度分布可近似为二项式分布 在N比较大的条件下,它可以被泊松分布取代 由于随机网络中节点之间的连接是等概率的,因此大 多数节点的度都在均值<k>附近,网络中没有度特别大 的节点。
18
3.2.3 随机网络的直径和平均距离
对于大多数的p值,几乎所有的图都有同样的直径。 这就意味着连接概率为p的N阶随机图的直径的变化幅度 非常小,通常集中在 一些重要的性质:若<k>小于1,则图由孤立树 组成,且其直径等于树的直径。若<k>大于1,则图中 会出现连通子图。当<k>大于等于3.5时,图的直径等 于最大连通子图的直径且正比于ln(N)。若<k>大于 等于ln(N),则几乎所有图是完全连通的,其直径集中 在ln(N)/ln(pN)左右。
相关主题