当前位置：文档之家› 03-社会网络分析与算法研究

03-社会网络分析与算法研究

19
3.2.3 随机网络的直径和平均距离
n
随机网络的平均最短距离可以进行如下估计：考虑随机网络的平均度＜k＞，对于任意一个节点，其一阶邻接点的数目为＜k＞，二阶邻接点的数目为＜k＞2。也就是说，在ER随机图中随机选择一个节点vi，网络中大约有＜k＞Lrand个节点与节点vi的距离为Lrand。依此类推，当l步后达到网络的总节点数目N，有N＝＜k＞l，故
25
3.3.1 小世界网络模型
2.NW小世界模型 NW小世界模型是通过用“随机化加边”取代WS小世界模型构造中的“随机化重连”而得到的，具体构造算法如下： ①从规则图开始：考虑一个含有N个点的最近邻耦合网络，它们围成一个环，其中每个节点与它左右相邻的各K／ 2个节点相连，K是偶数。参数满足N>>K>>ln（N）>>1。 ②随机化加边：以概率p在随机选取的一对节点之间加上一条边。其中，任意两个不同的节点之间至多只能有一条边，并且每一个节点都不能有边与自身相连。
n 各节点的度均为N－1，因此度分布为单尖峰，可以表示为Delt a函数P（k）＝δ（k－N＋1）。 n 每个节点vi的聚类系数均为Ci＝1，故整个网络的聚类系数为 C＝1。 n 从任意一个节点到另外一个节点最短路径长度都为1，故整个网络的平均距离为L＝1。 n 在具有相同节点数的所有网络中，全局耦合网络具有最小的平均距离和最大的集聚系数。该模型作为实际网络模型的局限性很明显：全局耦合网络是最稠密的网络，然而大多数大型实际网络都是很稀疏的，它们边的数目一般至多是O（N）而不是O（ N2）。 4
17
3.2.2 随机网络的度分布
对于大范围内的p值，最大和最小的度值都是确定性的和有限的。例如，若p（N）∝N-1-1/k，几乎没有图有度大于k的节点。另外一个极值情况是，若 p＝［ln（N）＋kln（ln（N））＋c]／N，几乎每个随机图都至少有最小的度k。下图给出N＝1000， p＝0.0015时随机网络的度分布，其中图中的点代表X k／N（度分布），而连续曲线代表期望值E（Xk）／ N＝p（ki＝k），可以发现两者偏离确实很少。
n
3.3 小世界网络
¢ 3.3.1 ¢ 3.3.2 ¢ 3.3.3 ¢ 3.3.4
小世界网络模型小世界网络的度分布小世界网络的平均距离小世界网络的集聚系数
22
3.3.1 小世界网络模型
1.WS小世界模型 WS小世界模型的构造算法如下： ①从规则图开始：考虑一个含有N个节点的最近邻耦合网络，它们围成一个环，其中每个节点与它左右相邻的各 K／2个节点相连，K是偶数。参数满足N>>K>>ln（N ）>>1。 ②随机化重连：以概率p随机地重新连接网络中的每条边，即将边的一个端点保持不变，而另一个端点取为网络中随机选择的一个节点。其中规定，任意两个不同的节点之间至多只能有一条边，且每个节点都不能有边与自身相连。这样就会产生pNK／2条长程的边把一个节点和远处的节 23 点联系起来。
15
3.2.2 随机网络的度分布
在连接概率为p的ER随机图中，可知其平均度为而某节点vi的度ki等于k的概率遵循参数为N－1 和p的二项式分布值得注意的是，若vi和vj是不同的节点，则P（ki ＝k）和P（kj＝k）是两个独立的变量。为了找到随机图的度分布，需得到度为k的节点数Xk。为此，需要得到Xk等于某个值的概率P（Xk＝r）。连接度为k 的平均节点数为
24
3.3.1 小世界网络模型
最近邻耦合网络（对应p＝0）是高度集聚的（C（0）≈3 ／4），但平均距离很大（L（0）≈N／2K>>1）。当p较小时（0＜p<<1），重新连线后得到的网络与原始的规则网络的局部属性差别不大，从而网络的集聚系数变化也不大（C（p）∝C（0），但其平均距离下降很快（L（p ）<<L（0））。这个结果是不难想象的：一方面，只要几条边的随机重连就足以减小网络的平均距离；另一方面，几条随机重连的边并不足以改变网络的局部集聚特性。这类既具有较短的平均距离又具有较高的集聚系数的网络就是典型的小世界网络。
社会网络分析与算法研究
第三章规则网络与随机网络模型
n 社会网络的研究大致可以描述为以下密切相关但又依次深入的方面： ① 大量的真实网络的实证研究，分析真实网络的统计特性； ② 构建符合真实网络统计性质的网络演化模型，研究网络的形成机
3.3.1 小世界网络模型
在上述模型中，p＝0对应于完全规则网络，p＝1则对应于完全随机网络，通过调节p值就可以控制从完全规则网络到完全随机网络的过渡，如下图所示。
由上述算法得到网络模型的集聚系数C（p）和平均距离L（p）都可看作是重连概率p的函数，如下图所示。图中对集聚系数和平均距离作了归一化处理。
3.1 规则网络
n 最近邻耦合网络：对于拥有N节点的网络来讲，通常将每个节点只与它最近的K个邻居节点连接的网络称为最近邻耦合网络，这里K是小于等于N－1的整数。 n 若每个节点只与最近的2个邻居节点相连，这样所有节点相连就构成
了一维链或环，如下图（a）所示。如下图（b）所示的二维晶格也是一种最近邻耦合网络。一般情况下，一个具有周期边界条件的最近邻耦合网络包含N个围成一个环的节点，其中每个节点都与它左右各K／ 2个邻居节点相连，这里K是偶数，如下图（c）所示。
13
3.2.1 随机网络模型
②二项式模型： n 给定N个节点，每一对节点以概率p进行连接。这样，所有连线的数目是一个随机变量，其平均值为 M＝p N（N－1）／2。 n 若G0是一个节点为v1，v2，…，vN和M条边组成的图，则得到该图的概率为 P（G0）＝p M（1－p）N(N-1)/2-M 其中p M是M条边同时存在的概率，（1－p）N(N-1)/2-M 是其他边都不存在的概率，二者是独立事件，故二概率相乘即得图G0存在的概率。
26
3.3.1 小世界网络模型
在NW小世界模型中，p=0对应于原来的最近邻耦合网络，p=1则对应于全局耦合网络，如下图所示。在理论分析上，NW小世界模型要比WS小世界模型简单一些。当p足够小和N足够大时，NW小世界模型本质上等同于WS小世界模型。
27
3.3.1 小世界网络模型
5
n 每个节点vi的度均为K，因此度分布为单尖峰，可以表示示为Delta函数 P（k）＝δ（k－K）。 n 最近邻耦合⺴网网络的平均集聚系数就是每个节点的集聚系数： C＝Ci＝3（K－2）／［4（K－1）］。对较大大 K值，容易得到C≈0.75 。可⻅见，最近邻耦合⺴网网络集聚程度还是很高高的。 n 最近邻耦合⺴网网络不是小小世界⺴网网络，因为对固定K值，该⺴网网络直径D和平均距离L分别为D=N／K，L≈N／（2 K）；当N →∞，L→∞。
返回目录
11
3.2 随机网络
¢ 3.2.1 ¢ 3.2.2 ¢ 3.2.3 ¢ 3.2.4
随机网络模型随机网络的度分布随机网络的直径和平均距离随机网络的集聚系数
12
3.2.1 随机网络模型
随机网络构成有两种等价方法： ① ER模型：
n
给定N个节点，最多可以存在N（N－1）／2条边，从这些边中随机选择M条边就可以得到一个随机网络，显然一共可产生种可能的概率相同。种可能的随机图，且每
10
n 中心心节点的度为N－-1，而而其它节点的度均为1，所以星型耦合⺴网网络的度分布可以描述为如下函数 n 星形⺴网网络的平均距离为L＝2－2／N 。当N→∞，L→2。 n 假设定义一一个节点只有一一个邻居节点时，其聚类系数为1，则中心心节点的聚类系数为0，而而其余N-1个节点的聚类系数均为1，所以整个⺴网网络的平均聚类系数为C＝（ N－1）／N 。当N →∞，C→1。 n 由此可见，星型耦合网络是比较特殊的一类网络，它具有稀疏性、集聚性和小世界特性。
6
【例3.1】用用Matlab程序绘制最近邻耦合⺴网网络，并给出具体程序代码。解：（1）最近邻耦合⺴网网络绘制的Matlab程序如下：
7
8
最近邻耦合网络
（2Байду номын сангаас当N＝20，K＝6时，该程序的仿真结果如下图所示示。
9
n 星形耦合网络：它有一个中心点，其余的N-1个点都只与这
个中心点连接，而彼此之间不连接，如下图所示。
制和内在机理；
③ 研究网络上的动力学行为，如网络上的信息传播机制等。 ④ 研究预测网络性质的模型：采用机器学习算法研究网络节点的
分类与聚类，预测网络链接及拓扑结构的发展趋势等。
n 本章针对第二个方面，研究网络演化的机制与模型。
16
即
。
3.2.2 随机网络的度分布
Xk值的概率接近如下泊松分布这样一来，度为k的节点数目Xk满足均值为λk的泊松分布。上式意味着Xk的实际值和近似结果Xk＝N·P（ki＝k）并没有很大偏离，只是要求节点相互独立。这样，随机图的度分布可近似为二项式分布在N比较大的条件下，它可以被泊松分布取代由于随机网络中节点之间的连接是等概率的，因此大多数节点的度都在均值＜k＞附近，网络中没有度特别大的节点。
18
3.2.3 随机网络的直径和平均距离
对于大多数的p值，几乎所有的图都有同样的直径。这就意味着连接概率为p的N阶随机图的直径的变化幅度非常小，通常集中在一些重要的性质：若＜k＞小于1，则图由孤立树组成，且其直径等于树的直径。若＜k＞大于1，则图中会出现连通子图。当＜k＞大于等于3.5时，图的直径等于最大连通子图的直径且正比于ln（N）。若＜k＞大于等于ln（N），则几乎所有图是完全连通的，其直径集中在ln（N）／ln（pN）左右。

e商务文档

03-社会网络分析与算法研究

相关文档推荐：