当前位置:
文档之家› 基于谱方法的复杂网络中社团结构的模块度_张聪
基于谱方法的复杂网络中社团结构的模块度_张聪
式 中 二 为 网络的 总边 数
示无连边 。为节 点 · 的度 否则 占 ,少 , `, 。
为网络的连接矩 阵 , 二
。为节点
。 ` ,一 六 粼人 一 豁 价 汽 ,,
所在 的社团 当节点
代表节点 , , 与节点
之 间有连边 , 儿 ,。
则表
和节点 。 在 同一个社 团中时 占价 , 汽, 一
。一 弗一 周
络 中的社团结构并对 其进行分析是 了解复杂 系统特征和功能 的重要 途径 , 例如 大量的 网站社 团构成 了万维 网 , 其 中同一社 团 内部 的各个 网站往往 都有相 同的主题 在生物 网络 中 , 生物的模块 化结构是 由进化 约束造 成的 , 而这 种模块 化结构对 解释生物所 表现 出的特 征和功 能方面有着 至关重要 的作用 此外 , 社 团结构也被
所有 的 网络社 团结构 的划分都需要一 个评价准则 , 来判断划分得到 的社 团结构 的合理性和 有效性
和
一 艺
上式是 以无权 网为基础 的 , 式 中
一了 一
一 ,
阶的对 称矩 阵 , 其
是 指将网络划分为 亡 个社 团的一种 划分情 况 , 。是一个
元 素。 ,, 代 表 第` 个 社 团 与 第, 个 社 团 之 间 的 连 边 数 占 网 络 总 边 数 的 比 例, , 一 艺一 。 ,, , 矩 阵 的 迹“
社 团的定 义 为 了从定量 角度来分析社 团结构 , 需要一个精确 的定义 假设 网络
的连接矩 阵为
。 , , 节点 该 的
度为 从 , 则有 从 二又 仇, · 考虑网络 的一个子网络 度包含两个部分 , 即 , 州 一甘 ` 衅 ”` , 其中 心“ 点派 在子 网络 内部和外部 的连接数 在此基础 上 ,
社 团结构发现 的谱 方法 社 团结构发 现是复 杂网络领域 中 的一个 重要课题 学 中的原理和方 法发 展 出许 多社 团结构探 测算法 对象 , 矩 阵 `“ 和 基于 矩 阵可表示为
由物理 学 、 应 用“,” 一` , 其 中社 团结 构发现 的谱方法 主要 包括 了基 于
公一 , 。 , 矩阵的和范数
的最 大值一般在 一
一艺 ,,
了 卜模块度函数的物理含义是 网 络中 社团内 部的 边的比 例减去在同
值越 大 , 说 明网络的社团结构越 明显 实际应用 中 , 亦 可表 述为式 和式 , 三式是等价 的
样的社 团结构 下随机连接 节点的边的 比例 的期 望值
的范 围内 , 更 大的值很少 出现 式
划分 , 以 , 之间的边构成的集合 以 ,几 二 以 , 以 划分 内部的 边集
以 ,侧
边数 而 必
,划 分 之间 的
万 以,
一 七 边 集百
之间的权重为 叫以 ,
二
一
侧
划 分 的 组内 边 数二
,组间
的组内权
。 二 , 。 二 , 。 ` , 叫 , 类似地有划分
重为 叫 , 组间权重为 侧 , 所有边的总权重为 叫日 在以上图划分的基础上 , 表现模块度 定义为 划分 的组内边数和组间未连接的 “ 边 ” 数之和 未连接的 “ 边 ” 即 , 二 必 , 占全连接边数的 比例 表现模 块度大的划分更好
以上 的社 团 , 应对 子社 团多次重复 该算 法 基 于 矩阵 一` 有 艺 一 个非常接近
矩 阵的谱方法 假设社团数 目为 云 , 则 网络 的
,
的非平 凡特 征值 , 而其他 的特征值都 与
有明显差距 , 而在这 云 一
个特征值所 对应 的特 征向量也有一个 非常 明显 的特征结构 在这 应的元 素非常接近 以此为依据 , 可将 网络分 割为 亡 个社 团
的 组内 边数和组间 未连接的 “ 边” 数之和是表现模块度的决定因素, 当条件 。
艺一 ,艺 ,
,
任
12 3 4
系统 工程 理 论与 实践
第
卷
外 任 吐 印 或'
公一又,一 写补 , 斌 , 异价 成 立,即 组 间 未 连 接 边,'数 或 权 值 大厂 组 间
映射 的基础上 , 提 出了复杂 网络社 团结构 的 两种 模块度 改进 的表 现模块度 不仅 能够 应用于有权 网 络 , 而且 部分 解决 了 模块度 的局 限性 问题 内聚模块度 以社 团内部 的内聚度为衡量依据 , 从 根 本上避免 了 模块度和表 现模块度可 能出现 的不恰 当划分 情况 最后通过计 算机 生成 的测试 网 络和两个经典 网络 , 与 模块度对 比验证 了表 现模块度和 内聚模块 度 的可行性和有效性
为该 网络 的强社 团结构
弱社
团结构 如果子网络 满足 艺 , 。、 决乏 “ 。 黔 `州 , 城 , 即社团内部节点间的相互连接 比这些节 点与社 团外部节 点的连接更加紧密 , 也就是说 , 社 团 内部的连接数大 于社 团边 界上的连接数 , 则 称 为该网
络的弱社 团结构 显然 , 如果一个社 团为强社 团 , 则它必然也是弱社 团 , 反之则不一定
一 , 男 , 教授 , 博士生
系统 工 程理论 与 实践
第 洲卷
开 展研究 , 文 章的结构 为
引言简要介 绍复杂网络与其社 团结构
相关文 献综述总结基干
谱方法的社团结构发现和模块度研究 本文主体给出在谱方法基础上定义的模块度及相应的算法 对 测试 网络和 经典 网络进行社 团结构划分 , 对 比研究三种模块度对社 团结构 划分 的衡量 最后 给出了结论
、 一 艺艺 二 ,二偌 任 以,二 任
二 。 夕
、 ,
妻 二一 、
乙
娜
二
。
二
艺。 ,。 二 切· 占二 , 。 凡二· 了。 ,二
一
其中 抓
是组间未连接的 “ 边 ” 数 从表现模块度的定义中可看出其本质与组内连接紧密 、 组间连接松散
的社团模块化定义是一致的 式
可表述为式
便于计算的形式 , 其中 万 二是
亡 亡
一 艺 艺
览晶
二
一,
己
。 ` 一 艺艺
夕 `
艺
, 、” 宾 了腐 '
。 叨 ,
告 。 ,、。 、 叨
艺。 ,切 。 。 。
夕
二
。
又二 ,切 二 叨· 占。 , 叨 凡叨· 万。 , 。
式 中的 禹二 是特 征向量 中代表 节点 的各分 量之 间的欧 氏距离 , 这些距离就 作为边权在 表现模块 度函数 中使 用 , 是构 造 出来 的未连接 “ 边 ” 的权值之和 , 显然 了 通过谱 方法的转换 , 简单 巧妙地 解决 了组 间未连接 的 “ 边 ” 权估 值的 间题 , 使表现模块度可 以按 照组 内边权和组 间未连接 的 “ 边 ” 权之和 占全连接边权的 比例 , 有 效地衡量有 权网络上划分的优劣 表现模 块度和本文基于谱 映射的表现模块 度在一定范 围内可以克服上 述 模块度的局限性 划分
关键 词 复杂 网络 社 团结构 模块度 谱方 法
,
一
,
,
,
一
一
一
'
即 ,
,
' ' , 一 '
一
,
近
引言
自然界 、生物界 、人类社会和工程领域 中的许多复杂系统都可 以被表述 成 由节点或顶 点集通 过线或边 的
连接而构 成的复杂 网络 , 例如现 实世界 中的互联 网 、万维 网 、新陈代谢 网 、食物链 网 、神经 网络 、通信 与分 布
第 期
张聪 , 等 基于谱方法的复杂网络中社团结构的模块度
式中 众多 以
为社 团 坛 的总边数 , 、为社 团 乞 所有节点度的 总和 自提 出以来得到 了广泛 的认 可 , 不但完善 了一 些旧有的探索社 团结构 的算法 , 而且发 展了 然而 , 。和 自 图对 函数的有效性提 出了质疑 他 函数为 目标 函数 的新算法
的逻辑非 , 歌 。,侃
是 截 。 , 动 的逻辑 非 但 由于此定义 中用 到的是边 的数 目 , 所以此表现 模块度 的定义只能 用于无权 网情 况 ,
而对于有权网 , 本文认为在谱的基础上构建新的表现模块度是行之有效的方法二 先计算网络的 矩阵 或 矩阵 , 再求 得相 应矩 阵的特征值与特 征 向量 , 然后用特征 向量中各节点对应 的分 量计算节 点之间 的距离 , 以这些距离作为聚类的依据 , 同时它们也是构造新表现模块度的基础 改进的表现模块度定义如下
基于谱方法的社团结构模块度
图聚类基础上的模块度 数学和计 算机科学领域的 图聚类
认 ,、 顶点个数 ` 一 七 是本文 模块度研究的基础 假设无 向有权 图 顶 点集 的一个划 分
州 , 边 的个数 二
川 , 边权 、
,姚 , … , 当 一 或 一 时 , 称为平凡的 。, 二 任 任以 , 二任几 , 队 内部的边集 以
广泛 地发现 在社会 网 、 互联 网 、 食 物链 网和性 接触 网络中 本文主要 针对复 杂 网络 中社 团结构的模块 度
收稿 期 一 一 资助项 目 国家 自然科学基金 作者简介 张聪 一 , 男 , 讲师 , 博士研究生 , 研究方向 复杂系统与复杂网络 , 数据挖掘 沈惠璋 导师 , 研究方向 数据挖掘与网络安全
矩 阵 ` 的方法 基于 矩 阵的谱方法 以网络的 矩 阵为研究 一 , 其 中 是对 角矩 阵 其对 角线上的各元素为对应 节点的度 , 是 网
络的连接矩 阵 求
的特征值 与特 征 向量 , 其 中第二小特征值 入 所对应 的特 征 向量是分割 网络的依据 , 该特
征 向量 中正 元素所对 应的节点是一个社 团 , 负元 素所对应的节点是 另一个社 团 如果要 将一个 网络分成 两 个