当前位置:文档之家› 基于聚类的复杂网络社团发现算法

基于聚类的复杂网络社团发现算法


[ s at hsp prs de h lo tm o eet gcmmu i t cueo o lxn t r ae nc s r g aay e es lry Ab t c]T i a e t isteag rh frdtci o r u i n nt s u tr f mpe ewokb sdo l t i , n lzst i a t y r c u en h mi i
法 ,将复杂 网络 中的结点转换为欧式空间中的向量。把结点
表示成 向量 的形式后 ,就可以使用传统的数据之 间的相似性 度量方法衡量结点之间的相 似程度 。
2 社 团结构 的定义
近年来 ,虽然很 多研究者对社 团结构及其发现算法进行
了研究 ,但是仍然没有对社 团结构 的统一定义方法。文献【] 4 给 出了社 团结构 的定义 。 假设 网络 G的邻 接矩 阵 W, w W是
的向量表示 形式
初 始化 Xo (,…1 ) 结点具有一 个单位 的信 息, 0 = o …0 ,S
其他结 点没 有信 息
Se l计算 图的邻接矩阵 w; tp
Se 2计算度对角矩阵 D; tp
Se 3计算 =D一 ; tp W
Se 4 tp
的信息 ;
: , t 救 =1 结点 每次 向外传递一个单位 ,
c n e st e n d s i t h a a s u t r u t b e f rc use i g a g rt m s I o p r s t e di e e t l s e i g ag rt m sa d smi rt a u e o v r h o e n o t e d t t c u e s ia l o l t rn o i t r l h . tc m a e h f r n u t rn l o h n i l iy me s r c i a
me s r to ew e et e . t rp s s a pn e e t e tr V ag r m, hc o v r l v r c si n t r t e tr. t a ue me db t e nv ri s I po o e p ig V r xi oV co ( V) loi h c M t n M h t w ihc n et al e t e ewok i o v co s I s i n n

中的元素 ,结点 i 的度 k= 。考虑 网络 G的一个子网络 ∑

GcG ,且该子 网络 G包含有结点 i ’ 。 。可以认为 ,结点 i 的 度包含 有 2 个分量 ,即:
k( = ( + iG) G) ( G)
其中 , G) 表示结点 足( ’ =∑ 连接子网络 G 中其他结点 的 ’
中 分 号 T3 图 类 : P1 1
基于 聚类的复杂 网络社 团发现 算法
王观玉
( 黔南 民族师范学院计算机科学系 ,贵州 都匀 5 80 ) 5 00

要: 对基于 聚类技术 的复杂 网络社 团发现算法进行研 究,分析 网络中结点问的相 似性 度量方法 , 出把复杂 网络中的结点转化为向量 提
图 2所 示 。
0- 45
表示 结点 S 网络的影响 , 对 它就可 以作为结点 S 映射 到 Ⅳ维空 间中的向量 。 把网络中的每 个结点分 别作 为源结点 ,
按照 以上的步骤 向网络中的其他结点传递信息 ,可以得到每 个结 点在高维 空间中的 向量表示 。也就是说可 以得 到 Ⅳ 个 Ⅳ 维向量 。 Ⅳ个 向量就是 网络 中的 Ⅳ个结点映射 到 Ⅳ维空 这
为复杂网络中的聚类 ,因此,可 以探索使用数据挖掘的方法 和理论发现 复杂 网络 中的社团结构。 但是复杂 网络的数据结构与通常 的聚类技术所处理的数
可 以揭示某个具体的结点在复杂 网络中起的作用。本文提 出

种 顶点到 向量 映射( p ig V r x it etr Mapn et no V co,MVV 算 e )
第3 卷 7
第 1 期 0
王观玉 :基于聚类 的复杂 网络社 团发现算法 而又不会 导致信 息的溢 出。
5 9
对于整个 网络 的影响可 以用一个 Ⅳ维向量来表示 ,向量中的
元素代表相应结点受结点 S的影响所具有 的信息 。通过这个 传递信息的过程 ,结点 S 映射为 Ⅳ维空 间中的一个向量。 就 这个传递过程可以按照 以下的步骤进行 : 假设把结点 S映射为 向量空 间中的向量 ,首先设置 S 为
据的数据结构有很大的不同,并且数据之 间相似性的度量方 法在很大程度上影响着聚类的效果 。如果能把 网络转换成适
合聚类算法的数据结构并选择合适 的相似性度量方法 ,就可 以把大量 的已成熟的聚类技术应用在社 团的发现 上。因此 , 在使 用数据挖掘中的聚类技术 发现 网络 中的社 团之前 ,应该 把 网络转化成适合聚类算法的数据结构 ,选择合适 的结点之
1 概述
社 团是 网络 中结点组成 的分组…,组 内的边较多 ,而组 间的边 较少。复杂 网络 中的社 团结构具有重要意义 ,因为社 团结构通常对应于 网络中的某一功能单元 ,例如 ,万维 网中 具有相 同主题 的站点组成 的社 团1 ;生物 网络中具有相 同功 2 1
能 的细胞单元组成 的社 团 j 。发现复杂 网络 中社 团的过程可 以看作是对复杂 网络进行较粗 粒化 的过程。发现社 团结构也
法,它可以帮助 用户发现隐藏在大量数据中的规律和模式 , 它融合 了人工智 能、统计、机器学 习、模 式识别 和数据库 等 多种学科 的理论 、方法和技术 ,已经在多种 不同的领 域获得 了广泛应用。在复杂 网络领域 中,社团结构是许多网络所 共 有的特性 ,也可 以作 为隐藏在 网络 中的一种模式 ,它又被称
W A N G uan- u G y
( p r n f o ue c n e Qin a r l olg r t n l is D y n5 8 0 , ia De a me t mp tr i c , a n nNo ma C l e o i a t , u u 5 0 0 Chn ) t oC Se e f Na o i e
j G e
邻结点传递信 息,并且也会接收来 自于其相邻结点的信息。 源结点的信息在经过了 次传递 后,它就 向整个网络发送 了 丁个单位 的信息 ,整个 网 中的结点都会受到源结点的影响 络 而拥有信息。这样对于一个具有 Ⅳ 个结点的网络 ,源结点 S
作者简 介 :王观玉(94 ,女 ,副教授 ,主研方 向:数据 挖掘 , 16 一)
m eh d, er s l h w a VV l o t m a mp o et e a l y o e e t g c mp e ewo k o mu i . t o t e u t s o t t h s h M a g r h c n i r v bi t fd tc i o l x n t r sc m i h i n nt y
图 1 结点正确捌分比例
可 以看到 ,在 T 3 4时划分效果较好 ,而这个网络的直 =,
Se 5如果传递 次数 t tp 小于 ,返回 Se4 tp ,否则输 出结
果 。
径为 3 ,即把传递次数设置在 网络的直径附近是可行的。而 把传递次数设置过少或过高 都不能取得很好 的效果 。 为了进一步测试 取值在 网络直径附近的合理性 ,在 设 置 不 同 值 时使 用 层 次 聚 类 算 法 分 析 计 算机 生 成 网络 ( 0= ,直径为 3 ,记录模块度的最大值 ( 块度越大 ,所能 C 2 ) 模 达到的分割效 果越好) 模块度最 大值 随传递次数 的变化如 。
复杂 网络
边 的条数 ; o( ) G’ =∑w. 0 表示 结点连接 子 网络 G 外其他结 ’
俺 G
点 的边 的条数 。
3 复杂网络结点的相似性度量
数 据挖掘 是 用于大规 模数据 处理 的技术 手段和 思维 方
收稿 日 :2 1一 2 期 01 叭- 0
Ema :w ng aygi o@13 o - i agunuu hu 6. r l z cn
的顶点到向量映射( V) MV 算法 ,把 网络 中的结点转化成适合聚类算法 的数据结构形式 。对不 同聚类算法及相似性度量方法的性能进行比较
分析 ,结果表 明,MV V算法 可以提 高发现 复杂 网络中社 团的能力 。 关健词 :复杂 网络 ;社 团结构 ;聚g Co m u iy g r t m f rDe e t m n nt 0 m p e t r s d 0 u t rn fCo lx Ne wo k Ba e n Cl se i g
源 结点 , 假设每次它都会 向外发送一个单位 的信息。开始时 ,
结点对网络没有影响 , 表示为 xo 0o …0 , 就是 结点 =(,…1 ) 也
分别设置传递次数 2 34 8时,得到上面提到 的计算 ,,, 机 生成 网络中结点的向量表示 形式,然 后使 用层次聚类算法 并且使 用欧式距离作 为相 似度对这 个网络进行社 团划分 。当 连接结点 的边 中处于社 团之 间的边的平均数量 c 变化时 , 0 这 个网络 的直径总是在 3附近 。分别记 录当 c 变化 时,7 。 1 取 不同的值 时结点正确划分 比例 ,结果如图 1 所示 。
间的相似性度量方法。 在本文提 出的 MV 算法 中,将复杂 网络中的结点看作 V 是信息源 ,可 以发送和接收信息 。确定源结点 S ,每次 向外 发送一个单位的信息 , 其他结 点没有任何信息。第 1 次传递 , 源结点 向其相邻结点传递信息 ,这样它的相邻结点就获得 了 部分信息 。第 2次传递 ,所有具有信息的结点都会 向其相
[ ywo d ]c mpe e r; o Ke r s o lxnt k c mmu i t c r;ls r g d t nn wo nt s ut e c t i ; a miig y r u u en a DOh 1.9 9jsn10 .4 82 1 . .1 03 6 /i .0 03 2 .0 11 0 9 .s 0
相关主题