当前位置:
文档之家› 基于社交网络的社群生长模型_尤志强
基于社交网络的社群生长模型_尤志强
第 12 卷 第 2 期
尤 志 强 ,等 :基 于 社 交 网 络 的 社 群 生 长 模 型
· 73 ·
所 形 成 的 社 群 是 显 性 的 ,一 般 有 着 明 确 的 社 群 边 界 。 本 文 把 这 类 有 着 明 确 边 界 的 社 群 称 为 “群 结 构 ”。 对于第一种类型的结群行为,当前已经有了相当深入的研究。社团结构 研 [1-2] 究就是针对该类结群行 为 形 成
然 而 ,对 于 第 二 类 结 群 行 为 ,长 期 以 来 由 于 相 关 的 社 会 网 络 数 据 的 匮 乏 ,此 方 面 研 究 非 常 欠 缺 。 目 前 ,对 于 此 种 群 结 构 的 产 生 机 制 的 认 知 的 缺 乏 以 及 数 据 获 取 的 难 度 ,导 致 很 多 研 究 只 能 基 于 模 拟 数 据 进 行 ,相 关 算 法 缺 乏 实 际数据的有效检验。不过,随 着 在 线 社 交 网 络 的 普 及,数 据 的 获 取 问 题 得 到 了 缓 解,如 MySpace、QQ、facebook 等社交网站拥有大量的活跃用户,这为研究真实社交网络的社群结构性质,探究网络演化、社 群 生 长 机 制 提 供 了 机会。
提出一种基于共同兴趣的类渗流的扩 散 机 制,并 进 行 建 模 和 分 析。 在 腾 讯 QQ 朋 友
关 系 网 络 上 的 数 值 模 拟 实 验 显 示 ,模 型 得 到 的 统 计 特 征 与 真 实 的 社 群 结 构 基 本 一 致 ,
表明这一机制是实际社群生长的重要驱动力。研究为进一步对社群生长趋势预测的
1 模 型
由于所研究的 QQ 社交网络数据是显性群结构,超图结构很自然地被用于分析该网络。文献[13]通 过 对 该
数 据 的 实 证 分 析 发 现 群 的 产 生 主 要 是 基 于 两 种 机 制 ,一 种 是 由 线 下 社 交 关 系 的 交 互 驱 动 产 生 ,此 类 群 的 大 小 会 在
0。
此外,每个用户都有权利基于自身的兴趣点创建群,即1个用户有n 个兴趣点则可建n 个群。同时考虑到用
户加群偏好的差异性,部分用户可能加多个群而其他用 户 倾 向 于 加 入 少 量 群,因 此 引 入 加 群 偏 好 概 率 Pjoin∈(0, β],0<β≤1,它 代 表 相 应 用 户 加 群 的 倾 向 性 。Pjoin的 值 越 大 表 示 用 户 自 身 具 有 更 强 的 加 群 倾 向 。 用 户 在 模 型 初 始 阶段被赋予随机概率值 Pjoin。在模型中,社群生长依据朋友 关 系 网 络 路 径 进 行,但 如 图 2 所 示,朋 友 关 系 网 的 度 分 布 遵 循 3 段 式 幂 律 分 布 ,少 部 分 用 户 有 大 量 的 邻 居 朋 友 (其 数 目 可 以 超 过 1 000)而 大 部 分 用 户 只 有 少 量 的 邻 居
N=10。每一个 用 户具有一 个 兴 趣 构 建概率 Pv∈(0,α],0<α≤1,用于构建该用户 的 随 机 兴趣 向 量。 考 虑 到 不 同用户在兴趣广度上存在差异,因此兴趣构建概率的大小对于不同用户存在一定差别。兴 趣 广 泛 的 用 户 会 有 多
维兴趣,这类用户的兴趣构建概率 Pv 值往往趋近于α。另外,由于在极端情况下,有的 用 户 的 兴趣 向 量 的所有维 度值均为0,此类情况下规定该用户将被 随 机 赋 予 某 一 维 兴 趣,即 随 机 将 向 量 的 某 一 维 度 赋 值 为 1,其 余 维 度 为
Abstract:The structure of social group deeply influences the development and evolution of human society,but studies on this subject are relatively rare.Focusing on QQ friendship network,this paper proposes a percolation-like diffusion model which is based on users′common interest to simulate and analyze the clustering behaviors of users and the growing process of social groups. Numerical simulation on the real QQ friendship network of Tencent shows that the statistical fea- tures generated by our model accord with the real empirical properties of the group network.It indicates that this mechanism is an important driven-factor for the growth of real social group. This work provides vital theoretical evidence for the further studies on the prediction of social group growth. Key words:social network;common interest;percolation;interest diffusion;clustering behav- ior;group growth
收 稿 日 期 :2014-10-16;修 回 日 期 :2015-01-16 基 金 项 目 :浙 江 省 新 苗 人 才 计 划 项 目 (2013R421062),CCF-腾 讯 科 研 基 金 (CCF-Tecent AGR20130104);国 家 自 然 科 学 基 金 (11205040,11205042) 作 者 简 介 :尤 志 强 (1990-),男 ,浙 江 金 华 人 ,硕 士 研 究 生 ,主 要 研 究 方 向 为 复 杂 网 络 和 数 据 挖 掘 。 通 讯 作 者 :韩 筱 璞 (1981-),男 ,山 东 曹 县 人 ,博 士 ,讲 师 ,主 要 研 究 方 向 为 复 杂 系 统 与 人 类 动 力 学 。
基于社交网络的社群生长模型
Vol.12 No.2 Jun.韩 筱 璞1,邓 小 方2,吕 琳 媛1
(1.杭州师范大学阿里巴巴复杂科学研究中心,杭州 311121;2.江西师范大学软件学院,南昌 330022)
摘要:基于腾讯 QQ 朋友网络数据,针对实 际 的 用 户 结 群 行 为 和 社 会 群 组 生 长 过 程,
朋友(其数目甚至小于 10)。 考 虑 到 用 户 的 精 力 有 限,不 可 能 同 时 与 大 量 邻 居 保 持 结 群 行 为 互 动,进 一 步 基 于 Dunbars数 的 [14] 考量,在社群生长过程中引入基于直接邻居数 的 衰 减 函 数 ,以 保 证 社 群 生 长 的 平 滑 性,也 进 一 步
YOU Zhiqiang,GUAN Yuanpan,HAN Xiaopu,DENG Xiaofang,LYU Linyuan
(1.Alibaba Research Center for Complexity Sciences,Hangzhou Normal University,Hangzhou 311121,China; 2.Software school,Jiangxi Normal University,Nanchang 330022,China)
研究提供了重要的理论支持。
关 键 词 :社 交 网 络 ;共 同 兴 趣 ;渗 流 机 制 ;兴 趣 扩 散 ;结 群 行 为 ;社 群 生 长
中 图 分 类 号 :N94
文 献 标 识 码 :A
Modeling of Social Group Growth Based on Social Networks
第 12 卷 第 2 期 2015 年 6 月
复 杂 系 统 与 复 杂 性 科 学
COMPLEX SYSTEMS AND COMPLEXITY SCIENCE
文 章 编 号 :1672-3813(2015)02-0072-06;DOI:10.13306/j.1672-3813.2015.02.011
本文针对第二类结群行为,获取了真实的 QQ 社交网络数据,对以 QQ 群为代表的社会群组结构的产生及生 长机制进行了模型研究。基于对真实 QQ 群数 据 的 实 证 研 究[13],提 出 了 一 种 类 渗 流 过 程 的 兴 趣 扩 散 模 型,并 发 现这种机制可以有效解释群组社交网络上群结构的产生以及生长过程 ,为理解社会群组结构 的 生 长 与 演 化 提 供 了新思路。
短时间内达到稳定;另一种则是基于共同 爱 好 自 发 产 生 并 逐 渐 演 化,此 类 群 中 成 员 的 社 交 关 系 与 线 下 不 一 定 对
应。在本模型中,如果用户与好友处于同一地域、组织机构,或者具有相同的爱好,都 视 其 拥 有 共 同 兴 趣,若 相 邻
朋 友 之 间 存 在 共 同 兴 趣 ,他 们 就 可 能 会 加 入 同 一 个 群 。 同 时 ,还 需 要 考 虑 相 关 结 群 限 制 因 素 :1)用 户 的 有 限 精 力 ,
的社群结构。定性来说,社团结构表示的是团簇结构内节点之间的连边密度要远远大于这 些 节 点 与 该 团 簇 以 外 的节点的连边密度[3],目前普遍被物理学界接受的定量表达则 是 基 于 Newman 所 提 出 的 模 块 概 念 。 [4] 社 团 结 构 的理解以及性质挖掘,对于进一步推动社交网络的形成与演化、信息传播、重要节点识 别、广 告 投 放、舆 论 控 制 等 研究及应用都具有相当重要的作用。相关学者通过实证分析,不仅发现万维网[5]、生物化学网络 等 [6] 都存 在 社 团 结构,而且进一步发现社团结构存在自相似现象 等 [7] 。一些学者则在实证基础上,提出一系列的社团结构识 别 算 法,如 Kernighan-Lin算法[8]、谱图分区算法[9]、模块最大化算法 等 [10] 。另外,一些学者对团簇的形成机制 做 了 相 关研究,如 Andreas等 利 [11] 用脱离者模型研究社交网络的社团产生机制 。Wang等 则 [12] 提 出 基 于 核 心 的 算 法 来 研究社团的演化。