当前位置:
文档之家› 微博传播过程中用户影响力的特征实证分析_于晶
微博传播过程中用户影响力的特征实证分析_于晶
b. 社交网络用户在信息传播中社会影响力的研究
是一个较大的领域,本文仅针对其中的核心问题的几
个方面展开研究,所选取的几个因素及其数据能够满
足研究的需要。
c. 在实际应用中,粉丝数量和身份认证等在许多
研究或调查报告中通常都被作为最重要的衡量指标, 比如意见领袖的识别[6]等。但是它们对衡量用户的重
要性是否有效,相关程度如何等基本的问题却有待真
对于用户的影响力或关键用户定位的研究还处在 起步阶段,研究中 存 在 着 诸 多 未 解 的 问 题 。 仅 从 网 络 结构的角度来看 ,用 户 重 要 性 的 衡 量 大 都 要 求 掌 握 较 完整的网络结构及 复 杂 的 计 算 ,而 且 研 究 结 果 较 难 被 直接证实。从另一个角度来看,不论结构重要性、社会 影响力,还是用户的相似性,其根本目的都是为了衡量 在线社交网络用户 在 信 息 传 播 过 程 中 的 作 用 ,或 者 说 该用户能够造成的 信 息 进 一 步 扩 散 的 范 围 ,本 研 究 中 用影响力来指代用户在信息传播过程中的这种作用。 本文采用实证的方 法 ,研 究 微 博 信 息 传 播 过 程 中 用 户 影响力的特征,并且重点关注用户粉丝数量、是否认证 和参与时间等直接 因 素 ,以 澄 清 这 些 最 基 本 的 因 素 与 微博用户的影响力的关系。
收稿日期: 2013-06-04
修回日期: 2013-07-25
基金项目: 本研究受教育部人文社会科学研究基金项目“重大突发公共事件的信息发布与传播效果研究”资助( 编号:11YJC860057) 。
作者简介: 于 晶( 1981-) ,女,博士,讲师,研究方向: 社会化媒体、政府传播。
·58·
情报杂志
第 32 卷
量中心性和 k-壳( k -shell) 等 。 [7-10] 特别是 k -壳,其 识别信 息 传 播 中 重 要 用 户 的 能 力 最 近 得 到 较 多 关 注[10 -12]。但是,在线社交 网 络 用 户 在 信 息 传 播 中 的 重 要性不能等价于其 在 网 络 结 构 中 的 重 要 性 ,还 可 能 源 于社交网络之外的因素。比如刚刚加入社交网络的社 会名人,网络结构 并 不 能 真 实 地 反 映 其 重 要 程 度 。 因 此学者引 入 社 会 学 领 域 中 社 会 影 响 力 ( Social Influence) 的概念来衡量网络中用户在信息传播中的重要 性[13]。社会影响力的概念涉及到心理、行为乃至信息 内容等多方面的因 素 ,是 相 关 研 究 的 基 础 问 题 也 是 当 前研究的热点[13-15],其定义及衡量方法还没有得到一 致的结论。而且,信 息 在 用 户 之 间 传 播 不 仅 仅 受 到 影 响力的作用,用户间的相似性也会带来信息的扩散,这 两种因素虽然不易区分但却是截然不同的[14]。
实数据的确认。此外,相对于原始信息的发出时间,用
户加入信息传播的时间的影响也有待确定。
1. 2 研究方法 本研究主要采用统计数据的可视
化方法和相关性分析方法来研究微博用户影响力的特
征及几个重要因素。其中,用户影响力与粉丝数量的
相关程度用 Spearman 等级相关系数来衡量:
∑ ρ
=
1
-
6 N3
d2i -N
体服从正态分布。但是在社交网络研究中大量存在着 幂律分布[16],例如好友数量、粉丝数量、原创或转发的
微博数量等。幂律分布是一种极不均匀的分布,不存
在能够对其进行衡量的标度( 如均值) ,也不能够像其
他的非线 性 关 系 一 样 被 转 化 为 便 于 分 析 的 形 式。 而
Spearman 等级相关系数是一个非参数性质( 与分布无
传播的完整过程,分析了用户影响力的特征及相关的因素。结果表明,用户的影响力分布极不均匀,具有双幂律分
布的特征; 高影响力的用户在微博传播的早期成簇出现,并且其影响力与粉丝数量之间存在一定程度的正相关性,
而低影响力的用户数量巨大,影响力与粉丝数量之间没有相关性; 而且,认证用户和非认证用户影响力之间存在着
其中,N 为 数 据 总 量,di 为 第 i 对 数 据 的 等 级 之 差。
之所以采用可视化方法和 Spearman 等级相关系
数的方法,而没有采用传统的相关分析法与回归分析
法,原因在于两个方面: 一是传统的方法主要用于对抽
样数据的分析,而本研究获取了完整的信息传播过程
总体数据; 二是传统的统计方法通常都要求变量的总
2. 2 数据处理 新浪微博开放平台 API 返回的数 据为 Json 格 式,这 种 格 式 是 一 种 半 结 构 化 的 类 似 于 XM L 的格式,被广泛用于 Web 数据传输中。由于新浪 微博的 API 暂不开放跟踪微博转发过程的 Json 字段, 因此只能利用微博文本中的“/ / @ ”标记跟踪微博传
关) 的相关系数,对数据总体的分布没有要求。
2 数据
2. 1 数据获取 本研究选择新浪微博中近期影响 较大的话题中转发数量最大的四条微博,利用新浪微 博开放平台的 API 接口,共获取微博转发记录 25 万 条。选取这四条微博 的 原 因 ,首 先 是 其 具 有 较 大 的 传 播范围从而有充足的数据量,其次这四条微博的传播 已接近尾声,传播范围基本不再发生变化,从而可以获 取完整的传播过程( 如图 1 所示) 。在满足传播过程 完整性的前提下,选取了每条微博从发出开始的 168 小时( 一周) 的传播数据为分析对象。数据的概况如 表 1 所示。
1 研究设计
1. 1 研究路线 本文以新浪微博为研究对象,选取 近期比较有代表性且传播范围较广的微博并获取整个 传播过程的完整数据。然后分析传播过程中用户的影 响力的特征及几个重要的因素与用户影响力之间的关 系。
对影响力特征的研究主要关注用户影响力的分布 状况、差异程度、核心节点的存在性及其在信息传播中 的作用。对影响力的重要因素的研究则选取了用户的 粉丝数量、身份认证状况,以及用户加入信息传播过程 的时间三种因素。选取这几种因素的原因有如下几个 方面:
截至时间 2013-04-23 00: 32: 34 2013-04-20 13: 40: 12 2013-04-23 01: 35: 17 2013-04-15 19: 56: 16
转发次数 26076 104373 33209 26255
0引言
互联网中的信息传播随着信息技术的发展经历了 一个社会化[1]、对 等 化 的 过 程。 早 期 的 互 联 网 作 为 平 面媒体的简单替代,信 息 传 播 的 模 式 本 质 上 依 旧 是 传 统的大众传播,用户主要通过门户网站单向获取信息。 博客的出现使得个 体 成 为 信 息 的 生 产 者 ,用 户 不 再 只 是被动地接受信息。以微博客等为代表的在线社交网 络( Online Social Netw orks) 应用[2]则彻底颠覆了传统 的信息传播方式,为互联网中的文化、舆论以及电子商 务等带来 了 巨 大 的 影 响。中 国 互 联 网 络 信 息 中 心 ( CNNIC) 第 31 次互联网络发展状况统计报告表明, 我国社交网用户 2012 年已达 2. 75 亿,占全部网民的
a. 数据的可获取性。本文采用实证的研究方法, 数据是最核心的 内 容 。 尽 管 在 线 社 交 网 络,特 别 是 微 博及其开放接口为 这 方 面 的 研 究 提 供 了 可 能 性 ,但 是 由于商业运营的目 的 ,这 种 接 口 的 权 限 和 功 能 都 受 到 严格的限制,更深层次的数据难以获取。
第8 期
于 晶: 微博传播过程中用户影响力的特征实证分析
·59·
播的路径。微博长度上限为 140 个字,一些用户会删 除其中的 转 发 标 记,从 而 失 去 部 分 微 博 的 完 整 路 径。
这些转发在微博的传播网络中会直接与原创微博相
连。为了避免其对分 析 结 果 的 影 响 ,在 所 有 的 分 析 中
第 32 卷 第 8 期 2013 年 8 月
情报杂志
JOURNAL OF INTELLIGENCE
Vol. 32 No. 8 Aug. 2013
微博传播过程中用户影响力的特征实证分析*
于晶
( 华东师范大学 政治学系 上海 200241)
摘 要 在社会化信息传播媒介中,每个用户都凭借其影响力对信息传播做出贡献。利用新浪微博数据构建微博
48. 8% ,年增长率达 12. 6% 。微博以其巨大的用户数 量、便捷的信息发布途径以及特殊的信息传播方式,迅 速对人类的社会生活带来了影响。近年来在国内外发 生的重大事件信息 的 传 播 过 程 中 ,都 能 看 到 它 们 的 身 影。
在线社交网络中,具有重要地位的用户 ( 网络节 点) 更可能造成大范围的信息或行为的传播。这些重 要用户的识别定位[3-4]在微博乃至所有在线社交网络 研究中占有重要 的 地 位 ,在 网 络 营 销[5]、广 告 投 放、舆 论引导[6]等方面有着直接的应用价值。重要用户识别 和定位的研究关键在于寻找衡量用户重要性的方法。 从网络结构的角度来看,用户重要性的衡量指标包括 度中心性( Degree) 、介数中心性( Betweeness) 、特征向
明显的差异。
关键词 微博 信息传播 用户影响力 幂律分布
中图分类号 G350
文献标识码 A
文章编号 1002-1965(2013)08-0057-05
An Empirical Analysis of Features and Impacting Factors of Micro-blog Users'Influence
将原创微博及其转发排除在外。
表 1 数据概况
Байду номын сангаас
序号 所属话题
发出时间
( a)
朱令案 2013-04-16 00: 32: 34