当前位置:文档之家› 微博中热点话题的内容特质及传播机_省略_025条高转发微博的数据挖掘分析_李彪

微博中热点话题的内容特质及传播机_省略_025条高转发微博的数据挖掘分析_李彪


212
176
3.5%
2 312.8
— 12 —
从热点话题最大转发量上来看,社会热点事 件引发 的 转 发 极 值 最 大, 凸 显 出 微 博 的 围 观 效 应;其次是促销信息,由于背后有网络水军的身 影,这个数值不是很准确。从热点话题的平均转 发量上看,促销信息和寻求帮助信息最高,可以 看出微博作为一种草根的社会化网络媒体,在社 会关系的维系和拓展方面具有其他新媒体所不能 比拟的价值。
微博 “粉丝路径” 和 “转发路径” 的传播 方 式既不是传统媒体的线性传播,也不是网络媒体 的网络传播,其传播速度和传播广度远远高于之 前任何一种媒介产品。新浪微博每日产生1亿条 内容。[2]在这 些 浩 如 烟 海 的 信 息 中 去 伪 存 真, 找 到有价值或者能够展现中国微博用户信息地图的 核心热点信息,成为相关研究的热点问题。
大,希望通过微博来获得心理的放松和安逸,另
外也说明微博具有缓解压力、进行心理调节的工
具属性,从这个意义上说,微博是一种 “软” 媒
图 1 微 博 转 发 深 度 和 转 发 宽 度 示 意 图
体。其次是社 会 热 点 事 件, 占 到 总 体 的 21.9%,
需要说明,每个原创微博并不是仅仅有一个 转发深度和转发宽度,可能有很多个。如图1所 示,在这个原创微 博 A1 中, 总 计 有 两 个 转 发 深 度,即 A1-B2的转发深度1级和 A1-B1-C1
二、研究设计
(一) 数据抓取 本文采用 “爬 虫 技 术 ”, 通 过 新 浪 微 博 API (Application Programming Interface) 接 口 进 行 数据抓取。新浪 微 博 与 其 他 微 博 网 站 (如 Twit- ter) 类 似, 用 户 之 间 构 成 有 向 无 权 网 络。 用 户 可自 由 添 加 关 注 的 其 他 用 户, 称 之 为 “跟 随 ” (Followings);也可 在 未 经 许 可 的 情 况 下 被 其 他
平均转发量 1 721.9 2 044.4
休闲心情 2 569 42.6% 18 109
1 606.8
生活健康 448
7.4% 7 462 1 586.7
寻求帮助 290
4.8% 29 610 2 572.3
促销信息 201
3.3% 33 154 2 611.6
风水财运 被删除微博
一、研究缘起
微博作为一种新的在线社会网络形式,逐渐 成为人们获取和共享信息的重要平台。据中国互 联网络信息中心 (CNNIC)《第31次中国互联网 络发展状况统计报告》 显示,截至2012年 12 月 底,我国微博用户规模为 3.09亿, 较 2011 年 年 底增长了5 873万,增幅达到 23.5%; 手机微博 用户 规 模 达 到 2.02 亿, 高 达 65.6% 的 微 博 用 户 使用手机终 端 访 问 微 博。[1]根 据 西 方 传 播 学 的 研
一定程度上佐证了微博具有媒体的属性特征。然 后是时 尚 娱 乐, 占 到 总 体 的 13.4%, 这 更 多 的 是满足人们的娱乐、窥私等心态。这三者就占到 了 总 体 的 78% 。
表2
热点话题的类别分布及转发情况
时尚娱乐 社会热点事件
条数
809
1 320
所占比例 13.4%
21.9%
最大转发量 13 445 35 066
(二) 数据集 本文使用的数据库从 2010年9 月15 日 开 始 收集数据,目前已经收集的用户数大约有 40 万, 以文本形式存储,占用空间50G 左右。收集的信 息包括两部分: (1) 用户基本属性 信 息, 如ID、 Name、 Gender、 VFlag、 Address、 Tags、 Fans、 Followings、Tweets; (2) 用 户 话 题 内 容 信 息, 如话题内容属性、转发次数、评论次数。爬取的 内容几乎涵盖了该用 户 的 所 有 信 息。 其 中 VFlag 是认证用户标识,新浪微博采取实名制等形式对 知名用户进行实名认证。 (三) 数据处理技术 选取以下数据作为分析对象:选取时间跨度 从2010 年 9 月 至 2013 年 1 月, 每 条 转 发 量 在 1 000次以上的 原 创 微 博 为 热 点 微 博, 在 以 上 数 据库中符合条件的微博数量总计 6 025 条, 来 自 2 356 位 博 主, 每 条 微 博 平 均 被 转 发 1 836 次, 总 转 发 次 数 1 108 万 。 为了更 好 地 对 这 些 热 门 微 博 进 行 数 据 处 理, 将所有热门微博信息分为以下8个类别 (见表1)。
中国人民大学学报
JOURNAL OF RENMIN UNIVERSITY OF CHINA
2013 年 第 5 期 No.5 2013
微博中热点话题的内容特质 及传播机制研究
——— 基 于 新 浪 微 博 6 025 条 高 转 发 微 博 的 数 据 挖 掘 分 析
李 彪
[摘要] 针对新浪微博两年多来高转发的 6 025 条 热 门 微 博,采 用 大 数 据 挖 掘 与 分 析 技 术 进 行 研 究。 热点微博话题的传播呈现出一定的规律:转发次数的分布符合幂律分布,转发信息链的长度符合指数型分 布特征。新浪微博具有强弱关系同时存在于一个平台属性特征,这既不同于 Twitter的社会单向度的弱关系 平台,也不同于 Facebook双向的强关系平台。不同类别事件在新浪微博平台中传播的信息流和 时 间 线 也 有 差异,可以根据不同类别热门微博的转发深度和转发宽度构建出不同类别热门的传播模式结构。微博的话 语权力格局中依然存在着不平等现象,传统社会话语精英依然把持着微博话语场域的主导权。
2.热 点 话 题 创 作 者 特 征 分 析 (1) 性别特征。 通过数据统计可见,男性是热点话题的创 作者主力。在所有8个类别的热点话题中,男 性的数量都远远超过了女性,一定程度上折射 出现实社会中男女之间的话语权力格局。尤其 是在社会热点事件、休闲心情等类别中,说明 男性依然是微博这个虚拟话语场域中的主要议 程设置者和主导者。 从同一话题内性别比例分布来看,男性在促 销信息、社会热点信息等类别上远远超过女性比 例,是这两类信息的绝对主导者,一定程度上反 映出男性积极赚钱、热心时事政治的性别特征。 在生活健康、时尚娱乐等类别上女性要明显高于 其他类别,也凸显出女性在微博这一虚拟社会场 域中依然关注美容、娱乐等性别特征。
[关 键 词 ] 数 据 挖 掘 ; 热 门 微 博 ; 转 发 深 度 ; 转 发 宽 度 ; 话 语 权 力 格 局 [作者简介] 李彪:中国人民大学新闻学院讲师,中国人民大学新闻与社会发展研究中心研究员 (北 京 100872)
本文以新浪微博 高 转 发 的 6 025 条 原 创 微 博 为研究样本,通过大数据挖掘分析技术,研究分 析目前微博中的热点话题属性及传播机制。
转发者 C1、C2 等 的 转 发, 其 转 发 深 度 为 2 级, 发宽度,从 B1 点 产 生 的 C1、C2、C3、C4 四 个
单个话 题 中 转 发 深 度 极 值 越 大, 其 信 息 链 条 越 单位的转发宽度, 同 样 道 理,4 个 单 位 宽 度 是 原
长,说明该事件越受关注、越容易引起民众的 讨 创微博 A1的极值 转 发 宽 度, 因 此 每 个 原 创 微 博
[基金项目] 云南省院校教育合作人文社会科学项目 “云南舆情监测与边疆社会稳定关系研究”(SYSX201107)
— 10 —
语权力面貌。 微博扮演着重要的社会话语动员角色,很多
社会行动如随手拍行动、免费午餐计划等都是在 微博中倡导,通过微博进行充分的社会动员进而 影响到 线 下 的; 微 博 同 时 还 扮 演 着 还 原 社 会 真 实、黏合社会信息碎片的重要角色,很多社会信 息在微博中以碎片化的方式存在,通过微博用户 的集体力量和贡献,完成社会真实的 “再构建”, 进而实 现 “社 会 真 实 的 有 机 运 动”。 另 外, 微 博 还为社会信息提供意见加工、贴标签等 “仪式赋 予”的功能,很多信息一般以事实判断的形式进 入到微 博 场 域, 微 博 中 话 语 精 英 通 过 其 内 化 的 “文化地图” 对 其 进 行 价 值 判 断, 以 提 供 意 见 或 贴标签等方式赋予其更大的社会价值意义,使之 得以快速地传播开来。作为一种独立运行的社会 话语场域,微博具有本身的话题偏好属性、话语 扩散模型、话语权力格局等属性。因此,研究这 些属性对于更好地把握微博话语场域具有重要的 价值。
究,一种 物 理 属 性 的 媒 介 形 态 被 社 会 大 众 中 20%以上的人群所使用,便可以称其为 “大众 媒 介”,从这 个 意 义 上 可 以 说, 微 博 已 成 为 一 种 大 众化媒体 (Mass Media)。
微博以即时性和裂变式的嵌套性等人际传播 的基本属性,引发 了 一 场 “140 字 符 的 社 会 话 语 革命”。微博在整个 社 会 话 语 场 域 中 所 扮 演 的 作 用也越来越重要,成为整个社会话语场域的 “话 语漩涡”, 扮 演 着 话 语 策 源 地、 信 息 桥 和 主 导 者 等多重角色,最大限度地解构了传统的由社会话 语精英所主导的话语权力格局,将原来看似 “铁 板一块” 的话语权力场域一分为二———官方 话 语 场域和草根话语场域,冲击着传统的社会治理方 式和社会个体存在方式,塑造了一种新的社会话
(四) 关键定义说明
的转发深度2级, 其 中 2 级 是 原 创 微 博 A1 的 极
本文有两个关键概念,即转发深度和转发宽 值转发深度,因此每个原创微博只有一个极值转
度。转发深度是指同一条微博信息传播流的环节 发深度;同样,在 原 创 微 博 A1 中, 有 两 个 转 发
多寡。如图1 所 示, 原 始 微 博 经 过 转 发 者 B1 和 宽度,从 A1 节 点 产 生 的 B1、B2 的 两 个 单 位 转
相关主题