《自动化技术与应用》2019年第38卷第6期计算机应用ComputerApplications
TechniquesofAutomation&Applications基于传染病模型的微博信息传播规律研究*
白黎,杨亚强
(宝鸡文理学院,陕西宝鸡721016)
摘要:无本文在经典传染病模型的基础上,加入重复转发因素的影响,构建了易感染者-犹豫者-感染者-免疫者的微博信息传播模型。并使用雷洋事件信息传播数据进行模拟仿真,仿真结果表明,该模型可以很好地描述微博信息传播的规律。关键词:微博;SIR模型;信息传播与控制;模拟仿真中图分类号:TP393文献标志码:A文章编号:1003-7241(2019)06-0059-04
SimulationonMicroblogInformationTransmission
BasedonSIRModel
BAILi,YANGYa-qiang
(BaojiUniversityofArtsandSciences,Baoji721016China)
Abstract:BasedontheclassicSIRmodel,thewholetransmissionnodeisdividedintohealthynode,browsenode,transmissionnodeandimmunenode.Meanwhile,factorsforuserstorepeatedlyforwardmessagesareinputtoimproveinfectiousdis-easemodel.Finally,thecollectedWeiboinformationdisseminationdataissimulated.Thesimulationresultsshowthatthesimulatedresultsagreewellwithactualstatisticaldataof"LeiYangincident"informationdissemination,meantimethees-tablishedmicro-bloginformationpropagationmodelcanwelldescribethespreadlaw.Keywords:microblog;Susceptible-Infected-Removedmodel;informationtransmissionandcontrol;simulation
*基金项目:国家社会科学基金项目(编号15XGL021)
收稿日期:2018-09-141引言微博作为一种新型社会化媒体已经成为信息沟通和
传播的重要平台。它以其快捷性和高效性赢得了亿万用
户的青睐,根据中国互联网络信息中心(CNNIC)发布的
《第35次中国互联网络发展统计报告》[1],截止2014年12
月,中国网民规模达到6.49亿,新浪微博注册用户已经达
到了2.49亿人次。到2016年,微博月活跃用户数达3.13
亿,日活跃用户数也增长到1.39亿。微博的快速发展是
一把双刃剑,正面的消息可以在传播系统里面快速传播,
并带来积极的影响,但同时负面的消息也会得到快速的
传播,带来消极的影响。特别是现在信息技术的快速发
展,使微博迅速成为一种快速、便捷的舆情传播方式。一
旦一个热门话题在微博中出现,因为其受众人数巨大,信
息传播快速,可以在短时间内形成井喷式的网络舆情,就会影响到事件的发展方向,进而对有关部门对发生事件
的裁决、处理和应对带来影响。趋利避害是人们的基本
思想,人们都希望正面的、积极的消息能够在大范围快速
传播;消极的、负面的消息能够第一时间得到控制与澄
清,特别是作为政府部门门户的官方微博,对这方面的要
求就显得尤为重要。因此通过研究和分析微博信息传播
的特点,掌握其内在的传播规律,从而达到对网络中传播
舆情话题发展过程的监控和预测,将对于相关部门对网
络舆情的正确疏导和管理起到重要作用。
2文献分析从20世纪开始,许多学者利用传染病模型研究信息
的传播规律。Ross等研究蚊子和人群之间的疟疾的传
播,提出了SI模型[2],Kermack和McKendrick研究黑死
病传播规律时,提出了SIR模型[3],后来学者们根据不同
的情境对SIR模型进行了改进,并将这些模型广泛的应
用到信息传播规律的研究中[4]。Leskovec基于SIS模型构
59计算机应用ComputerApplications《自动化技术与应用》2019年第38卷第6期
TechniquesofAutomation&Applications建了博客网络中的话题信息传播模型[5];Gruhl等人建立
了基于SIRS的博客信息传播模型[6];Zhao依据传染病SI
模型,提出了微博信息传播中突发性话题的传播模型[7];
Zhang等人依据传染病SIR模型结合群组动力学,对微
博信息传播中热点话题的传播规律进行了研究[8];
Chakrabarti等人利用传染病模型的方法预测微博的转
发规模[9];Li等人利用扩展的传染病模型对腾讯微博信息
的转发次数进行了准确的预测[10];Wang等人提出了扩展
的SIS疾病传染模型[11];陆静等人建立了微博网络消息传
播的ISSR模型[12];丁学君等人建立了基于SCIR的微博舆
情话题传播模型[13];刘丹等人提出了微博信息传播的SIR
模型并对微博信息扩散规律进行了仿真分析[14];李可嘉,
游新年等人提出了改进的SIR模型来研究微博信息的传
播规律[15-16]。
这些研究利用经典的传染病模型,将整个传播系统
中的节点分为健康节点、传播节点和免疫节点,来研究社
会网络中信息传播的规律,为微博信息传播规律的研究
奠定了一定的基础。但是微博信息的传播还与人在获取
信息以后的真实情感、决策、信息互动模式有关,所以要
更好的模拟和反映微博信息传播的真是规律,就需要对
经典的传染病模型进一步改进。
3微博的信息传播模型本文基于传染病的SIR模型,构建了一个新的微博
信息传播模型。在模型中引入了一个新的节点——浏览
节点和一个新的因素——自己重复转发因素。这样在信
息传播过程中所有的节点就分为四种:健康节点、浏览节
点、传播节点和免疫节点。信息传播的规律是:
(1)当一个健康节点(易感染者)接触到一个传播节
点(感染者)发布的消息以后,易感染者一部分可能要对
信息进行核实或者验证,从而使其处于是否要转发的状
态,我们称之为犹豫状态,即一部分健康节点以概率p1转
化为浏览节点。另一部分则直接以概率p2进行转发,从
而成为新的传播节点,在这里p1+p2≤1。
(2)处于浏览节点的用户经过一定时间的思考、验
证之后以概率p3转化为新的传播者,或者以概率p4拒绝
转发成为免疫节点,在这里p3+p4≤1。
(3)新的传播节点以概率p5拒绝转发成为免疫节点。
(4)某些用户发布了一条信息以后可能出于营销策
略、扩散市场、忘记自己曾经转发或者出于信任一些官方
信息传播正确舆论的目的而进行重复转发,这一过程可以认为是传播节点自身以概率p6进行重复转发,一般而
言p5远大于p6。
依据上述的微博信息传播规律分析,我们建立如下微博信息传播模型:
本文定义N(t)为t时刻网络中的节点总数,则S(t),H
(t),I(t),R(t)分别代表t时刻微博信息传播网络中的健康
节点(易感染者)、浏览节点(犹豫者)、传播节点(感染者)
及免疫节点(免疫者)的密度,即四类节点的数量分别在
N(t)中所占的比例,由假设可知S(t)+H(t)+I(t)+R(t)=1。
4实验模拟4.1数据的准备
本文的实验数据来源于2016年5月7日采集的某粉
丝众多的新浪微博账户,该用户5月7日发布了中国人民
大学硕士雷洋因涉嫌嫖娼被民警采取强制措施导致死亡
的事件,这件事情被发到在网络上以后上引起了轩然大
波,一度成为最热门的话题。本文的数据采集从某一原
创微博用户出发,根据统计该用户的关注列表,逐个统计
分析用户间的关注关系以及每个用户在采样期间(从第
一条微博发出到30天内)转发、评论和原创的微博总数。
4.2实验结果及讨论
本文使用MATLAB仿真软件,对于构造的微博信息
传播模型进行实验仿真,通过300次的实验迭代,微博传
播网络中四个节点都达到了稳定状态,并得到以下仿
真结果。
在本模型中由于微博信息传播网络中用户一旦发布
了舆情信息,除了特殊情况几乎所有的粉丝用户都可以
看见这个信息,所以可以取p1=0.9,在传播过程中出于自
身目的对信息进行重复转发的比例很小,所以取p6=0.01,
根据相关文献[13,15],对其他参数取值如下:p2=0.1,
p3=0.3,p4=0.1,p5=0.3。
4.2.1微博信息转发数随时间变化关系
图1中纵坐标为雷洋事件微博信息的转发总量的标
准化值。从图中可以看出实际统计的数据和理论计算数
60《自动化技术与应用》2019年第38卷第6期计算机应用ComputerApplications
TechniquesofAutomation&Applications值模拟的结果有很高的吻合度。这说明建立的微博信息
传播模型是合理的。从图中也可以看出微博信息传播的
一般规律:当一条微博信息发布出来以后,在较短时间内
信息转发量较低,传播速度较慢,此阶段我们可以称之为
信息犹豫期,这个时期往往持续时间较短。过了这个时
间段以后,信息的转发量会有一个快速增长,此阶段我们
可以称之为信息扩散期或爆炸期,这个阶段持续的时间
较长。后面随着时间的变化和人们的认知更加成熟理性
或者有新的热点信息进入,该条微博信息将会逐渐淡出
人们的视线,所以转发量的增速会慢慢减小,最终趋于
零,即该条信息被淹没,不再有用户转发,该条微博信息
的传播也告以结束,这个阶段持续的时间比较长。
图1模拟数据和实际数据对比图
4.2.2四个节点密度随时间变化关系
图2健康节点S(t)随时间变化图
图2是健康节点(易感染者)密度随时间的变化的曲
线。由图可以知道,健康染节点的密度在微博信息传播
初期短时间内呈迅速递减趋势,这是因为在我们的假设
里面,我们设定了用户一旦发布了舆情信息,除特殊情况
外几乎所有的粉丝用户都可以看见这个信息,即给概率p1取值0.9,这也正体现了微博信息“裂变式”的传播模
式。图中的变化也显示出了在微博信息发布的第4-5天
将迎来信息的爆炸式增长。
图3是浏览节点(犹豫者)节点密度随时间变化的曲
线。由图可以知道,微博信息刚开始传播之前,其短时间
呈增长趋势,很快达到顶峰。这是因为在开始阶段,当一
个粉丝看到一条微博信息以后,他有自己的判断力,可能
需要时间去验证这条微博的真实性,所以伴随着图2所示
短时间的信息爆炸式增长,导致了浏览节点(犹豫者)迅
速的增长(3-4天内),但是随着时间的推移网络中感染者
的比例会减少,而且犹豫过后(或者验证过后)这些犹豫
者会转变为感染者或者免疫者,所以其密度会逐渐减少
直至在传播网络中消失。
图3浏览节点H(t)随时间变化图
图4传播节点I(t)随时间变化图
图4是传播节点(感染者)的密度随时间变化的曲
线。从图中可以看出,感染者在微博信息传播的初期呈
增加趋势,这是因为在初始阶段人群中有大量的易感染
者,并且随着信息的爆炸式传播,短时间内会有更多的人
61