当前位置:文档之家› 基于传染病模型的微博信息传播规律研究

基于传染病模型的微博信息传播规律研究

《自动化技术与应用》2019年第38卷第6期计算机应用ComputerApplications

TechniquesofAutomation&Applications基于传染病模型的微博信息传播规律研究*

白黎,杨亚强

(宝鸡文理学院,陕西宝鸡721016)

摘要:无本文在经典传染病模型的基础上,加入重复转发因素的影响,构建了易感染者-犹豫者-感染者-免疫者的微博信息传播模型。并使用雷洋事件信息传播数据进行模拟仿真,仿真结果表明,该模型可以很好地描述微博信息传播的规律。关键词:微博;SIR模型;信息传播与控制;模拟仿真中图分类号:TP393文献标志码:A文章编号:1003-7241(2019)06-0059-04

SimulationonMicroblogInformationTransmission

BasedonSIRModel

BAILi,YANGYa-qiang

(BaojiUniversityofArtsandSciences,Baoji721016China)

Abstract:BasedontheclassicSIRmodel,thewholetransmissionnodeisdividedintohealthynode,browsenode,transmissionnodeandimmunenode.Meanwhile,factorsforuserstorepeatedlyforwardmessagesareinputtoimproveinfectiousdis-easemodel.Finally,thecollectedWeiboinformationdisseminationdataissimulated.Thesimulationresultsshowthatthesimulatedresultsagreewellwithactualstatisticaldataof"LeiYangincident"informationdissemination,meantimethees-tablishedmicro-bloginformationpropagationmodelcanwelldescribethespreadlaw.Keywords:microblog;Susceptible-Infected-Removedmodel;informationtransmissionandcontrol;simulation

*基金项目:国家社会科学基金项目(编号15XGL021)

收稿日期:2018-09-141引言微博作为一种新型社会化媒体已经成为信息沟通和

传播的重要平台。它以其快捷性和高效性赢得了亿万用

户的青睐,根据中国互联网络信息中心(CNNIC)发布的

《第35次中国互联网络发展统计报告》[1],截止2014年12

月,中国网民规模达到6.49亿,新浪微博注册用户已经达

到了2.49亿人次。到2016年,微博月活跃用户数达3.13

亿,日活跃用户数也增长到1.39亿。微博的快速发展是

一把双刃剑,正面的消息可以在传播系统里面快速传播,

并带来积极的影响,但同时负面的消息也会得到快速的

传播,带来消极的影响。特别是现在信息技术的快速发

展,使微博迅速成为一种快速、便捷的舆情传播方式。一

旦一个热门话题在微博中出现,因为其受众人数巨大,信

息传播快速,可以在短时间内形成井喷式的网络舆情,就会影响到事件的发展方向,进而对有关部门对发生事件

的裁决、处理和应对带来影响。趋利避害是人们的基本

思想,人们都希望正面的、积极的消息能够在大范围快速

传播;消极的、负面的消息能够第一时间得到控制与澄

清,特别是作为政府部门门户的官方微博,对这方面的要

求就显得尤为重要。因此通过研究和分析微博信息传播

的特点,掌握其内在的传播规律,从而达到对网络中传播

舆情话题发展过程的监控和预测,将对于相关部门对网

络舆情的正确疏导和管理起到重要作用。

2文献分析从20世纪开始,许多学者利用传染病模型研究信息

的传播规律。Ross等研究蚊子和人群之间的疟疾的传

播,提出了SI模型[2],Kermack和McKendrick研究黑死

病传播规律时,提出了SIR模型[3],后来学者们根据不同

的情境对SIR模型进行了改进,并将这些模型广泛的应

用到信息传播规律的研究中[4]。Leskovec基于SIS模型构

59计算机应用ComputerApplications《自动化技术与应用》2019年第38卷第6期

TechniquesofAutomation&Applications建了博客网络中的话题信息传播模型[5];Gruhl等人建立

了基于SIRS的博客信息传播模型[6];Zhao依据传染病SI

模型,提出了微博信息传播中突发性话题的传播模型[7];

Zhang等人依据传染病SIR模型结合群组动力学,对微

博信息传播中热点话题的传播规律进行了研究[8];

Chakrabarti等人利用传染病模型的方法预测微博的转

发规模[9];Li等人利用扩展的传染病模型对腾讯微博信息

的转发次数进行了准确的预测[10];Wang等人提出了扩展

的SIS疾病传染模型[11];陆静等人建立了微博网络消息传

播的ISSR模型[12];丁学君等人建立了基于SCIR的微博舆

情话题传播模型[13];刘丹等人提出了微博信息传播的SIR

模型并对微博信息扩散规律进行了仿真分析[14];李可嘉,

游新年等人提出了改进的SIR模型来研究微博信息的传

播规律[15-16]。

这些研究利用经典的传染病模型,将整个传播系统

中的节点分为健康节点、传播节点和免疫节点,来研究社

会网络中信息传播的规律,为微博信息传播规律的研究

奠定了一定的基础。但是微博信息的传播还与人在获取

信息以后的真实情感、决策、信息互动模式有关,所以要

更好的模拟和反映微博信息传播的真是规律,就需要对

经典的传染病模型进一步改进。

3微博的信息传播模型本文基于传染病的SIR模型,构建了一个新的微博

信息传播模型。在模型中引入了一个新的节点——浏览

节点和一个新的因素——自己重复转发因素。这样在信

息传播过程中所有的节点就分为四种:健康节点、浏览节

点、传播节点和免疫节点。信息传播的规律是:

(1)当一个健康节点(易感染者)接触到一个传播节

点(感染者)发布的消息以后,易感染者一部分可能要对

信息进行核实或者验证,从而使其处于是否要转发的状

态,我们称之为犹豫状态,即一部分健康节点以概率p1转

化为浏览节点。另一部分则直接以概率p2进行转发,从

而成为新的传播节点,在这里p1+p2≤1。

(2)处于浏览节点的用户经过一定时间的思考、验

证之后以概率p3转化为新的传播者,或者以概率p4拒绝

转发成为免疫节点,在这里p3+p4≤1。

(3)新的传播节点以概率p5拒绝转发成为免疫节点。

(4)某些用户发布了一条信息以后可能出于营销策

略、扩散市场、忘记自己曾经转发或者出于信任一些官方

信息传播正确舆论的目的而进行重复转发,这一过程可以认为是传播节点自身以概率p6进行重复转发,一般而

言p5远大于p6。

依据上述的微博信息传播规律分析,我们建立如下微博信息传播模型:

本文定义N(t)为t时刻网络中的节点总数,则S(t),H

(t),I(t),R(t)分别代表t时刻微博信息传播网络中的健康

节点(易感染者)、浏览节点(犹豫者)、传播节点(感染者)

及免疫节点(免疫者)的密度,即四类节点的数量分别在

N(t)中所占的比例,由假设可知S(t)+H(t)+I(t)+R(t)=1。

4实验模拟4.1数据的准备

本文的实验数据来源于2016年5月7日采集的某粉

丝众多的新浪微博账户,该用户5月7日发布了中国人民

大学硕士雷洋因涉嫌嫖娼被民警采取强制措施导致死亡

的事件,这件事情被发到在网络上以后上引起了轩然大

波,一度成为最热门的话题。本文的数据采集从某一原

创微博用户出发,根据统计该用户的关注列表,逐个统计

分析用户间的关注关系以及每个用户在采样期间(从第

一条微博发出到30天内)转发、评论和原创的微博总数。

4.2实验结果及讨论

本文使用MATLAB仿真软件,对于构造的微博信息

传播模型进行实验仿真,通过300次的实验迭代,微博传

播网络中四个节点都达到了稳定状态,并得到以下仿

真结果。

在本模型中由于微博信息传播网络中用户一旦发布

了舆情信息,除了特殊情况几乎所有的粉丝用户都可以

看见这个信息,所以可以取p1=0.9,在传播过程中出于自

身目的对信息进行重复转发的比例很小,所以取p6=0.01,

根据相关文献[13,15],对其他参数取值如下:p2=0.1,

p3=0.3,p4=0.1,p5=0.3。

4.2.1微博信息转发数随时间变化关系

图1中纵坐标为雷洋事件微博信息的转发总量的标

准化值。从图中可以看出实际统计的数据和理论计算数

60《自动化技术与应用》2019年第38卷第6期计算机应用ComputerApplications

TechniquesofAutomation&Applications值模拟的结果有很高的吻合度。这说明建立的微博信息

传播模型是合理的。从图中也可以看出微博信息传播的

一般规律:当一条微博信息发布出来以后,在较短时间内

信息转发量较低,传播速度较慢,此阶段我们可以称之为

信息犹豫期,这个时期往往持续时间较短。过了这个时

间段以后,信息的转发量会有一个快速增长,此阶段我们

可以称之为信息扩散期或爆炸期,这个阶段持续的时间

较长。后面随着时间的变化和人们的认知更加成熟理性

或者有新的热点信息进入,该条微博信息将会逐渐淡出

人们的视线,所以转发量的增速会慢慢减小,最终趋于

零,即该条信息被淹没,不再有用户转发,该条微博信息

的传播也告以结束,这个阶段持续的时间比较长。

图1模拟数据和实际数据对比图

4.2.2四个节点密度随时间变化关系

图2健康节点S(t)随时间变化图

图2是健康节点(易感染者)密度随时间的变化的曲

线。由图可以知道,健康染节点的密度在微博信息传播

初期短时间内呈迅速递减趋势,这是因为在我们的假设

里面,我们设定了用户一旦发布了舆情信息,除特殊情况

外几乎所有的粉丝用户都可以看见这个信息,即给概率p1取值0.9,这也正体现了微博信息“裂变式”的传播模

式。图中的变化也显示出了在微博信息发布的第4-5天

将迎来信息的爆炸式增长。

图3是浏览节点(犹豫者)节点密度随时间变化的曲

线。由图可以知道,微博信息刚开始传播之前,其短时间

呈增长趋势,很快达到顶峰。这是因为在开始阶段,当一

个粉丝看到一条微博信息以后,他有自己的判断力,可能

需要时间去验证这条微博的真实性,所以伴随着图2所示

短时间的信息爆炸式增长,导致了浏览节点(犹豫者)迅

速的增长(3-4天内),但是随着时间的推移网络中感染者

的比例会减少,而且犹豫过后(或者验证过后)这些犹豫

者会转变为感染者或者免疫者,所以其密度会逐渐减少

直至在传播网络中消失。

图3浏览节点H(t)随时间变化图

图4传播节点I(t)随时间变化图

图4是传播节点(感染者)的密度随时间变化的曲

线。从图中可以看出,感染者在微博信息传播的初期呈

增加趋势,这是因为在初始阶段人群中有大量的易感染

者,并且随着信息的爆炸式传播,短时间内会有更多的人

61

相关主题