微博传播过程实证研究及效果评估南京大学王晓亮、王婷婷、杨宣华摘要:微博即微型博客,是一个基于用户关系的信息分享,交流及传播的平台,是一种互联网社交服务。
本文围绕微博传播过程,通过抽样,内容分析,甚至问卷调查方法对传播主体,传播内容进行统计分析(统计量描述,非参数检验,相关性检验,聚类分析等),并用聚类分析方法对较活跃传播主体样本进行分类,再利用层次分析法对不同类别进行定量的传播效果评估。
研究发现:(1)对微博用户对自发话题和转发议题的文本内容使用较多;(2)对于社会的一些热点,公益,公共新闻,粉丝们会更多地去参与转发,而对于博主原创的内容,粉丝们会更多的去交流即回复;(3)用户(主要指人)发微博内容属性是随机的,而对于那些有针对性机构,所发内容呈现一定聚集性。
(4)微博中名人效应依然明显,传播效果和诸多因素有关,按聚类分析分出类中,按照本文定量评估方法D(小s,蔡永康,何炅)传播效果最好。
最后基于这些研究提出些微博发展和建1设展望。
关键字:微博;统计分析;层次分析;效果评估一、引言1.微博概况作为最近几年兴起的一种媒介工具,微博以其片碎化内容,及时性,跨平台特征风靡全球。
2006年3月,博客技术先驱blogger创始人埃文·威廉姆斯(Evan Williams)创建的新兴公司Obvious推出了大围脖服务。
在最初阶段,这项服务只是用于向好友的手机发送文本信息。
后来Twitter被Alexa网页流量统计评定为最受欢迎的50个网络应用之一,成为比较流行的社交网站。
国外Twitter的“大红大紫”,令国内有些人终于坐不住了,校内,腾讯微博,新浪微博纷纷起来。
2010年国内微博迎来来春天,微博像雨后春笋般崛起,2009年诞生的新浪微博,由于具有大量公众人物用户这一优势,自推出之日起借助名人效应,轻松突破百万用户量。
据东方早报3月25日的消息称,新浪微博已成为目前中国用户数最大的微博产品。
所以本文就选取国内新浪微博作为实证研究对象。
2.文献综述我们对国内学术期刊中关于微博客的文献查找。
选取维普数据库作为数据来源(/),截止2011年6月29日,得结果来自《中文科技期刊数据库》1939篇,来自《仓储式在线出版平台》39409篇。
查看历史,截止2010年4月时,只有77篇研究“微博”的论文,可见伴随着微博的爆发性发展,国内对其研究也同步进行着。
添加关键字“新浪”我们得到来自《中文科技期刊数据库》116篇,本文研究的重点在于微博效果的评估,搜索关键“微博效果”紧得到《中文科技期刊数据库》2篇,分别是《微博营销效果评估的两个支点》,《媒体融合时代下微博的传播效果》,而这两篇文章的评估方法主要还是在定性上进行研究。
实际上微博评估体系目前尚不成熟,效累评估模式目前的争议也还比较大,目前人们初步较认可的评估手段主要从微博本身价值评估和微博传播活动两个方面进行考核。
而定性分析中由人民大学李齐写的《微博客传播效果研究——以新浪微博为例》(人民网,2010),通过对影响传播效果的各个因素分析,构造出一种效果评估体系。
本文将在这些文献参考的基础上运用一些统计方法,从量的角度出发分析数据,利用层次分析的方法得出传播效果的具体值。
现在微博传播方式也多种,主要是工具的多样,wap网站,手机短信,手机微博客户端等,甚至听周围人转述也是一种传播方式。
这里我们并没有把传播方式纳入到效果评估的因素中,实际上传播方式也影响着传播效果,但是影响的主要是宏观效果,而本文研究是微观方面的,所以不将传播方式考虑进去。
二、内容分析微博的内容由于传播主体的独立性和个性而丰富多彩,运用传播学理论的一些基本知识我们按照以下两个标准分类:1.是博主自己原创还是转述。
2.涉及的领域是公共领域,即公众议题,还是只是私人领域的小话题。
按照这样两个标准我们分成四类:1.自发话题:即自己原创的私人一些事情,如生活见闻,心情,私人愿望等。
2.转发话题:不是原创,通过转述别人的一些私人话题,如转发私人图片,评论某个人的博客,分享的一些小段子名言等。
3.自发议题:博主自己写的对社会的事情,热点的点评感想,或者对一些公益事业的宣传,一些行为的倡导。
4.转发议题:转述别人的公共话题,转发新闻,或转发别人对公共事件的点评等。
不同的内容反映不同人的动机和需求,这和不同人的职业,兴趣,生活习惯相关,而不同的内容引起的转发数和回复数必然也有差异,这和粉丝的兴趣有关。
现在我们研究一般微博用户议论内容的形式,以新浪微博为例通过微博广场随便看看一栏,我们知道每时每刻大家讨论的话题,现在我们抽取6月25日10:00,17:00,21:00时刻前100条微博内容形式进行观察,共300个样本。
得到如下结果:从图中看出微博用户自发话题较多,说明很多人喜欢通过微博对自己的生活感想或者自己的平常事用微博表达出来,64%的人都是原创微博,出自用户自己。
而37%的用户参与公共的议题,这也说明有不少人通过微博对自己周围或者社会热点事件议论,关注这些事情。
事实上,本次抽样只抽取6月25日的数据,样本相对较少,因此具体数据的说服力不强,但对用户的讨论聚集范围还是有一定的参考价值。
为了直观地研究各类微博的传播效果,对其进行评估,我们研究内容属性和回复量和转发量的关系,为此我们选取样本需要做到控制变量,对此进行有目的的抽样,必须微博的内容要尽量丰富,而且用户的粉丝数尽量不要相差太多,对此我们选择粉丝数在600万——700万的名人,并且来自不同的领域:何炅(知名主持人,粉丝670万),李开复(著名企业家,粉丝590万),黄健翔(体育评论员,粉丝600万),李冰冰(著名演员,粉丝)。
对他们6月份的微博进行抽样,得到310个样本,导入excel中用spss进行统计量描述,对内容类别用数字标号:自发话题=1,自发议题=2,转发话题=3,转发议题=4,1,2,3,4类分别得到描述结果如下:统计量1转发回复N 有效79 79缺失0 0均值1652.89 1291.06中值711.00 711.00众数293a98a标准差2370.407 1742.508偏度 2.948 2.615偏度的标准误.271 .271峰度10.095 6.900峰度的标准误.535 .535极大值13622 8602a. 存在多个众数。
显示最小值统计量2转发回复N 有效57 57缺失0 0均值2176.58 1125.68中值1531.00 770.00众数3214 620标准差2574.018 1460.923偏度 3.530 4.162偏度的标准误.316 .316峰度14.576 21.048峰度的标准误.623 .623极大值15010 9569统计量3转发回复N 有效94 94 缺失0 0 均值1630.67 612.99 中值970.00 453.00 众数3222a456 标准差1678.204 519.584 偏度 1.534 1.757 偏度的标准误.249 .249 峰度 1.889 2.741 峰度的标准误.493 .493 极大值7308 2459 a. 存在多个众数。
显示最小值统计量4转发回复N 有效74 74 缺失0 0 均值1895.74 741.07 中值1065.50 586.00 众数890 96a 标准差1703.922 722.650 偏度 1.607 3.350 偏度的标准误.279 .279 峰度 3.179 14.389 峰度的标准误.552 .552 极大值8761 4536 a. 存在多个众数。
显示最小值整理得到如下表:回复数我们选择了四个变量指标,实际上我们从统计结果中可以看出众数的意义不大,甚至对我们的结果会有误导作用。
结果显示,不同内容类型无论转发数还是说以数据的波动很大,而众数反映的是一组数据中出现次数最多的特征值,但是因为数据值大而且波动也大,出现相同数值的可能性很小,所以众数会有多个数,而结果显示确实有很多众数,所以用众数作为评判指标不好。
于是我们只选择均值,中位数,极大值。
平均值表示各类型转发(回复)量的平均水平;中位数表示各类型中转发(回复)量在最中间的数值,而极大值则表示最受关注的微博对应的转发(回复)数。
为了更直观看数据关系,我们处理结果如下:转发量从上图中我们可以看出,三个指标的变化趋于一致,而且我们看出类型2和类型4的转发量明显高于类型1和类型2,而1,3类型有个共同的就是都是议题,无论是自发的还是转发的,对于议题即社会的一些热点,公益,公共新闻,粉丝们更多地去参与转发,并且自发的议题转发量高于转发别人发出的议题,这也很容易解释,对于转发别的用户的议题,本身已经是属于次级传播,对于该议题的原始用户本身就有一定的转发量,所以对其进行再转发就要少一些了。
由此我们推出对于社会一些公共新闻,热点,公益等议题其转发程度很高,粉丝们更多地参与这些内容的转发,因此议题的的传播潜力和传播寿命更长,影响力更广。
而话题无论原创还是转发,其传播力都比较有限。
回复数上图中我们也可以看到三个指标变化基本一致,而且类型1和类型2的回复量明显高于3和4,也就是说粉丝更多地会参与到博主原创微博的交流中来,因为回复更多的是对微博评论或者自己的感想,就好比与博主进行交流,因此博主自己原创的微博有更多的回复。
转发的话题则回复最少,结合前面转发量我们可以看到转发话题的转发量都是最少的,此类微博潜力小,不容易引起粉丝的交流。
此外我们从极大值曲线看出,无论转发量还是回复量,都在比较高的水平,可见在微博转播过程中关注热度最高的还是社会热点、焦点,公共新闻等公众议题。
我们知道,转发数和回复量不是独立的,因为有部分粉丝不仅转发而且也回复,为了对此研究我们仍然用上述样本,在不同内容属性下对转发量和回复量相关性进行分析得到结果:从上表我们看出,对于博主(主要指人物)原创的微博,转发数和回复量相关性比较高,而非原创的微博则相关性低,说明对于博主原创微博,既转发也回复的粉丝相对而言比例要高一些。
三、传播主体研究据悉,截至4月底新浪微博注册用户数已超过1.4亿,预计年底前超过2亿用户,在社交网络里已经处于较领先的地位,并且任然以较快速度增长这。
如此多的用户我们更多的还是研究其活跃度互动。
对此我们可以将用户归类如下图:对于非活跃用户,他们尽管注册了账号,但是并不怎么使用,对于他们的研究就无意义,我们研究对象主要在活跃的用户。
我们将活跃用户分成主关注者(这类用户主要通过关注自己感兴趣人或者机构企业来了解信息,他们自己发微博数则很少。
),主被关注者(他们主要发微博,他们拥有大量的粉丝,通过微博进行互动交流。
)以及二者的交互部分。
主被关注者大部分为各行业名人,企业,机构等。
现我们用统计的一些分析方法对活跃用户进行研究。