当前位置:文档之家› 微博美妆视频博主影响力评价与比较实证研究

微博美妆视频博主影响力评价与比较实证研究

应用统计学作业题目:微博美妆视频博主影响力评价与比较实证研究目录微博美妆视频博主影响力评价与比较实证研究 (2)引言 (2)1问题提出与描述 (3)2数据收集 (4)3模型建立 (5)3.1回归模型建立 (5)3.2数据指标体系构建 (6)4运算与结果分析 (7)4.1线性回归的结果及分析 (7)4.1.1整体评价指标 (8)4.1.2回归系数检验 (8)4.1.3共线性检验 (9)4.1.4残差分析 (9)4.1.5最优方程 (11)4.1.6结论 (11)4.2微博影响力因子分析过程 (11)4.2.1指标相关性及适用性检验 (11)4.2.2提取公因子 (13)4.2.3因子得分及讨论结果 (15)4.2.4总结 (16)4.3微博影响力聚类分析过程 (17)4.3.1聚类分析方法 (17)4.3.2确定类别数目 (17)4.3.3聚类结果分析 (18)4.3.4结束语 (1)5结论 (20)微博美妆视频博主影响力评价与比较实证研究摘要:以25个微博视频作为研究样本,甄选出4项一级指标、10项二级指标,建立美妆视频博主影响力体系,找出影响微博美妆视频博主影响力的关键因素,并运用因子分析法和聚类分析法,进行微博美妆视频博主影响力评价与比较实证研究。

关键词:美妆博主;微博影响力;因子分析;聚类分析引言作为新一代互联网的核心,新媒体的飞速发展已经颠覆了营销媒体的传统格局。

新媒体营销不仅已成为企业不可或缺的一种新的营销方式,而且鉴于其未来无限的发展潜力,很多有前瞻眼光的企业已经明确提出了新媒体营销战略。

新媒体是指利用数字技术、网络技术和移动通信技术,通过互联网、宽带局域网、无限通信网和卫星等渠道,以电视、电脑和手机为主要输出终端,向用户提供视频、音频、语音数据服务、连线游戏、远程教育等集成信息和娱乐服务的所有新的传播手段或传播形式的总称。

新媒体种类丰富,包括虚拟社区、博客、播客、微博、社交网、微信等,国内知名的新媒体网站有天涯社区论坛、新华播客、新浪微博等。

新媒体时代人人都是媒介,人人都有话语权。

微博以其平台多样化、信息共享便捷迅速、内容短小精悍等优势,在新媒体中异军突起,以短短140字推爆了全世界,让个人拥有了巨大的媒体影响力。

明星微博的粉丝动辄几百万,甚至数千万;现实世界里默默无闻的普通网民摇身成为拥有数十万乃至数百万粉丝的微博明星,也已悉数平常。

业已展现强大力量的微博自然成了企业新媒体营销战略的焦点,微博营销几乎已是新媒体营销的代名词。

企业纷纷建立自己的公众微博,用以发布最新的产品品牌信息,并增强与消费者的互动。

自然界中任何事物都是普遍联系的,客观事物之间往往都存在着某种程度的关联关系。

为了研究变量之间的相关关系,人们常用回归分析的方法,而回归分析是数理统计中一种常用方法。

数理统计作为一种实用有效的工具,广泛应用于国民经济的各个方面,在解决实际问题中发挥了巨大的作用,是一种理论联系实践、指导实践的科学方法。

作为社会化的自媒体,微博以交互性、即时性、广覆盖、裂变式传播、去中心化等特点,显示了其他传统媒体无法比拟的优越性和独特性,受到了越来越多网络用户的欢迎和青睐。

微博作为一个信息分享、传播和获取平台,为公众提供了自由、开放的话语空间,释放社会焦虑的重要载体、公共舆论的场域和“亮出自己声音的绝佳平台。

1问题提出与描述学界已有一些关于微博主影响力评价的研究,业界也有影响力排名榜单,如著名的微博主影响力排名榜——微博风云榜等。

但现有的评价体系存在两个主要问题:一是缺乏系统性;二是指标确定的主观性较大,客观科学性相对不足。

如何科学地遴选指标,是构建微博主影响力评估体系必须解决的核心问题。

本研究的目标是在媒介影响力形成理论的指导下,构建一个更为客观的微博主影响力评价指标体系。

微博上有许多视频博主,都经营着不同的类别。

近期,关于美妆的视频博主呈井喷式爆发,对美妆视频博主的关注度也呈显著上升的趋势,这其中有许多的利益相关的方面,由此带来的广告收入将是一笔巨大的资产,通过了解究竟是什么影响了微博美妆博主影响力的因素也是一个很有趣以及很重要的话题。

因此本文选取微博美妆视频博主作为研究对象,一个微博的影响力如何,可以从一定程度上反映其盈利情况以及广告推广的能力等,一个微博影响力水平越高,则越能引领传播的生态以及言论的生态。

因此本文选取微博美妆视频博主为对象进行分析,并在进行微博用户行为挖掘和归纳的基础上,构建微博影响力评价指标体系,并以25个微博美妆视频博主为研究对象,以回归分析为方法,运用数理统计工具探求月互动数与各种统计指标之间的关系,总结主要影响因素,并对其作用、前景进行分析和展望。

最后因子分析法以及聚类分析法对微博美妆视频博主影响力水平进行定量分析、评价和比较,为鉴定微博美妆视频博主的实际价值以及其发展方向等方面提供科学依据。

2数据收集首先进行参考数据的选择,将直接实时从微博上收集数据,参考以往相关研究的论文,归纳出可能影响微博博主的一些主要因素,其中,由于选择的是美妆视频博主,因此专业视频数量以及最热门视频播放数(万)也是一个很重要的指标,其中专业微博比=专业微博数微博数×100%最后本文从中选取了粉丝数(人),金V互动数(人),抽奖数(个),专业微博比(%),最热门视频播放量(万)5个因素作为本次考查的重点,并对其与月互动数的相关关系进行分析,其中月互动数为转发数、评论数、点赞数之和。

选取随机抽取的美妆视频博主于2018年9月9日至2018年10月9日1月间月互动数与选取变量的数据汇总。

将直接实时收集抽取的美妆博主一个月的数据,参考以往相关研究的论文,归纳出可能影响微博博主的一些主要因素,其中,由于选择的是美妆视频博主,因此专业视频数量以及最热门视频播放数是一个很重要的指标,其中最后本文从中选取了转发数、评论数、点赞数、微博数、粉丝数、专业微博数、金V互动数、抽奖数、阅读数(万)、最热门视频播放量这10个因素作为本次分析的重点。

3模型建立3.1回归模型建立为了研究月互动数与各种影响因素的关系,必须要建立二者之间的数学模型。

数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型等等。

而实际生活中,影响月互动数的因素很多,并且这些因素的影响不能简单的用某一种模型来描述,所以要建立此类数学模型往往是很难的。

但是为了便于研究,我们可以建立月互动数与各影响因素的线性回归模型,模型如下:Y=α1X1+α2X2+α3X3+α4X4+α5X5其中,是因变量, 是自变量,是各个自变量的系数。

各变量符号的定义见表3.1.1。

表3.1.1 各变量符号定义表3.2数据指标体系构建笔者深入观察微博美妆视频博主的微博各页面要素,对美妆微博中各用户行为进行分析、挖掘和归纳。

根据用户不同进行划分,可以将美妆微博中的用户行为分为博主行为和其他用户行为。

博主行为包括转发数、评论数、金V互动数、微博数、粉丝数、阅读量、被赞数、专业微博数、抽奖数、最热门视频播放量。

根据行为性质和功能不同,可以将美妆微博中的用户行为分为互动数、活跃度、关注度、专业性四个方面。

如图3.2.1示图3.2.1 美妆微博用户行为分析根据微博官方发布的影响力评价系统以及笔者长期深入关注美妆视频博主的各方面要素,通过对微博各用户行为的归纳整合,设计出4个一级指标以及10个二级指标。

见表3.2.1表3.2.1 数据指标设计4运算与结果分析4.1线性回归的结果及分析利用统计数据建立回归模型,用SPSS软件的线性回归分析功能,得到以下数据。

首先在打开的“线性回归”对话框中(图4.1.1),先从变量列表中选择因变量(影响力),以及自变量(粉丝数、金v互动数、抽奖数、专业微博比、最热视频播放量),再选择方法“进入”。

按下“ok”后,就可得到分析结果。

我们得到的第一个重要结果是五个自变量的回归系数α以及常数。

于是,初步估计的回归函数为:影响力(月互动数)=-11327.331+0.16 粉丝数+2686.641 金V互动数+2119.726 抽奖数+406.552 专业微博比+1.614 最热视频播放量图4.1.1 “线性回归”对话框4.1.1整体评价指标在此模型中,决定系数为R²=0.726,值R=0.852是多维相关系数。

修正后R²为0.654,残差的标准误差为24911.405。

R表示拟合优度,它是用来衡量估计的模型对观测值的拟合程度。

它的值越接近1说明模型越好。

调整的R平方比调整前R平方更准确一些,图中的最终调整R方为0.726,表示自变量一共可以解释因变量72.6%的变化,即说明72.6%的影响力波动由这五个自变量解释,对此次模型研究有相对较高额比例。

其中F值为10.065,显著性sig为0.000,因而不存在接受零假设的问题。

4.1.2回归系数检验我们已得到回归系数,且“系数”表格中第二列给出了回归系数的标准误差,:表4.1.1 置信区间95%和共线性统计量表4.1.1显示了三个回归系数及常数的置信区间(95%置信区间)。

可以看出,五个回归系数中,变量金V互动数的系数具有最大的置信区间,因此它的估计是最不精确的。

不过,常数的估计更不精确。

其中,系数表中第五列为显著性检验。

我们发现,前三个自变量都比通常要求的显著水平0.05低,因此,可以认为这三个自变量的影响都是显著的。

而专业微博比与最热视频播放量的显著性较大。

4.1.3共线性检验为了查明共线性,第一步应检验相关矩阵中回归自变量间可辨认的相关性(表4.1.2)。

表4.1.2 相关矩阵由表中看,自变量中不存在显著的相关性,但是专业微博比与最热视频播放量的相关系数都大于0.5,接近于1。

此时再检查表4.1.1中容许度和方差膨胀因子(VIF)。

根据现有的数值,未发现显著的共线性。

根据上述步骤,因此不考虑剔除自变量,最后进行残差分析。

4.1.4残差分析检验设计随机误差项分布的线性回归模型前提时,我们要用到残差,因为随机误差项是不可观察的,表4.1.3中列出了残差相关统计资料。

表4.1.3 残差统计资料殘差統計資料a最小值最大值平均數標準偏差N 預測值-5644.4976 116722.4531 47662.8000 35994.63123 25 殘差-33713.12109 60249.76953 .00000 22293.77345 25 標準預測值-1.481 1.919 .000 1.000 25 標準殘差-1.380 2.467 .000 .913 25a. 應變數: 影响力(月互动数)图4.1.2 标准化残差直方图图4.1.3 标准P-P图标准化残差的P-P图通过比较样本残差分布与假设的正态分布是否相同来检验残差是否符合正态分布,所有残差点都分布在对角的直线附近,说明残差的正态性假设基本成立。

相关主题