当前位置:文档之家› 爱奇艺视频网站服务特性分析

爱奇艺视频网站服务特性分析

第6卷第2期 2017年3月 网络新媒体技术 V01.6 NO.2 Mar.2017 

爱奇艺视频网站服务特性分析 

卓 煜 2 尤佳莉 王劲林 

(‘中国科学院声学研究所 国家网络新媒体工程技术研究中心北京100190 中国科学院大学北京 100190) 

摘要:目前,视频服务已经成为用户浏览互联网时最关注的服务之一。因而,提升在线视频服务的用户体验具有重要的研究 价值。为此我们设计并实现了一个在线视频服务测量系统,利用部署在不同位置、运营商网络的测量节点设备测量在线视频 服务的性能,根据测量结果对视频服务网站的特性进行分析,进而提出优化建议。在本文中,我们提出了一种利用信息增益 的视频服务性能分析方法,基于此对视频服务测量系统采集的一个月的数据进行了深入分析和特征提取,验证了不同元数据 和服务质量之间的关系。研究发现,服务质量和测量节点的网络位置的关系最为显著,其他相关性较为显著的元数据包括测 量时间、视频分类和视频热度。 关键词:在线视频,视频特征,Q0S 

Characteristic of Online Video Service Analysis in lqiyi 

ZHUO Yu ,YOU Jiali ,WANG Jinlin 

( National Network New Media Engineering Research Center,Institute of Acoustics Chinese Academy of Sciences,Beijing 100190,China, University of Chinese Academy of Sciences,Beijing 100190,China) 

Abstract:Nowadays,video service have been one of the most interest service when user surf the Internet.Therefore,it’S has signifi— cant research value to raise the user’S experience of service.To this end,we proposed and implemented a Measuring System for Online Video Service,which can measure the quality metrics of online video by measurement nodes in diferent locations and different ISPs. Also the system can analysis the characteristic of online video service website and propose suggestion to optimization.In this paper,we perpose an analysis method based on Imformation Gain.With a dataset of one month data collected by the system,we analyzed deeply and did Feature Extraction,and verify the relationship between metadata and quality metrics.This work shows that the quality metrics have the strongest correlation with the location of measurement nodes.Other online video metadata as measure time,type of video and heat of video also play a role with quality metrics. Keywords:online video,video feature,QoS 

引 言 

目前,在线视频服务已经成为用户浏览互联网时最关注的服务之一。对互联网用户和视频服务商来说, 较好的视频服务QoS可能会带来较好的用户体验,既可以提升用户幸福感,又可以通过扩大市场占有率进 而提升内容提供商的广告收入。因此,视频服务QoS的实时获取,对视频服务源选择、用户广告推送策略等 

本文于2016—07—05收到。 基金项目:

智能电视平台与服务支撑环境研制(XDA06040501),中国科学院青年创新促进会(Y5291I1601)。 2 网络新媒体技术 2017年 

应用,都有较大价值。 

实际上,由于网络的动态性,带宽、延迟等指标在时间上并不稳定,如果对相关参数进行实时测量,一方 

面会增加服务延迟,另一方面会对正在进行的服务产生影响。因此,我们希望能在用户观看视频的时候就 能实时预测到每个用户的QoS。视频服务QoS预测是根据已有的测量结果预测用户观看视频时的网络性能 

参数,如何选择特征进行预测是关系到预测性能的关键问题之一。在视频服务中,网络性能参数可能和元 

数据有相关性,为了更好的研究我们的预测模型,本文将研究网络性能参数和元数据之间的相关性,基于较 强相关性的元数据来指导以后的预测模型研究,且这种研究方法可以有效的应用于后续视频服务测量和抓 

取的其他网络性能参数和元数据的分析。 

为了研究用户的视频服务体验(QoE),我们利用自己搭建的在线视频服务测量系统测量了1个月的数 据,并针对其中Iqiyi网站的数据进行了分析和研究。Iqiyi网站是中国最流行的在线视频服务提供商之一, 

并且在上一年度的多个排名中被评为最有影响力的视频网站。该系统能够利用部署在各处的测量节点和 

智能路由收集在线视频服务的服务质量指标数据,并对它们进行处理和分析。 

关于在线视频用户QoE的研究近年来不断涌现。研究了Skype通话中的QoE评估 ,研究了关于其他 媒体的QoE等 。我们的研究主要集中在在线视频服务。由于近十年来在线视频服务的兴起,关于在线视 

频服务QoE的研究比较丰富。已有的研究中分析了Youtube和Netflix中流媒体服务的网络特性 ,并指出 

根据不同的应用和容器可以观测到三种不同的流策略;研究了如何在网络接入服务层面利用被动测量监控 

YouTube的QoE ;研究了影响Youtube视频QoE的核心指标 ;研究了在线视频QoS指标如何对QoE指标 

造成影响 ;研究了在线视频QoE指标并提出了基于决策树的初步模型 ;研究了影响QoE估计的混杂因 

素并提出了基于决策树的进一步优化的模型,并分析了对QoE影响最大的元数据 。 

已有的研究数据收集主要基于播放器,没有进行主动测量,因而不易对网站的不同视频内容进行跟踪 考察,更多的关注了用户的属性而非视频的属性。另一方面,已有的研究更多的集中在国外,而我们的研究 

中使用的测量节点全部部署在国内。 

当前已有的研究成果,主要集中在基于在线测量信息,如QoS、服务策略等对用户体验的影响,然而对网 站信息与视频服务质量的关系并没有过多考虑。而本文主要研究网站元数据与在线视频服务质量之间的 

关系,着重考察的是不同元数据对应的视频的服务质量的异同。本文的主要贡献包括提出了一种利用信息 

增益的关系评估方法,对不同元数据类型和服务质量指标进行相关性评估。通过考察多种不同的元数据, 

如地区、测量时间、清晰度、热度、上线时间、发行地区、视频类型等,分析了他们与服务质量指标的相关性。 并利用该分析结果为我们预测服务质量指标提供指导。 

本文后面的部分将以如下方式组织:第一章介绍了测量数据集的特征和服务质量评估指标的定义;第 

二章介绍了我们所提出的基于信息增益的特征相关性评估方法,并对爱奇艺网站视频服务质量和元数据相 关性进行深入分析;第三章则对我们的研究进行了全面的总结,并对下一步工作进行了展望。 

1 视频网站数据测量和分析 

为了得到一定规模的视频服务QoS数据,我们设计并开发了一个视频网站测量分析系统,利用部署在 

各处的测量节点主动测量在线视频服务的网络性能参数,并且对相关在线视频服务的元数据进行抓取,并 

对测量结果进行收集和分析。我们采集了2015.8.1 00:00:00—2015.8.31 23:59:59期间对爱奇艺网站部 分视频的网络性能参数测量结果,主要QoS指标包括: 

(1)延迟:从发出播放请求到视频开始播放的延迟。 

(2)下载速率:播放过程中,从视频网站获取视频时的下载速率。并进行了不同指标累计分布的分析, 见图1和图2。 由图1、图2可知,我们所测量的网络性能参数均呈现长尾分布,少部分测量结果偏离平均值非常远。

 2期 卓煜等:爱奇艺视频网站服务特性分析 3 

为了减少少量偏离值很高的数据对讨论结果的影响,分析元数据与测量结果关系时,我们去除了延迟最高 

的5%的数据(即延迟在1 s一26s间的测量数据)和带宽最高的5%的数据(即带宽在120000kbit/s以上的部 分),整理和清洗后的数据集共计有206788条测量结果。 

6 

4 

2 

O l 19 20 dela ̄,/s 延迟概率密度分布 0.005 

0.004 

O.o03 0 0.002 

O.001 

0 PDF 

10000 29oo()0 3o0000 bandwidth(kbit/s) 带宽概率密度分布 

为了深入理解不同元数据对服务性能的影响,本文中我们收集和分析的元数据如下: 

(1)视频测量时间:对对应视频进行测量的时间,本文分 表1各测量节点的属性及所测结果数 

析中,将视频测量时间做为一天中的不同时间点进行考虑。 (2)视频清晰度:所测量视频的清晰度,我们测量了爱奇 

艺网站的三个清晰度,1一超清(1920×832);2一高清 (1280×560);3一标清(640×272),数据集中包含超清视频 

测量结果2878条,高清视频测量结果101630条,标清视频测 量结果102280条。 

(3)视频测量节点地理位置:我们收集了视频测量节点 

的IP,以及对应的地理位置和所属运营商,各测量节点所测 量到的结果数见表1。 

(4)视频热度:以周点击量在100名之内的视为热门视 频,周点击量在300名之外的视为冷门视频。我们的数据集 

中共测量到热门视频108406条,冷门视频98382条。 (5)视频新旧:将18个月内上线的视频分为较新视频,18个月之前上新的视频视为较旧视频。我们的 数据集中共测量到较新视频103684条,较旧视频103104条。 

(6)视频发行地区:包括中国大陆地区、港澳台地区、海外地区。我们的数据集中共测量大陆地区的视 频95221条,港澳台地区46444条,海外地区65123条。 (7)视频内容分类:包括电视剧、电影、综艺节目。我们的数据集中共测量到电视剧80959条,电影 68999条,综艺56830条。 

基于上述所采集的信息,我们研究视频服务性能与元数据间的关系。 

2 一种基于信息增益的视频特征相关性研究方法 

2.1信息增益法 信息增益法是基于Shannon研究“信息内容”方面的工作。以lnfo(D)表示对D中元组进行分类的期望 信息,定义见式(1): 

Info(D)=一∑pilog (p ) i=l 2 图 0 l 图 0

相关主题