北京航空航天大学2012-2013学年第一学期期末《视频编码技术及其应用》课程大作业班级_____学号__________姓名____________成绩 _________2012 年1 月5日下一代视频编码标准HEVC分析研究(北京航空航天大学计算机学院)目录摘要 (3)关键字 (3)Abstract (3)Key Words (3)1、引言 (3)1.1背景简介 (3)1.2当前视频编码的主要挑战 (4)1.3 H.264的缺点 (5)1.4 HEVC的主要特征 (5)2、HEVC技术分析 (6)2.1 灵活的编码结构 (6)2.2 多方向帧内预测 (7)2.3 大尺度DCT变换 (7)2.4 自适应采样点补偿 (7)2.5 并行化的熵编码 (7)3、结论 (8)4、参考文献 (8)摘要下一代视频编码标准HEVC是继H.264之后视频编码领域的又一重大突破,该标准主要针对目前日益盛行的高清、超高清视频而开发,在克服H.264标准不足的同时,提出了多种针对高清视频编码的新技术。
本文首先介绍了视频编码的背景和当前视频编码领域的主要挑战,随后分析了H.264编码标准的不足之处,进而引出了下一代视频编码标准HEVC。
通过对HEVC中一些新技术的分析介绍,阐明了HEVC在高清视频领域的优势,对于详细了解HEVC的框架结构有提纲挈领的作用。
关键字视频编码;HEVC;超高清视频编码;自适应采样点补偿;并行化熵编码AbstractHEVC(High Efficiency Video Coding) is another breakthrough in video coding field after H.264, it concentrates on High Definition or Super High Definition video coding. In this paper, the background of video coding and some challenges of current video coding field is introduced first. After analysing some shortages of H.264, the author brings out the features of HEVC. The advantages of HEVC in High Definition video coding is clarified by analysing some new technologies in HEVC. This paper will be a introduction to details about HEVC.Key WordsVideo Coding; HEVC; Super High Definition Video Coding; Sample Adaptive Offset; Parallelization of Entropy Coding1、引言1.1背景简介当前世界上的视频编码标准主要来源于国际电信联盟(ITU-T)的视频编码专家组VCEG和国际标准化组织(ISO)的运动图像专家组MPEG,他们基于不同的应用需求,分别制定了H.26x和MPEG系列视频编码标准。
ITU的H.26x系列标准主要应用在实时的视频通信系统中,而MPEG系列标准则主要用于数字监控系统、视频存储、广播电视及因特网领域[1]。
2001年MPEG和VCEG又成立了视频联合工作组JVT,制定了H.264/AVC(即MPEG-4的第10部分)视频编码标准。
H.264标准使得视频压缩效率提高到了一个加,H.264编码标准已不足以应对高清和超高清视频编码的应用,这就为更高效的视频编码标准的提出奠定了前提。
2010年1月,VCEG和MPEG开始发起下一代视频压缩技术正事提案,相关技术由视频编码联合组(JCT-VC)审议和评估。
所收到的27个提案从增加编码复杂度、提高压缩效率,或者从保证编码质量、降低编码复杂度的角度出发,讨论如何在H.264/A VC的基础上进一步提高编码性能。
下一代视频压缩标准主要面向高清电视(HDTV)以及视频捕获系统的应用,提供从QVGA至1080P以及至超高清电视(7680×4320)不同级别的视频应用,其名称定为HEVC(High Efficiency Video Coding)或H.265。
其核心目标在于:在H.264/AVC High Profile 的基础上,对高分辨率/高保真的视频图像压缩效率提高1倍,即在保证相同视频图像质量的前提下,视频流的码率减少50%[2]。
1.2当前视频编码的主要挑战随着数字视频应用产业链的快速发展,特别是从2005 年高清数字视频的普及应用开始,原有的标清数字视频应用已经快速走向淘汰,数字视频的应用格式从720 P 到1080 P,数字视频帧率从30 fps 到60 fps,短短几年就不断的突破发展。
高清数字视频相对于原来的标清数字视频,不只是分辨率的提升,还有以下的显著特点[3]:(1) 宏块个数爆发式增加以前的标清数字视频,比如PAL格式的标清视频,分辨率为720×576,帧率为25fps,每秒钟的宏块个数(假设宏块大小为16×16)为:(720×576×25)/(16×16) = 40500;但是一个720P的高清视频,分辨率为1280×720,帧率为60fps,其每秒钟的宏块个数为:(1280×720×60)/(16×16) =216000,是PAL 数字视频的5.3 倍;一个1080P的高清视频,分辨率为1920×1080,帧率为60 fps,其每秒钟的宏块个数为:(1920×1088×60)/(16×16) =489600,是PAL 数字视频12.1 倍。
由此可见,高清或超高清视频格式下,每帧内的宏块个数相对于标清有爆发式的增加。
(2) 运动矢量数值大幅度增加相对于一个PAL(720×576)制式的标清数字视频,如果物体在两帧时间内从画面左侧高速运动到画面右侧,其运动矢量就是720,但是对于1080P(1920×1080)的高清数字视频,如果物体在两帧时间内从画面左侧高速运动到画面右侧,其运动矢量就是1920 了。
由此可见,在高清和超高清视频格式下,对于运动矢量的描述,需要更大的数据结构。
(3) 宏块内容复杂度降低以前的标清数字视频,需要在一个有限的分辨率画面中包含尽可能多的画面内容,因此平均分配到一个宏块中的画面内容就会比较复杂,而进入高清数字视频之后,摄像头的摄像角度基本上没有太多的增加,但是由于分辨率的增加,因此平均分配到每个宏块中的画面内容相对会更加简单,如图1[3]所示,左侧为低分辨率中一个宏块包含的内容,右侧表明高分辨率下同样的内容分到多个宏块中了,相对来说每个宏块的内容复杂度已经大大降低,由此,可以设计更加高效的运动估计方法来提高单个宏块的编码效率。
图1 宏块内容复杂度降低1.3 H.264的缺点高清视频的出现和普及使得H.264编码技术在很多方面都疲于应付,越来越不能适应高清编码的需要。
主要变现在以下几个方面[3]:(1)宏块个数的爆发式增长,会导致每个编码宏块的预测模式、运动矢量、参考帧索引和量化级等宏块级的参数信息在海量的高清数字视频宏块个数中,占用太多的码流资源,在有限的带宽资源中,分配给真正描述图像内容的残差系数信息的可用带宽明显减少了。
(2)单个宏块内容复杂度的降低化,导致一个4×4 或8×8 块内的变换系数也倾向于低频化,相邻的4×4 或8×8 块变换后的低频系数相似程度也大大提高,也就是说,以4×4 或8×8 为单位的变换并不能提高低频系数的压缩效率,由于变换块的颗粒度太小,会导致高清数字视频编码时,在相邻的变换块之间出现大量的数值比较接近的低频系数。
(3)在H .264 的宏块信息中,对于一个单向预测的宏块,H .264 的水平运动矢量和垂直运动矢量的和最小为2 最大为32,对运动矢量的预测使用的是哥伦布指数编码[4],该编码方式的特点是数值越小使用的比特数越少,由于高清数字视频的应用,运动矢量数值会大幅度增加,导致的结果就是用来描述运动矢量数值的比特数也大幅度增加。
(4)H .264 使用的熵编码方式为CA VLC(适应性变动长度编码法)[5]和CABAC(适应性二元算术编码)[6] 2种,这2 种都是基于上下文的编码方法,都要求编码过程为串行编码,由于并行度太低,这种方式在H .264 的产业化实现过程中,特别是针对GPU/DSP/FPGA/ASIC 等并行化程度非常高的CPU,熵编码和熵解码的串行化处理是非常浪费资源的。
由此可见,在高清视频盛行的今天,H.264似乎已走到尽头,需要一种更加高效的视频编码技术来代替H.264标准。
1.4 HEVC的主要特征HEVC主要是在原H.264/AVC的编码框架上,提出更先进的改进技术,包括扩展的编码单元尺寸、基于块的更灵活的帧间/帧内预测方式、大尺寸块的变换、新的熵编码方法、更加复杂的内插滤波器等[7,8]。
HEVC进行了大量的技术创新[8],优点主要体现在:(1)压缩效率更高。
(2)视频质量更高。
(3)健壮性更好。
(4)对IP网络的友好性好。
2、HEVC技术分析2.1 灵活的编码结构HEVC定义了3种类型的单元,包括编码单元(CU)、预测单元(PU)和变换单元(TU)[9]。
1幅图像可以被分为多个片,而1个片又可以被分为多个最大编码单元(LCU),一个最大编码单元又可以分为4个编码单元。
HEVC定义了5种尺寸类型的编码单元:128×128(LCU)、64×64、32×32、16×16、8×8(SCU),而不仅限于H.264中的16×16大小的固定单元。
预测单元被定义为编码单元的支节点,预测单元的尺寸可以是方块也可以是矩形,可根据需要进行设定,但其尺寸最大不应超过相应编码单元的尺寸。
而变换单元则是针对正交变换和量化。
这三个单元的分离,使得变换、预测和编码三个环节的处理更加灵活,也有利于各环节的划分更加符合视频图像的纹理特征,有利于各个单元更优化的完成各自的功能[10]。
三种类型的单元如图2所示:图2 三种类型的单元图像首先以最大编码单元(LCU)为单位进行编码,在LCU内部按照四叉树结构进行子块划分,直至成为最小编码单元(SCU)。