视频编码
MPEG2有两个大的特点,一个是运动补偿带来的高压缩比,另一个就是 根据不同的需求,通过参数的调节做到码率可变。 以下是几种典型应用: 1、数字化片库:压缩比的提高对节目的存储所需要的资源大大降低。采 用基于MPEG2的数字化节目库可以以较小的成本取得很好的效益。 2、节目传输:高压缩比和可变的输出码率使得MPEG2技术在节目传播应 用上发展迅速。在低至1.5MBIT/S的码率下,MPEG2数据流仍然能提供相 当的图象质量,因此目前的模拟电影频道甚至可以传送四路电视节目。这 在地面广播、有线电视和卫星广播上都很有吸引力,可以节约大量的成本。 3、高清晰度电视:由于高清晰度电视的分辨率很高,带来的问题是所需 的节目传输带宽很高,必须使用高压缩比才有可能传送高清晰度电视。在 这一点上,目前只有MPEG2技术能够胜任。 4、在数字化视频磁带、激光视盘、电视会议以及数字照相机等方面, MPEG2也具有很广的应用前景。
I帧编码是采用帧内编码方式,为了减少空间域冗余, P帧和B帧是采用帧间编码方式,为了减少时间域冗余。
编码过程可以简单归纳如下: 第1步: 选择一个I帧、P帧或B帧; 第2步:在B帧或P帧情况下执行运动补偿; 第3步:对8×8块进行DCT变换; 第4步:对变换后得到的系数进行量化; 第5步:进行变长编码。
4. 量化 H.264中可选52种不同的量化步长,步长是以 12.5%的复合率递进的,而不是一个固定常数
H.264编码
5.熵编码 视频编码处理的最后一步就是熵编码,在H.264中采用了 两种不同的熵编码方法:通用可变长编码(UVLC)和基于文 本的自适应二进制算术编码(CABAC)。
H.264典型应用
视频部分包含视频数据的编码方式以及解码过程。采用的编 码方式是混合编码方式。 音频部分包含了音频数据的编码表达式以及解码过程。
MPEG-2视频编码
MPEG-2有三种编码方式:
1.帧内压缩编码方式 2.帧间压缩编码方式 3.帧内及帧间压缩编码方式
MPEG-2视频编码
MPEG中有3种帧: .独立帧(Intraframes),又称为I帧,它被单独编码; .预测帧(Predicted frames),又称为P帧,它要依据前1个I帧或P帧进行编码; .双向参考帧(Bi-directionally interpolated frames),又称为B帧,它要同时参 考前1帧和后1帧进行编码。通过对运动矢量和DCT系数进行游程编码,就可以大量减 少图象的bit数。
H.264编码
编解码流程主要包括5个部分:
帧间和帧内预测(Estimation)、变换(Transform)和反变换、 量化(Quantization)和反量化、环路滤波(Loop Filter)、熵 编码(Entropy Coding)。
1.帧内预测编码 帧内编码用来缩减图像的空间冗 余。 H.264提供9种模式进行4×4像素 宏块预测,对于图像中含有很少 空间信息的平坦区,H.264也支持 16×16的帧内编码 包括1种直流预测和8种方向预测。 9种亮度预测模式,4种色度预测 模式
AVS视频编码
AVS视频标准定义了I帧、P帧和B帧三种不同类型的图像 I帧中的宏块只进行帧内预测 P帧和B帧的宏块则需要进行帧内预测或帧间预测 预测残差进行8×8整数变换(ICT)和量化,然后对量化系数进行zig-zag 扫描(隔行编码块使用另一种扫描方式),得到一维排列的量化系数,最 后对量化系数进行熵编码。 AVS视频标准的变换和量化只需要加减法和移位操作,用16位精度即可完 成。 AVS视频标准使用环路滤波器对重建图像滤波,一方面可以消除方块效应, 改善重建图像的主观质量;另一方面能够提高编码效率。滤波强度可以自 适应调整。
H.264简介
H.264标准和MPEG-4第10部分(正式名称是ISO/IEC 14496-10)在编解码技术 上是相同的,这种编解码技术也被称为AVC,即高级视频编码。 H.264是国际标准化组织(ISO)和国际电信联盟(ITU)共同提出的继MPEG4 之后的新一代数字视频压缩格式,它即保留了以往压缩技术的优点和精华又 具有其他压缩技术无法比拟的许多优点。 1.低码率(Low Bit Rate):和MPEG2和MPEG4 ASP等压缩技术相比,在同 等图像质量下,采用H.264技术压缩后的数据量只有MPEG2的1/8,MPEG4的1/3。 显然,H.264压缩技术的采用将大大节省用户的下载时间和数据流量收费。 2.高质量的图象:H.264能提供连续、流畅的高质量图象(DVD质量)。 3.容错能力强:H.264提供了解决在不稳定网络环境下容易发生的丢包等 错误的必要工具。 4.网络适应性强:H.264提供了网络抽象层(Network Abstraction Layer),使得H.264的文件能容易地在不同网络上传输(例如互联网,CDMA, GPRS,WCDMA,CDMA2000等)。
MPEG-2压缩编码
2. 时间上的冗余
使用有运动补偿的帧间预测。 对于活动图像多数情况下只是其中的很少一部分图像在运动, 即使有大范围的活动部分,前后帧尽管有很大区别,但移动 物体本身大多数情况下是相同的。因此只需要找到图像中某 一部分运动了多少就可以在前一帧找到相应图像的内容,这 个查找过程称为运动估值,其表达方式是运动矢量;而把前 一帧相应的运动部分补过来,得到其剩余的不同部分的过程 称为运动补偿。就这样,采用运动补偿可以有效地去除视频 信号在时间方向的重复信息,达到压缩的目的。
MPEG-2、H.264和AVS
MPEG-2标准简介
MPEG-2标准由系统、视频、音频三个主要部分组成。
系统部分描述音频、视频以及其他数据基本码流之间如何复 用成单一码流,并保证基本流之间的同步关系。系统层有两 种组成方式:程序流(PS)和传输流(TS)。视频、音频等 基本码流先打包成PES,再复用成适合于传输用的传输流和适 合于存储用的程序流。
宏块分割
H.264编码
3.整数变换
在变换方面,H.264使用了基于4×4像素块的类似于DCT的 变换,但使用的是以整数为基础的空间变换,不存在反变换因为取 舍而存在误差的问题,变换矩阵如图5所示。与浮点运算相比,整 数DCT变换会引起一些额外的误差,但因为DCT变换后的量化也存 在量化误差,与之相比,整数DCT变换引起的量化误差影响并不大。 此外,整数DCT变换还具有减少运算量和复杂度,有利于向定点 DSP移植的优点。
高标清H.264录播系统提供优良画质的数字视音频内容播放, 并支持多网络安全应用,如下图例: H.264高标清视音频编码器 视频发布及数据库服务器
AVS简介
AVS是我国具备自主知识产权的第二代信源编码标准,是《信息技术 先进 音视频编码》系列标准的简称,其包括系统、视频、音频、数字版权管理 等四个主要技术标准和符合性测试等支撑标准。 编码效率比较:MPEG-4是MPEG-2的1.4倍,AVS和AVC相当,都是MPEG-2 两倍以上。 AVS标准三大特点: 1. 我国牵头制定的、技术先进的第二代信源编码标准——先进; 2. 领导国际潮流的专利池管理方案,完备的标准工作组法律文件——自主; 3. 制定过程开放、国际化——开放
H.264编码
2.帧间预测编码
帧间预测编码利用连续帧中的时间冗余来进行运动估计和补偿。 H.264的运动补偿除了支持P帧、B帧外,H.264还支持一种新的流间传送 帧——SP帧
H.264的运动估计有以下4个特性: (1)不同大小和形状的宏块分割 (2)高精度的亚像素运动补偿 (3)多帧预测 (4)去块滤波器
AVS视频编码
帧内预测:基于8×8块,5种亮度预测模式,4种色度预测模式 运动补偿变块大小:16×16、16×8、8×16、8×8 变换与量化:8×8整数变换,编码端进行变换归一化,量化与变换归一化相 结合,通过乘法、移位实现 熵编码:上下文自适应2D-VLC,编码块系数过程中进行多码表切换 环路滤波:基于8×8块边缘进行,简单的滤波强度分类,滤波较少的像素, 计算复杂度低
AVS与MPEG-2、MPEG-4 AVC/H.264使用的技术 对比和性能差异估计
MPEG-2压缩编码
3.量化(量化是一种破坏性压缩技巧)
量化后的资料再还原时与原来的资料不会全然相同,因此视讯压缩后失真 的程度,主要便取决于量化位阶(Quantization Scale)的选取。 主要有两个功能:一是让原已很接近零的值尽量变成零,另外则是使得原 来非零的系数分布范围变小,有助于压缩。
AVS应用及特点
Βιβλιοθήκη 主要面向高清晰度和高质量数字电视广播、网络电视、数字存储媒体和其 他相关应用。 具有以下特点: (1)性能高,编码效率是MPEG-2的2倍以上, 与H.264的编码效率处于同一水平; (2)复杂度低,算法复杂度比H.264明显低, 软硬件实现成本都低于H.264; (3)我国掌握主要知识产权,专利授权模式 简单,费用低
AVS视频编码
AVS视频与MPEG标准都采用混合编码框架,包括变换、量化、熵编码、 帧内预测、帧间预测、环路滤波等技术模块,这是当前主流的技术路线。 AVS的主要创新在于提出了一批具体的优化技术,在较低的复杂度下实现 了与国际标准相当的技术性能,但并未使用国际标准背后的大量复杂的专 利。AVS-视频当中具有特征性的核心技术包括:8x8整数变换、量化、帧 内预测、1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去 块效应环内滤波等。
4.VLC和RLC(无损数据压缩)