当前位置:文档之家› 第三章 视频压缩编码的基本原理和方法-上课用-有删减

第三章 视频压缩编码的基本原理和方法-上课用-有删减


符号冗余也称编码表示冗余,又称信息熵冗余。信息 熵指一组数据携带的平均信息量。这里的信息量是指 从N个不相等可能事件中选出一个事件所需要的信息度 量,即在N个事件中辨识一个特定事件的过程中需要提 问的最少次数(=log2N比特)。将信息源所有可能事 件的信息量进行平均,得到的信息平均量称为信息熵。 符号冗余、空间冗余和时间冗余统称为统计冗余,因 为它们都取决于图像数据的统计特性。
视频压缩编码的基本原理和方法
视频压缩编码的必要性

数字化后的视频数据量十分巨大,不便于传输和存储。单 纯用扩大存储容量、增加通信信道带宽的办法是不现实的。 而数据压缩是个行之有效的方法,通过数据压缩手段把信 息的数据量压下来,以压缩编码的形式存储和传输,即紧 缩节约了存储空间,又提高了通信信道的传输效率。
时间冗余

这是序列图像表示中经常包含的冗余。序列图像(如电视 图像和运动图像)一般为位于时间轴区间内的一组连续画 面,其中的相邻帧往往包含相同的背景和运动物体,只不 过运动物体所在的空间位臵略有不同,所以后一帧的数据 与前一帧的数据有许多共同的地方。变化的只是其中某些 地方,这就形成了时间冗余。
符号冗余

结构冗余

数字化图像中的物体表面纹理等结构往往存在着冗余,这 种冗余称为结构冗余。当一幅图有很强的结构特性,纹理 和影像色调等与物体表面结构有一定的规则时,其结构冗 余很大。 有些图像的纹理区,像素值存在明显的分布模 式,例如,方格状的地板图案等。(已知分布模式,可以 通过某一过程生成图像。)
知识冗余

由图像的记录方式与人对图像的知识差异所产生的冗 余称为知识冗余。人对许多图像的理解与某些基础知 识有很大的相关性。例如,人脸的图像有固定的结构, 比如说嘴的上方有鼻子,鼻子的上方有眼睛等等,这 类规律性的结构可由先验知识和背景知识得到。但计 算机存储图像时还得把一个个像素信息存入,这就是 知识冗余。根据已有知识,对某些图像中所包含的物 体,可以构造其基本模型,并创建对应各种特征的图 像库,进而图像的存储只需要保存一些特征参数,从 而可以大大减少数据量。知识冗余是模型编码主要利 用的特性。
视频压缩编码的发展



香农(Shannon)的信息论,即以经典的 集合论为基础基于某种统计概率模型来 描述信源。 香农信息论的缺陷:一是没有考虑信息 接受者的主观特性;二是撇开了事件本 身的具体含义、重要程度和引起的后果 但是香农信息论具有高度的概括性和综 合性,因此得到广泛的应用。
MPEG,活动图像专家组
视觉冗余

事实表明,人类的视觉系统对于图像的敏感性是非均匀和 非线性的,它并不能感知图像的所有变化。然而,在记录 原始图像数据时,通常假定视觉系统是线性的和均匀的, 对视觉敏感和不敏感的部分同等对待,从而就产生了比理 想编码更多的数据。当ห้องสมุดไป่ตู้些变化不能被视觉所感知,则忽 略这些变化,我们仍认为图像是完好的。人类视觉系统的 一般分辨能力估计为26灰度等级,而一般图像的量化采用 28灰度等级,这样的冗余称为视觉冗余。通过对人类视觉 进行大量实验,发现了以下的视觉非均匀特性:
视觉冗余



视觉系统对图像的亮度和色彩度的敏感性相差很大。 随着亮度的增加,视觉系统对量化误差的敏感度降低。 这是由于人眼的辨别能力与物体周围的背景亮度成反 比。由此说明:在高亮度区,灰度值的量化可以更粗 糙一些。 人眼的视觉系统把图像的边缘和非边缘区域分开来处 理,这是将图像分成非边缘区域和边缘区域分别进行 编码的主要依据。 人类的视觉系统总是把视网膜上的图像分解成若干个 空间有向的频率通道后再进一步处理。
PAL 制式 NTSC制式
25帧/秒 30帧/秒
以PAL制25帧/秒为例,视频每秒钟的数据量
720 576 24 25/(1024 1024 8)=29.66MB
视频压缩编码的可能性

数据压缩不仅是必要的,而且也是可能的。因为在视 频数据中存在着极强的相关性,也就是说存在着很大 的冗余度 。冗余数据造成比特浪费,消除这些冗余 可以节约码字,也就是达到了数据压缩的目的。在一 般的图像和视频数据中,主要存在以下几种形式的冗 余:

活动图像专家组(MPEG,Moving Picture Experts Group),一直致力于 活动图像及其伴音的数据压缩编码标准 化工作,制定了一系列视频和音频压缩 编码的国际标准。如MPEG-1、MPEG-2、 MPEG-4。
MPEG-1

MPEG-1的正式名称“用于数字存储媒体的1.5Mbit/s 以下的活动图像及相关音频编码”,它规定视频信息与 伴音信息经压缩之后的数据速率上限为1.5Mbps,从而 可以在CD-ROM、硬盘、可写光盘、数字音频磁带(DAT) 等介质上进行存储,也可以在局域网、ISDN上进行视 频与伴音信息的传输。MPEG-1视频编码算法是一种有 损压缩算法,它适用于多种视频输入格式并且应用范 围很广。经过MPEG-1标准压缩后,视频数据压缩率为 1/100-1/200,MPEG-1提供每秒30帧352×240分辨率的 图像,当使用合适的压缩技术时,具有接近家用视频 制式(VHS)录像带的质量。
数据冗余的种类



空间冗余 时间冗余 符号冗余 结构冗余 知识冗余 视觉冗余
空间冗余

这是静态图像存在的最主要的一种数据冗余。一幅图 像记录了画面上可见景物的颜色。同一景物表面上各 采样点的颜色之间往往存在着空间连贯性,但是基于 离散像素采样来表示物体颜色的方式通常没有利用景 物表面颜色的这种空间连贯性,从而产生了空间冗余。 规则物体和规则背景的表面物理特性都具有相关性, 也就是说某些区域中所有点的光强和色彩以及饱和度 都是相同的,因此数据有很大的空间冗余。
视频压缩编码

上述各种形式的冗余,是压缩图像与视频数据的出发 点。图像与视频压缩编码方法就是要尽可能地去除这 些冗余,以减少表示图像与视频所需的数据量 图像/视频压缩编码的目的,是在保证重建图像质量 一定的前提下,以尽量少的比特数来表征图像/视频 信息。

视频压缩编码的发展

压缩编码的理论基础是信息论。从信息 论的角度来看,压缩就是去除数据中的 冗余。即保留不确定的信息,去除确定 的信息(即可推知的信息),用一种更 接近信息本质的描述来代替原有冗余的 描述。
相关主题