当前位置:文档之家› 视频压缩编码的基本原理和方法上课用有删减

视频压缩编码的基本原理和方法上课用有删减

香农信息论的缺陷:一是没有考虑信息 接受者的主观特性;二是撇开了事件本 身的具体含义、重要程度和引起的后果
但是香农信息论具有高度的概括性和综 合性,因此得到广泛的应用。
15
可编辑版
MPEG,活动图像专家组
活动图像专家组(MPEG,Moving Picture Experts Group),一直致力于活 动图像及其伴音的数据压缩编码标准化 工作,制定了一系列视频和音频压缩编 码的国际标准。如MPEG-1、MPEG-2、 MPEG-4。
视频压缩编码的基本原理和方法
1
可编辑版
视频压缩编码的必要性
数字化后的视频数据量十分巨大,不便于传输和存储。单 纯用扩大存储容量、增加通信信道带宽的办法是不现实的。 而数据压缩是个行之有效的方法,通过数据压缩手段把信 息的数据量压下来,以压缩编码的形式存储和传输,即紧 缩节约了存储空间,又提高了通信信道的传输效率。
11
可编辑版
视觉冗余
视觉系统对图像的亮度和色彩度的敏感性相差很大。
随着亮度的增加,视觉系统对量化误差的敏感度降低。 这是由于人眼的辨别能力与物体周围的背景亮度成反 比。由此说明:在高亮度区,灰度值的量化可以更粗 糙一些。
人眼的视觉系统把图像的边缘和非边缘区域分开来处 理,这是将图像分成非边缘区域和边缘区域分别进行 编码的主要依据。
7
可编辑版
符号冗余
符号冗余也称编码表示冗余,又称信息熵冗余。信息 熵指一组数据携带的平均信息量。这里的信息量是指 从N个不相等可能事件中选出一个事件所需要的信息 度量,即在N个事件中辨识一个特定事件的过程中需 要提问的最少次数(=log2N比特)。将信息源所有可 能事件的信息量进行平均,得到的信息平均量称为信 息熵。
13
可编辑版
视频压缩编码的发展
压缩编码的理论基础是信息论。从信息 论的角度来看,压缩就是去除数据中的 冗余。即保留不确定的信息,去除确定 的信息(即可推知的信息),用一种更 接近信息本质的描述来代替原有冗余的 描述。
14
可编辑版
视频压缩编码的发展
香农(Shannon)的信息论,即以经典 的集合论为基础基于某种统计概率模型 来描述信源。
2
可编辑版
PAL 制式 25帧/秒 NTSC制式 30帧/秒 以PAL制25帧/秒为例,视频每秒钟的数据量
720 576 24 25/(1024 1024 8)=29.66MB
3
可编辑版
视频压缩编码的可能性
数据压缩不仅是必要的,而且也是可能的。因为在视 频数据中存在着极强的相关性,也就是说存在着很大 的冗余度 。冗余数据造成比特浪费,消除这些冗余可 以节约码字,也就是达到了数据压缩的目的。在一般 的图像和视频数据中,主要存在以下几种形式的冗余:
人类的视觉系统总是把视网膜上的图像分解成若干个 空间有向的频率通道后再进一步处理。
12
可编辑版
视频压缩编码
上述各种形式的冗余,是压缩图像与视频数据的出发 点。图像与视频压缩编码方法就是要尽可能地去除这 些冗余,以减少表示图像与视频所需的数据量
图像/视频压缩编码的目的,是在保证重建图像质量 一定的前提下,以尽量少的比特数来表征图像/视频 信息。
16
可编辑版
MPEG-1
MPEG-1的正式名称“用于数字存储媒体的 1.5Mbit/s以下的活动图像及相关音频编码”,它规定 视频信息与伴音信息经压缩之后的数据速率上限为 1.5Mbps,从而可以在CD-ROM、硬盘、可写光盘、数 字音频磁带(DAT)等介质上进行存储,也可以在局 域网、ISDN上进行视频与伴音信息的传输。MPEG-1 视频编码算法是一种有损压缩算法,它适用于多种视 频输入格式并且应用范围很广。经过MPEG-1标准压 缩后,视频数据压缩率为1/100-1/200,MPEG-1提 供每秒30帧352×240分辨率的图像,当使用合适的压 缩技术时,具有接近家用视频制式(VHS)录像带的 质量。
4
可编辑版
数据冗余的种类
空间冗余
时间冗余
符号冗余
ห้องสมุดไป่ตู้
结构冗余
知识冗余
视觉冗余
5
可编辑版
空间冗余
这是静态图像存在的最主要的一种数据冗余。一幅图 像记录了画面上可见景物的颜色。同一景物表面上各 采样点的颜色之间往往存在着空间连贯性,但是基于 离散像素采样来表示物体颜色的方式通常没有利用景 物表面颜色的这种空间连贯性,从而产生了空间冗余。 规则物体和规则背景的表面物理特性都具有相关性, 也就是说某些区域中所有点的光强和色彩以及饱和度 都是相同的,因此数据有很大的空间冗余。
10
可编辑版
视觉冗余
事实表明,人类的视觉系统对于图像的敏感性是非均匀和 非线性的,它并不能感知图像的所有变化。然而,在记录 原始图像数据时,通常假定视觉系统是线性的和均匀的, 对视觉敏感和不敏感的部分同等对待,从而就产生了比理 想编码更多的数据。当某些变化不能被视觉所感知,则忽 略这些变化,我们仍认为图像是完好的。人类视觉系统的 一般分辨能力估计为26灰度等级,而一般图像的量化采用 28灰度等级,这样的冗余称为视觉冗余。通过对人类视觉 进行大量实验,发现了以下的视觉非均匀特性:
符号冗余、空间冗余和时间冗余统称为统计冗余,因 为它们都取决于图像数据的统计特性。
8
可编辑版
结构冗余
数字化图像中的物体表面纹理等结构往往存在着冗余,这 种冗余称为结构冗余。当一幅图有很强的结构特性,纹理 和影像色调等与物体表面结构有一定的规则时,其结构冗 余很大。 有些图像的纹理区,像素值存在明显的分布模 式,例如,方格状的地板图案等。(已知分布模式,可以 通过某一过程生成图像。)
6
可编辑版
时间冗余
这是序列图像表示中经常包含的冗余。序列图像(如电视 图像和运动图像)一般为位于时间轴区间内的一组连续画 面,其中的相邻帧往往包含相同的背景和运动物体,只不 过运动物体所在的空间位置略有不同,所以后一帧的数据 与前一帧的数据有许多共同的地方。变化的只是其中某些 地方,这就形成了时间冗余。
9
可编辑版
知识冗余
由图像的记录方式与人对图像的知识差异所产生的冗 余称为知识冗余。人对许多图像的理解与某些基础知 识有很大的相关性。例如,人脸的图像有固定的结构, 比如说嘴的上方有鼻子,鼻子的上方有眼睛等等,这 类规律性的结构可由先验知识和背景知识得到。但计 算机存储图像时还得把一个个像素信息存入,这就是 知识冗余。根据已有知识,对某些图像中所包含的物 体,可以构造其基本模型,并创建对应各种特征的图 像库,进而图像的存储只需要保存一些特征参数,从 而可以大大减少数据量。知识冗余是模型编码主要利 用的特性。
相关主题