当前位置:文档之家› 第3章图像压缩编码原理

第3章图像压缩编码原理


常见的几种静止图像存储格式




PCX-是历史最悠久的图像文件格式。采用RLE(行程长 度编码)压缩原理。 BMP-WINDOWS的基本图像文件格式。图像数据处理 方式有压缩和不压缩两种,压缩方式采用的也是RLE压缩 原理。 GIF-采用LZW压缩原理为基础压缩图像数据,能够有效 的压缩文件容量。 TIFF-排版和图像扫描仪常用的图像文件格式。其文件内 部运用指针功能,建立了一个开放式的架构,可以包含多 种不同的识别信息和压缩方式。JPEG就是其中的一种。 JPEG-JPEG是1992年CCITT正式通过的连续色调静止 图象压缩标准。JPEG可以进行无损压缩,也可以进行有 损压缩。最常见的就是有损压缩的方法,其压缩过程可分 为颜色模式转换及采样、DCT变换、量化、编码几部分。
数字电视技术
图像压缩编码原理
为什么要进行图像压缩编码?

在数字分量编码中,按照4:2:2格式对电视信 号进行取样、量化、编码后,数据率达27MW/S 在数字高清晰度电视格式中,取样、量化、编码 后的数据率会更大 电视信号经过数字编码后,数据量极大,给数字 电视信号的存储和传输带来了巨大挑战 虽然CCIR601建议早在1980年已经制定,但直 到九十年代一系列有效的图像数码压缩技术及相 应的国际标准出现以后,数字电视才得到了迅速 的发展
图像信号的时间冗余度


时间冗余度表现在电视画面中相继各帧对应象素 点的值往往相近或相同,具有时间相关性。 在知道了一个象素点的值后,利用此象素点的值 及其与后一象素点的值的差值就可求出后一象素 点的值。因此,不传送象素点本身的值而传送其 与前一帧对应象素点的差值,也能有效地压缩码 率,这就是差分编码。 由差分编码进一步发展起来的预测编码,是根据 一定的规则先预测出下一个象素点或图像子块的 值,然后将此预测值与实际值的差值传送给接收 端。目前图像压缩中的预测编码主要用于帧间压 缩编码。


JPEG标准,Joint Picture Expert Group MPEG-1标准,用于多媒体和广播电视,数据 率要求1.5Mbps。 MPEG_2/H.262标准,DVD的压缩标准,数 据率要求4-10Mbps。 MPEG-4标准,1999年完成第三版,是一个新 的视频和音频编码的国际标准。最大特点是支 持固定和可变速率视频编码 H.261,全彩色实时视频图像压缩标准 H.263,低码率通信视频图像编码标准
行程长度编码(RLE)


行程长度编码(run-length encoding)是压缩 一个文件最简单的方法之一。它的做法就是把一 系列的重复值(例如图象像素的灰度值)用一个 单独的值再加上一个计数值来取代。比如有这样 一个字母序列aabbbccccccccdddddd它的行程 长度编码就是2a3b8c6d。这种方法实现起来很 容易,而且对于具有长重复值的串的压缩编码很 有效。例如对于有大面积的连续阴影或者颜色相 同的图象,使用这种方法压缩效果很好。 RLE编码简单直观,编码/解码速度快,因此许多 图形和视频文件,如BMP、TIFF及AVI等格式文 件的压缩均采用此方法
图像信号的结构冗余和知识冗余度
图像从大面积看常常存在纹理结构, 我们称之为结构冗余。 人们对于许多图像的理解是根据某些 已知知识,例如人脸的图像有固定结 构,这些规律性的结构可由先验知识 和背景知识得到,称之为知识冗余。

图像信号的视觉冗余度


视觉冗余度是相对于人眼的视觉特性而言的。人 眼对于图像的视觉特性包括:对亮度信号比对色 度信号敏感,对低频信号比对高频信号敏感,对 静止图像比对运动图像敏感,以及对图像水平线 条和垂直线条比对斜线敏感等。因此,包含在色 度信号,图像高频信号和运动图像中的一些数据 并不能对增加图像相对于人眼的清晰度作出贡献, 而被认为是多余的,这就是视觉冗余度。 压缩视觉冗余度的核心思想是去掉那些相对人眼 而言是看不到的或可有可无的图像数据。对视觉 冗余度的压缩通常已反映在各种具体的压缩编码 过程中。
人眼的视觉特征




亮度辨别阈值:只有当亮度在背景基础上变化达 到一定程度时,人眼才能感觉到,人眼刚刚能察 觉到的亮度变化值称为亮度辨别阈值。 视觉阈值:干扰或失真刚好可以被察觉的门限值, 低于它就察觉不出来。 空间分辨力:对一幅图像相邻像素的灰度和细节 的分辨力。对于静止或缓慢变化的图像,视觉具 有较高的空间分辨力;对于活动图像,空间分辨 力降低。 掩盖效应:人眼对图像中量化误差的敏感程度, 与图像信号变化的剧烈程度有关。变化越剧烈, 量化误差越容易被掩盖。
图像压缩编码的发展



第一代,着重于图像信息冗余度的压缩方 法,如预测编码、变换编码、矢量量化编 码、小波编码等 第二代,着重于图像视觉冗余信息的压缩 方法,如基于方向滤波的图像编码、基于 图像轮廓——纹理的编码法等 第三代基于模型的图像压缩方法,如分形 编码法、基于模型的编码方法等
有关图像压缩编码的国际标准
行程编码(RLE编码)

行程编码是一种最简单的,在某些场合是非常 有效的一种无损压缩编码方法。 虽然这种编码方式的应用范围非常有限,但是 因为这种方法中所体现出的编码设计思想非常 明确,所以在图像编码方法中都会将其作为一 种典型的方法来介绍。

20
行程编码 —— 基本原理

通过改变图像的描述方式,来实现图像Байду номын сангаас 压缩。 将一行中灰度值相同的相邻像素,用一个 计数值和该灰度值来代替。
活动图像文件格式之 —— QuickTime文件--.MOV/.QT




QuickTime是Apple计算机公司开发的一种音频、视频文件格 式,用于保存音频和视频信息,具有先进的视频和音频功能 QuickTime文件格式支持25位彩色,支持RLE、JPEG等领先 的集成压缩技术,提供150多种视频效果,并配有提供了200 多种MIDI兼容音响和设备的声音装置。 QuickTime还采用了虚拟现实技术,用户通过鼠标或键盘的交 互式控制,可以观察某一地点周围360度的景像,或者从空间 任何角度观察某一物体。 QuickTime以其领先的多媒体技术和跨平台特性、较小的存储 空间要求、技术细节的独立性以及系统的高度开放性,得到业 界的广泛认可,目前已成为数字媒体软件技术领域的事实上的 工业标准。国际标准化组织(ISO)最近选择QuickTime文件格 式作为开发MPEG4规范的统一数字媒体存储格式
图像信号压缩的机理

利用图像中存在的大量冗余度可供压缩 利用人眼的视觉特性
图像信号的空间冗余度



空间冗余度,一幅视频图像相邻各点的取值往往 相近或相同,具有空间相关性,这就是空间冗余 度 图像的空间相关性表示相邻象素点取值变化缓慢。 从频域看,意味着图像信号的能量主要集中在低 频附近,高频信号的能量随频率的增加而迅速衰 减。 视频图像中经常出现连续的象素点具有相同值的 情况,典型的如彩条,彩场信号等。只传送起始 象素点的值及随后取相同值的象素点的个数,也 能有效地压缩码率。
图像信号压缩效果
图像压缩方法的应用


几乎所有涉及数字图像存储和传输的应用 中,都需要进行数据压缩。 图像的压缩方法可以分为两类: 无损压缩,在图像无任何失真的前 提下使数据率达到最小,这种方式是可逆 的 有损压缩,在给定的失真度下使数 据率达到最小,这种方式是不可逆的 在数字电视的信源压缩编码中,由于要求 的压缩率较高,普遍采用有损压缩的方法
活动图像文件格式之——GIF文件--.GIF




GIF是图形交换格式(Graphics Interchange Format)的英文缩 写,是由CompuServe公司于80年代推出的一种高压缩比的彩色 图像文件格式 GIF图像格式采用无损数据压缩方法中压缩效率较高的LZW算法, 主要用于图像文件的网络传输。 考虑到网络传输中的实际情况,GIF图像格式还增加了渐显方式, 即在图像传输过程中,用户先看到图像的大致轮廓,然后随着传输 过程的继续而逐渐看清图像的细节部分,从而适应了用户的观赏心 理,这种方式以后也被其他图像格式所采用 最初,GIF只是用来存储单幅静止图像,后来,又进一步发展成为 可以同时存储若干幅静止图像并进而形成连续的动画,目前 Internet上大量采用的彩色动画文件多为这种格式的GIF文件。 GIF通常用来表示由计算机生成的动画序列,其图像相对而言比较 简单,因此可以得到比较高的无损压缩率,文件尺寸也不大。然而, 对于来自外部世界的真实而复杂的影像信息而言,无损压缩便显得 无能为力

传真件中一般都是白色比较多,而黑色相对比较 少。所以可能常常会出现如下的情况:
500w 3b 470w 12b 4w 3b 3000w 上面的行程编码所需用的比特数为:
2048 3000 4096 计数值需用 12bits表示
23
行程编码——传真中的应用方法
对于: 500w 3b 470w 12b 4w 3b 3000w 编码为: 500, 3, 470, 12, 4, 3, 3000
活动图像文件格式之
—— MPEG文件--.MPEG/.MPG/.DAT



MPEG文件格式是运动图像压缩算法的国际标准,它采用有损压 缩方法减少运动图像中的冗余信息,同时保证每秒30帧的图像动 态刷新率 MPEG标准包括MPEG视频、MPEG音频和MPEG系统(视频、音 频同步)三个部分 MP3音频文件就是MPEG音频的一个典型应用,而VCD、Super VCD 、DVD 则是全面采用MPEG技术所产生出来的消费类电子 产品 MPEG压缩标准是针对运动图像而设计的,其基本方法是:在单 位时间内采集并保存第一帧信息,然后只存储其余帧相对第一帧 发生变化的部分,从而达到压缩的目的,它主要采用两个基本压 缩技术:运动补偿技术(预测编码和插补码)实现时间上的压缩, 变换域(DCT)压缩技术实现空间上的压缩,压缩效率非常高。同 时图像和音响的质量也非常好,并且在微机上有统一的标准格式, 兼容性相当好。
相关主题