当前位置：文档之家› 第3章图像压缩编码原理

第3章图像压缩编码原理

常见的几种静止图像存储格式

PCX－是历史最悠久的图像文件格式。采用RLE（行程长度编码）压缩原理。 BMP－WINDOWS的基本图像文件格式。图像数据处理方式有压缩和不压缩两种，压缩方式采用的也是RLE压缩原理。 GIF－采用LZW压缩原理为基础压缩图像数据，能够有效的压缩文件容量。 TIFF－排版和图像扫描仪常用的图像文件格式。其文件内部运用指针功能，建立了一个开放式的架构，可以包含多种不同的识别信息和压缩方式。JPEG就是其中的一种。 JPEG－JPEG是1992年CCITT正式通过的连续色调静止图象压缩标准。JPEG可以进行无损压缩，也可以进行有损压缩。最常见的就是有损压缩的方法，其压缩过程可分为颜色模式转换及采样、DCT变换、量化、编码几部分。
数字电视技术
图像压缩编码原理
为什么要进行图像压缩编码？

在数字分量编码中，按照4：2：2格式对电视信号进行取样、量化、编码后，数据率达27MW/S 在数字高清晰度电视格式中，取样、量化、编码后的数据率会更大电视信号经过数字编码后，数据量极大，给数字电视信号的存储和传输带来了巨大挑战虽然CCIR601建议早在1980年已经制定，但直到九十年代一系列有效的图像数码压缩技术及相应的国际标准出现以后，数字电视才得到了迅速的发展
图像信号的时间冗余度

时间冗余度表现在电视画面中相继各帧对应象素点的值往往相近或相同，具有时间相关性。在知道了一个象素点的值后，利用此象素点的值及其与后一象素点的值的差值就可求出后一象素点的值。因此，不传送象素点本身的值而传送其与前一帧对应象素点的差值，也能有效地压缩码率，这就是差分编码。由差分编码进一步发展起来的预测编码，是根据一定的规则先预测出下一个象素点或图像子块的值，然后将此预测值与实际值的差值传送给接收端。目前图像压缩中的预测编码主要用于帧间压缩编码。

JPEG标准，Joint Picture Expert Group MPEG-1标准，用于多媒体和广播电视，数据率要求1.5Mbps。 MPEG_2/H.262标准，DVD的压缩标准，数据率要求4-10Mbps。 MPEG-4标准，1999年完成第三版，是一个新的视频和音频编码的国际标准。最大特点是支持固定和可变速率视频编码 H.261，全彩色实时视频图像压缩标准 H.263，低码率通信视频图像编码标准
行程长度编码(RLE)

行程长度编码（run-length encoding）是压缩一个文件最简单的方法之一。它的做法就是把一系列的重复值（例如图象像素的灰度值）用一个单独的值再加上一个计数值来取代。比如有这样一个字母序列aabbbccccccccdddddd它的行程长度编码就是2a3b8c6d。这种方法实现起来很容易，而且对于具有长重复值的串的压缩编码很有效。例如对于有大面积的连续阴影或者颜色相同的图象，使用这种方法压缩效果很好。 RLE编码简单直观，编码/解码速度快，因此许多图形和视频文件，如BMP、TIFF及AVI等格式文件的压缩均采用此方法
图像信号的结构冗余和知识冗余度
图像从大面积看常常存在纹理结构，我们称之为结构冗余。人们对于许多图像的理解是根据某些已知知识，例如人脸的图像有固定结构，这些规律性的结构可由先验知识和背景知识得到，称之为知识冗余。

图像信号的视觉冗余度

视觉冗余度是相对于人眼的视觉特性而言的。人眼对于图像的视觉特性包括：对亮度信号比对色度信号敏感，对低频信号比对高频信号敏感，对静止图像比对运动图像敏感，以及对图像水平线条和垂直线条比对斜线敏感等。因此，包含在色度信号，图像高频信号和运动图像中的一些数据并不能对增加图像相对于人眼的清晰度作出贡献，而被认为是多余的，这就是视觉冗余度。压缩视觉冗余度的核心思想是去掉那些相对人眼而言是看不到的或可有可无的图像数据。对视觉冗余度的压缩通常已反映在各种具体的压缩编码过程中。
人眼的视觉特征

亮度辨别阈值：只有当亮度在背景基础上变化达到一定程度时，人眼才能感觉到，人眼刚刚能察觉到的亮度变化值称为亮度辨别阈值。视觉阈值：干扰或失真刚好可以被察觉的门限值，低于它就察觉不出来。空间分辨力：对一幅图像相邻像素的灰度和细节的分辨力。对于静止或缓慢变化的图像，视觉具有较高的空间分辨力；对于活动图像，空间分辨力降低。掩盖效应：人眼对图像中量化误差的敏感程度，与图像信号变化的剧烈程度有关。变化越剧烈，量化误差越容易被掩盖。
图像压缩编码的发展

第一代，着重于图像信息冗余度的压缩方法，如预测编码、变换编码、矢量量化编码、小波编码等第二代，着重于图像视觉冗余信息的压缩方法，如基于方向滤波的图像编码、基于图像轮廓——纹理的编码法等第三代基于模型的图像压缩方法，如分形编码法、基于模型的编码方法等
有关图像压缩编码的国际标准
行程编码(RLE编码)

行程编码是一种最简单的，在某些场合是非常有效的一种无损压缩编码方法。虽然这种编码方式的应用范围非常有限，但是因为这种方法中所体现出的编码设计思想非常明确，所以在图像编码方法中都会将其作为一种典型的方法来介绍。

20
行程编码 —— 基本原理

通过改变图像的描述方式，来实现图像Байду номын сангаас 压缩。将一行中灰度值相同的相邻像素，用一个计数值和该灰度值来代替。
活动图像文件格式之 —— QuickTime文件--.MOV/.QT

QuickTime是Apple计算机公司开发的一种音频、视频文件格式，用于保存音频和视频信息，具有先进的视频和音频功能 QuickTime文件格式支持25位彩色，支持RLE、JPEG等领先的集成压缩技术，提供150多种视频效果，并配有提供了200 多种MIDI兼容音响和设备的声音装置。 QuickTime还采用了虚拟现实技术，用户通过鼠标或键盘的交互式控制，可以观察某一地点周围360度的景像，或者从空间任何角度观察某一物体。 QuickTime以其领先的多媒体技术和跨平台特性、较小的存储空间要求、技术细节的独立性以及系统的高度开放性，得到业界的广泛认可，目前已成为数字媒体软件技术领域的事实上的工业标准。国际标准化组织(ISO)最近选择QuickTime文件格式作为开发MPEG4规范的统一数字媒体存储格式
图像信号压缩的机理

利用图像中存在的大量冗余度可供压缩利用人眼的视觉特性
图像信号的空间冗余度

空间冗余度，一幅视频图像相邻各点的取值往往相近或相同，具有空间相关性，这就是空间冗余度图像的空间相关性表示相邻象素点取值变化缓慢。从频域看，意味着图像信号的能量主要集中在低频附近，高频信号的能量随频率的增加而迅速衰减。视频图像中经常出现连续的象素点具有相同值的情况，典型的如彩条，彩场信号等。只传送起始象素点的值及随后取相同值的象素点的个数，也能有效地压缩码率。
图像信号压缩效果
图像压缩方法的应用

几乎所有涉及数字图像存储和传输的应用中，都需要进行数据压缩。图像的压缩方法可以分为两类：无损压缩，在图像无任何失真的前提下使数据率达到最小，这种方式是可逆的有损压缩，在给定的失真度下使数据率达到最小，这种方式是不可逆的在数字电视的信源压缩编码中，由于要求的压缩率较高，普遍采用有损压缩的方法
活动图像文件格式之——GIF文件--.GIF

GIF是图形交换格式(Graphics Interchange Format)的英文缩写，是由CompuServe公司于80年代推出的一种高压缩比的彩色图像文件格式 GIF图像格式采用无损数据压缩方法中压缩效率较高的LZW算法，主要用于图像文件的网络传输。考虑到网络传输中的实际情况，GIF图像格式还增加了渐显方式，即在图像传输过程中，用户先看到图像的大致轮廓，然后随着传输过程的继续而逐渐看清图像的细节部分，从而适应了用户的观赏心理，这种方式以后也被其他图像格式所采用最初，GIF只是用来存储单幅静止图像，后来，又进一步发展成为可以同时存储若干幅静止图像并进而形成连续的动画，目前 Internet上大量采用的彩色动画文件多为这种格式的GIF文件。 GIF通常用来表示由计算机生成的动画序列，其图像相对而言比较简单，因此可以得到比较高的无损压缩率，文件尺寸也不大。然而，对于来自外部世界的真实而复杂的影像信息而言，无损压缩便显得无能为力

传真件中一般都是白色比较多，而黑色相对比较少。所以可能常常会出现如下的情况：
500w 3b 470w 12b 4w 3b 3000w 上面的行程编码所需用的比特数为：
2048 3000 4096 计数值需用 12bits表示
23
行程编码——传真中的应用方法
对于： 500w 3b 470w 12b 4w 3b 3000w 编码为： 500, 3, 470, 12, 4, 3, 3000
活动图像文件格式之
—— MPEG文件--.MPEG/.MPG/.DAT

MPEG文件格式是运动图像压缩算法的国际标准，它采用有损压缩方法减少运动图像中的冗余信息，同时保证每秒30帧的图像动态刷新率 MPEG标准包括MPEG视频、MPEG音频和MPEG系统(视频、音频同步)三个部分 MP3音频文件就是MPEG音频的一个典型应用，而VCD、Super VCD 、DVD 则是全面采用MPEG技术所产生出来的消费类电子产品 MPEG压缩标准是针对运动图像而设计的，其基本方法是：在单位时间内采集并保存第一帧信息，然后只存储其余帧相对第一帧发生变化的部分，从而达到压缩的目的，它主要采用两个基本压缩技术：运动补偿技术(预测编码和插补码)实现时间上的压缩，变换域(DCT)压缩技术实现空间上的压缩，压缩效率非常高。同时图像和音响的质量也非常好，并且在微机上有统一的标准格式，兼容性相当好。

e商务文档

第3章图像压缩编码原理

相关文档推荐：