* 2006-06-09收到,2006-10-10改回**安晓东,女,1967年生,北京理工大学博士研究生,研究方向:计算机应用。
文章编号:1003-5850(2006)12-0024-03图 像 压 缩 方 法 综 述A Summarization of Image Compression Methodology安晓东1,2 陈 静3(1北京理工大学 北京 100081) (2山西省人事考试中心 太原 030006) (3中北大学 太原 030051)【摘 要】图像压缩是图像处理的重要组成部分,随着科学技术的不断进步,压缩方法也在不断涌现。
论述了各个常用图像压缩方法的算法及应用情况,着重研究了预测编码和分形压缩方法。
有机结合所介绍的压缩算法能解决很多图像处理问题,介绍的图像压缩方法也可供研究人员参考。
【关键词】图像压缩,预测编码,分形压缩中图分类号:T P 391.41文献标识码:AABSTRACT Image co mpr ession is t he impor tant part of im age pr ocessing.Wit h the dev elo pm ent of science and technolog y,mor e and mo re compr essing m et hods have come for th .T his paper discusses many com mon imag e compr ession alg or ithms and it's a pplica-tio n,fo cuses o n the pr edictive enco ding and fr act al co mpressio n methods.It can so lv e lots of image pr o cessing pro blems by these methods,w hich may g iv e a hand to other resear cher s.KEYWORDS imag e co mpression ,pr edictiv e co ding ,fr actal compressio n 众所周知,在开发多媒体应用系统时,遇到的最大障碍是对多媒体信息巨大数据量所进行的采集、存储、处理和传输。
其中,数据量最大的是数字视频数据。
例如,1幅640*480中等分辨率的彩色图像,其数据量大约为0.92M B 。
这么大的图像,传输速度以平均4k /s 估算,完整地传输这幅图需要230s,也就是接近4min 。
假设是可视电话,或者数字广播电视,以每秒播放30帧计算,一张光盘里只能存放24s 的视频信息,更不用说在网络上传输的效果了。
同时大数据量的图像信息也会给存储器的存储容量,通信干线信道的带宽,以及计算机的处理速度增加极大的压力。
单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方法来解决这个问题是不现实的。
因此,图像压缩方法的研究非常有必要。
1 图像压缩方法研究现状图像压缩已研究了几十年,提出了诸如DPCM 、DCT 、VQ 等压缩方法,并已出台了基于DCT 等技术的国际压缩标准,如JPEG 、M PEG 、H.261等。
人们逐渐发现了这些方法的许多缺点:比如高压缩比时图像出现严重的方块效应、人眼视觉系统的特性不易被引入到压缩算法中等等。
目前,许多人正在致力于第二代图像编码技术的研究。
第一代图像编码技术(以JPEG 为代表)是指以信息论和数字信号处理技术为理论基础,旨在去除图像数据中的线性相关性的一类编码技术。
这类技术去除客观和视觉的冗余信息的能力已接近极限,其压缩比不高(20:1左右)。
而第二代图像编码技术是指不局限于SH ANNON 信息论的框架,要求充分利用人的视觉生理心理特性和图像信源的各种特性,能获得高压缩比的一类编码技术。
这其中以小波变换编码、分形编码和模型基编码最具有代表性,也很有可能成为新一代国际图像压缩标准的核心理论。
2 图像压缩编码标准国际标准化协会(ISO )、国际电子学委员会(IEC )、国际电信协会(IT U )等国际组织,于90年代领导制定了许多重要的多媒体数据压缩标准。
如JPEG 、H .261、H .263、M PEG -1、MPEG -2、MPEG -4等等。
这些标准已在数字电视、多媒体领域得到广泛应用[1]。
2.1 JPEGJPEG(Joint Pho to Graphic Ex perts Gro up)是联合图像专家组的英文缩写。
JPEG 主要是针对静止图像的压缩编码标准,但是在电视图像序列的帧内压缩中也常采用JPEG,是一个适用范围广泛的通用标准。
2.2 MPEGM PEG(M oving Pictures Ex pert Gr oup)是ISO 和IEC 两个国际组织的联合技术委员会领导下的运动图像专家组的英文缩写。
针对不同的应用目的M PEG 专家组制定了M PEG 系列标准。
主要包括M PEG -1,M PEG-2,MPEG-3,M PEG-4。
・24・(总774)图像压缩方法综述2006年 2.3 H.261H.261标准主要应用于在综合数字业务网ISDN 上传输电视电话会议。
1990年12月国际电报电话咨询委员会(CCITT)通过了H.261建议书,即“采用p′64kb/s的声像业务的图像编码”,其中p=1,2,…32。
3 图像压缩方法图像是信息传递的一种重要媒体,为了使有限的符号表达更多的信息量,图像压缩既非常必要,也有可能,因此产生了各种各样的图像压缩方法。
3.1 压缩方法的分类研究图像压缩方法实际是研究图像压缩的算法(或者称为“编码’),随着研究的不断深入,出现了多种压缩(“编码’)方法。
显然,各种编码方法的并存是十分必要的。
图像压缩编码可以有多种分类方法:¹以恢复的图像与原图像关系分:无失真编码和限失真编码。
º以使用方法的原理分:基于图像统计特性、基于人眼视觉特性和基于图像特性提取编码。
»以图像的光学特性分:静止图像、慢速图像和实时图像编码。
¼以采用的基本理论不同分:变换法和分形法编码。
3.2 压缩方法算法及应用3.2.1 Huffm an压缩方法无失真编码方法中,Huffman编码是一种较有效的编码方法。
Huffman编码是一种长度不均匀的,平均码率可以接近信息熵值的一种编码。
它的编码思想是:对于出现概率大的信息,采用字短的码,对于出现概率低的信息采用字长的码,以达到缩短平均码长,从而实现数据的压缩。
Huffman编码小变字长编码方法是最佳的,其码字平均长度很接近信息符号的熵值。
Huffman编码的最高压缩效率可达到8∶1。
3.2.2 行程(Run-Length)压缩方法在一个逐行存储的图像中,具有相同灰度值的一些像素组成的序列称为一个行程。
在编码时,对于每个行程只存储一个灰度值的码,再紧跟着存储这个行程的长度。
这种按照行程进行的编码被称为行程编码(Run Leng th Encoding)。
行程编码是相对简单的一种编码,是指一行扫描的像素中,比较相邻像素的幅度(如:亮度),当幅度有一显著变化时,就说有一个行程存在。
随终点位置标记方法不同,行程编码可分为“行程终点编码”和“行程长度编码”。
行程编码对于仅包含很少几个灰度级的图像,特别是二值图像,比较有效。
3.2.3 预测压缩方法如果已知图像一个像素离散值,利用其相邻像素的相关性,预测它的下一个像素(水平方向或垂直方向)的可能值,求其两者差,再量化编码,这就是预测压缩方法。
预测编码方法计算简单,若采用Huffman编码技术,压缩比从2∶1到4∶1仍有满意的效果。
预测编码可以利用相邻像素之间的相关性,用前面已出现的像素值估计当前像素值,对实际值与估计值的差值进行编码。
常用的一种线性预测编码方法是差分脉冲编码调制DPCM(differential pulse code modulation)[2]。
线性预测形式如下:sd(n1,n2)=c1s(n1-1,n2-1)+c2s(n1-1,n2)+c3s (n1-1,n2+1)+c4s(n1,n2-1)最佳线性预测选择系数使均方误差最小:m inc1,c2,c3,c4E((s-sd)T(s-sd))预测编码根据数据在时间和空间上的相关性,根据统计模型利用已有样本对新样本进行预测,将样本的实际值与其预测值相减得到误差值,再对误差值进行编码。
由于通常误差值比样本值小得多,因而可以达到数据压缩的效果。
3.2.4 矢量量化压缩方法前面介绍的预测编码、变换编码等都属于标量量化,即先将图像经某种映射变换变成一个数的序列,然后一个数一个数地进行量化编码。
矢量量化(简称VQ)在近几年发展较快,它与标量量化方法不同,它把图像数据分成很多组,每组看成为一个矢量,然后逐个矢量进行量化编码。
在VQ算法中,图像中的各种相关信息(如:各像素点间、各块之间以及相邻编码地址间等)可通过有效的码书设计得以充分地去除。
矢量量化是限失真压缩编码方法,压缩比可达到40∶1。
3.2.5 分形压缩方法80年代后期,Bar nsley等人研究利用分形几何学的思想进行图像压缩的方法,并提出了适合图像压缩的分形模型--迭代函数系统(简称IFS)。
利用分形模型进行图像压缩时,一幅复杂的图像可以只占用很少字节的IFS代码,因而可以实现很高的压缩比(最高可达10000∶1)[3]。
分形图像压缩算法的实现步骤:¹构造分类块(Range块)集合。
将源图像分割成若干互不重叠的分类块(Range・25・ 第19卷 第12期电脑开发与应用(总775)块),每一Rang e块均为B′B阵列。
º构造范畴块(Do main块)池。
»对2×2阵列的Dom ain块进行收缩变换。
依次对每一Dom ain块中相邻的4个像素进行求和,并取平均值,于是2B′2B阵列的Do main块就收缩成了B′B阵列的Sub Domain块。
¼利用最小二乘法,并配合Jacquin提出的8种对称变换算子,对Sub Domain块(收缩后的Domain块)与Range块进行匹配计算。
基于分形的图像压缩算法利用图像中的自相似性根据分形算法压缩图像,对一些典型图像如自然景物等在理论上可以获得非常高的压缩比。
现在的分形压缩算法,需要按块为单位处理,通过迭代优化方法实现,比较复杂。
目前有些系统性的研究,但还缺乏稳定的性能保障,没有被广泛采用[4]。
3.2.6 小波变换压缩方法小波变换把图像分解成逼近图像和细节图像之和,它们分别代表图像的不同结构,然后采用快速算法(M allat)进行压缩,可以获得很高的压缩比。