当前位置:文档之家› 图像压缩综述

图像压缩综述

图像压缩综述摘要:随着信息时代的不断发展,数字图像处理技术得到了广泛的应用,而作为数字图像处理技术的重要组成部分——数字图像压缩,也得到了迅猛的发展。

本文从数字图像压缩的概念、发展历史、图像压缩的必要性和可能性、图像压缩标准、图像压缩基本方法和图像压缩效果评价等方面进行了综述。

引言在当前这个信息化社会中,新信息技术革命使人类被日益增多的多媒体信息所包围。

多媒体信息主要是由图像、文本和声音三大元素组成。

图像作为其主要元素之一,发挥着越来越重要的作用。

而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。

其中,数据量最大的是数字视频数据。

未经处理的数字视频信息需要消耗巨大的存储资源,以主流高清视频为例,在分辨率为1280×720,帧率为30帧每秒的视频应用中,存储一分钟的视频信息,需要约18.5G(以常4:2:0视频,每像素12比特)比特存储空间,一部120分钟高清电影约需要2225G比特的存储空间。

可见未经处理的视频信息量非常大,为了满足存储和传输需求,视频信息的压缩是十分必要的。

在同等的通信容量下,如果图像数据可以压缩之后再传输,就可以使传输的数据量变得很小,也就能够增加通信能力。

因此图像压缩编码技术受到了越来越多的关注及广泛的应用。

如数码相机、USB摄像头、可视电话、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。

数字图像压缩是以尽可能少的比特数代表图像或图像中所包含的信息量的技术,图像通过压缩处理去掉其中的数据冗余、符号冗余、视觉冗余等各种冗余信息,提高传输速率,节省存储空间。

1图像压缩的发展历史自1948年提出的电视信号数字化设想后, 即开始了图像压缩的研究,到现在已有60多年的历史。

20世纪五六十年代的图像压缩编码主要集中在预测编码、哈夫曼编码等技术的研究,还不成熟。

1969年在美国召开的第一届“图像编码会议”,标志着图像编码作为一门独立学科的诞生。

到了七八十年代,图像压缩技术的主要成果体现在变换编码技术上, 矢量量化编码技术也有较大的发展。

80年代末,小波变换理论、分形理论、人工神经网络理论、视觉仿真理论建立,人们开始突破传统的信源编码理论, 图像压缩编码向着更高的压缩率和更好的压缩质量的方向发展,进入了一个崭新的发展时期。

2图像压缩的可能性图像之所以能够进行压缩有以下几个方面的原因:一是原始图像数据是高度相关的,存在很大的数据冗余。

如图像内相邻像素之间的空间冗余度、系列图像前后帧之间的时间冗余度、多光谱遥感图像各频谱间的频率域冗余度等,它们造成了大量的比特数浪费,消除这些冗余就可以节约码字,大大减少数据量,达到数据压缩的目的。

二是信源符号出现的概率不同,若用相同码长表示不同出现概率的符号,就会造成符号冗余度。

如果采用可变长编码技术,对出现概率高的符号用短码字,对出现概率低的符号用长码字表示,就可以消除符号冗余度,从而节约码字。

三是人眼具有视觉冗余,允许图像编码有一定的失真。

人类视觉系统(HVS)是有缺陷的,人眼对于某些失真不敏感难以察觉。

在许多场合中,并不要求经压缩及复原以后的图像和原始图像完全相同,可以允许有少量的失真,只要这些失真并不被人眼所察觉即可。

这就为压缩比的提高提供了十分有利的条件,这种有失真的编码称为限失真编码。

在多数应用中,人眼往往是图像信息的最终接受者,图像编码方法如果能充分利用人眼的视觉特性,就可以在保证复原图像主观质量较好的前提下取得较高的压缩比。

四是还可以利用先验知识来实现图像编码,降低知识冗余度。

例如,在可视电话中,编码对象可为人的头和肩等,这时可利用对编码对象的先验知识为编码对象建立模型,通过提取模型参数,对参数进行编码而不对图像直接进行编码,可以达到非常高的压缩比。

3图像压缩编码标准国际标准化协会(ISO)、国际电子学委员会(IEC)、国际电信协会(ITU)等国际组织,于90年代领导制定了许多重要的多媒体数据压缩标准如JPEG、H.261、H.263、H.264、HEVC、MPEG 一1、MPEG一2、MPEG一4等等。

这些标准已在数字电视、多媒体领域得到广泛应用。

[1]目前国际主流的视频编码国际标准主要有两大系列,分别为H.26X系列和MPEG系列。

H.26X系列包括H.261[2]、H.262[3]、H.263[4]、H.263+[5]、H.263++[6]和H.264[7]、 H.265。

其制定者为国际电信联盟电信标准化部门(ITU-T: International TelecommunicationUnion-Telecommunication Standardization Sector)。

MPEG系列包括MPEG-1[8]、MPEG-2[9]、MPEG-4[10]以及正在制定中的MPEG-H[11]。

其制定者为国际标准化组织(ISO: International Organization forStandardization)和国际电工委(IEC:International Electronics Committee)下属的运动图像专家组(MPEG: Moving Picture Experts Group)。

为了推动视频编码技术的发展,两大标准组织共同制定了H.262和H.264/AVC标准。

目前,为适应视频技术发展的趋势,两大组织再一次合作,共同开发新一代高性能视频编码标准HEVC(High Efficiency Video Coding)。

下图为两大系列标准的发展历史图。

图3-1 H.26X系列发展图图3-2 MPEG系列发展图不同的视频标准有不同的社会需求背景,同时所面向的应用也有所不同。

下表所示为各编码标准面向应用情况[12]。

表3-3编码标准面向应用除了两大国际标准以外,还有我国自主知识产权的AVS编码标准。

AVS标准的制定是为了适应我国信息产业快速崛起崛起而提出的,随着我国在视频编码技术研发方面的不断积累,相信其影响力将会不断的增强。

4图像压缩方法如下图为图像压缩系统的一般模型图4-1 图像压缩系统的一般模型4.1压缩方法的分类研究图像压缩方法实际是研究图像压缩的算法(或者称为“编码’),随着研究的不断深入,出现了多种压缩(“编码’)方法。

显然,各种编码方法的并存是十分必要的。

图像压缩编码可以有多种分类方法:①以恢复的图像与原图像关系分:无失真编码和限失真编码。

②以使用方法的原理分:基于图像统计特性、基于人眼视觉特性和基于图像特性提取编码。

③以图像的光学特性分:静止图像、慢速图像和实时图像编码。

④以采用的基本理论不同分:变换法和分形法编码。

4.2压缩方法算法4.2.1 空间法空间域图像压缩可以有六种形式,其中包括脉冲编码调制、预测编码、差分脉冲码调制、Delta 调制、内插编码及比特平面编码这六种方法。

空间域图像压缩的主要特点有:(1)脉冲编码调制这种压缩方法可接受的图片质量是由每像3比特量化值,压缩比C=2.6至C=1.0,颤动法可以用来改进图像的质量,全然没有利用人的视觉特性。

(2)预测编码预测编码的理论基础是现代统计学和控制论。

预测编码是根据某一模型利用以往的样本值,对于新样本值进行预测,然后将样本的实际值与其预测值相减得到一个误差值,对这一误差值进行编码,如果模型足够好且样本序列在时间上的相关性较强,那么误差信号的幅度将远小于原始信号,从而可以用较少的数据类对其差值量化得到较大的数据压缩结果。

利用预测编码的方法压缩图像数据的空间和时间冗余性,这种方法直观、简捷、易于实现,它的不足在于压缩能力有限。

现在常用的一种线性预测编码方法是差分脉冲编码调制DPCM (differential pulse codemodulation)[13]线性预测形式如下:S’(n1,n2)=c1s(n1—1,n2—1)+ c2s(n1—1,n2)+c3s(n1一1,n2+ 1)+c4s(n1,n2—1)。

最佳线性预测选择系数使均方误差最小:min E((s一s’)T(s一S’))预测法通常不利用人的视觉系统的特性,对于8比特的规范形式运用两维预测所获得的压缩比约为4:1。

若预测参量以适当方式与数据自适应,则预测法便为自适应的。

例如,一局部性测量可以定义,则预测参量在每一显著的变化时可以被修正。

用自适应修正,压缩比可以增加百分之一到二十左右。

预测的特例是差分脉冲编码调制。

(3)差分脉冲编码调制脉冲编码调制可获得压缩比为2.5:1,自主适应脉冲编码调制可使压缩比达3.5:1。

(4)Delta调制用这种方法所获得的压缩比虽然不高,但方法相当简单。

(5)内插编码最通用的内插方法是零阶和一阶内插器,它能获得大约4:1的压缩比。

高阶多项式或样条函数也能使用,但是其计算复杂性不能证明其结果的有效性,再则是未利用人的视觉系统的性质。

(6)比特平面编码用比特平面编码法在未涉及人的视觉系统特性时可以获得平均压缩比约为4:1。

4.2.2变换编码变换编码先对图像进行某种函数变换,从一种表示空间变换到另一种表示空间,然后在变换后的域上,对变换后信号进行编码。

目前在图像压缩中经常使用的变换有:(1)Karhunen-Loeve变换(KLT)。

它是一种最优变换。

KLT可以有效地去除原始数据的相关性,从而实现高效压缩。

但是由于KLT变换的核不是固定的,是随原始数据而变的,并且不存在快速算法,限制了它在实际上的应用,一般常作为其他方法的参照。

(2)离散余弦变换(DCT)。

对于像素间呈现高度相关的典型图像,DCT的性能与KLT的性能没有实质的区别。

DCT的快速实现算法也已经实现。

与Walsh-Hadamard变换相比,DCT具有更强的信息集中能力,并且易于软硬件的实现,正是由于这些优点,DCT已经成为当前图像压缩中应用最广泛的技术。

(3)Walsh-Hadamard变换(WHT)。

与DCT相比,WHT的压缩方面的性能要逊色许多,但由于实现起来算法简单,且具有简洁的去相关能力,以及特别有利于硬件实现,使得WHT 也成为一种比较流行的算法。

(4)小波变换。

小波变换把图像分解成逼近图像和细节图像之和,它们分别代表图像的不同结构,然后采用快速算法(Mallat) 进行压缩,可以获得很高的压缩比。

基于小波变换的图像压缩算法首先使用某种小波基函数将图像作小波变换,再根据4个通道的不同情况,分别量化编码,比如对低频频段(LL)采用较多的量化级别,而对中间频段(LH,RH)采用较少量化级别,对高频频段(HH)采用很少几个量化级别,这样根据重构时对复原信号的重要程度分别对待的方式可以有效地提高压缩比而又不产生明显的失真。

小波变换在静态图像压缩中的作用已经得到公认,为JPEG2000标准所采纳。

相关主题