当前位置:文档之家› 图像压缩技术的发展现状与趋势

图像压缩技术的发展现状与趋势

图像压缩技术的发展现状与趋势耿玉静1 赵华21燕山大学信息科学与工程学院 河北秦皇岛 (066004)2河北师范大学电子系 河北保定 (071003)E-mail: gyjlunwen@摘要文章简要论述了图像和视频压缩技术的研究状况,就目前国际上正在研究的压缩标准和方法作了介绍,并对图像和视频压缩技术的发展趋势和前景进行了初步探讨。

关键词图像压缩,视频编码,视频对象,压缩标准1.图像压缩的可行性图像编码压缩的目的是对要处理的图像源数据按一定的规则进行变换和组合[1],从而达到以尽量少的比特数来表征图像,同时尽可能好的复原图像的质量,使它符合预定应用场合的要求。

图像数据之所以可以进行压缩,是因为有以下几个方面的原因:组成图像的各像素之间,无论在行方向还是列方向都存在一定的相关性,即原始图像数据是高度相关的,应用某种编码方法提取或减少这些相关性,便可达到压缩数据的目的;从信息论看,描述图像信源的数据是由有效信息量和冗余量两部分组成的,去除冗余量能够节省传输和存储中的开销,同时又不损害图像信源的有效信息量;有些场合允许图像编码有一定的失真,也是图像可以压缩的一个重要原因。

2.图像压缩的分类图像压缩编码的方法目前有很多种,出发点不同其分类亦有差异。

以信息保真度为出发点,可以分为两大类:一类是冗余度压缩法。

如著名的哈夫曼编码、香农编码、游程编码等,其特征是压缩比较低(一般不超过8:1),但不丢失任何数据,可以严格恢复原图像,实现编/解码的互逆,故又称可逆编码或无损压缩。

另一类是熵压缩法。

如预测编码、变换编码、统计编码等,由于在压缩过程中要丢失一些人眼所不敏感的图像信息,且所丢失的信息不可恢复,即图像还原后与压缩前不完全一致,故又称有损压缩。

以具体编码技术为出发点,可以分为:预测编码、变换编码、统计编码、轮廓编码、模型编码等。

3.图像压缩技术的现状20世纪80年代后,ISO、IEC和ITU陆续制定了各种数据压缩与通信的标准与建议。

3.1静止图像压缩标准:JPEG标准&JPEG 2000 标准3.1.1 JPEG 标准JPEG 全名为Joint Photographic Experts Group,是一个在国际标准组织(ISO)下从事静止图像压缩标准制定的委员会。

JPEG标准从1986年正式开始制订,1988年决定采用以图像质量最好的ADCT(Adaptive Discrete Cosine Transform)方式为基础的算法作标准[2],于1991年3月提出10918号标准[3]“连续色调静止图像的数字压缩编码”,即JPEG标准[4,5]。

它在较低的计算复杂度下,能提供较高的压缩比与保真度。

- 1 -JPEG采用4种编解码方式:串行DCT(Discrete Cosine Transform)方式、渐进浮现式DCT 方式、无失真方式和分层方式[6]。

由于JPEG优良的品质,使它在短短几年内就获得极大的成功。

随着多媒体应用领域激增,传统的JPEG压缩技术已无法满足人们对多媒体影像资料的要求。

因此,更高压缩率以及更多功能的新一代静止影像压缩技术JPEG2000就诞生了。

3.1.2 JPEG2000JPEG2000,正式名称为“ISO 15444”[2,6,7],亦是由JPEG组织负责制定。

自1997年3月开始筹划,2000年规定基本编码系统的最终协议草案才提出。

JPEG2000与JPEG最大的不同,在于它放弃了JPEG所采用的以DCT为主的区块编码方式,而改用以DWT(Discrete Wavelet Transform)为主的多分辨率编码方式[6]。

JPEG2000的新特征有:① JPEG2000作为JPEG的升级版,具有良好的低比特率性能,特别是对细节丰富的图像以0.25bpp的比特率进行压缩时,总体上其压缩率比JPEG高约30%左右。

② JPEG2000同时支持有损和无损压缩;而JPEG只支持有损压缩。

③ JPEG2000能实现渐进传送。

它先传输图像的轮廓,然后逐步传输图像数据的细节,接收端重构图像时让图像由朦胧到清晰显示,而不像JPEG那样由上到下由左到右的显示。

④ JPEG2000支持所谓的“感兴趣区域”编码(Region of interest coding)[7]。

可任意指定图像上感兴趣区域的压缩质量,亦可以选择指定的部分先解压缩以突出重点。

3.2运动图像压缩标准:MPEG-X系列&H.26X系列3.2.1 MPEG 系列MPEG(Moving Picture Experts Group)运动图像专家组成立于1988年,专门从事运动图像和伴音编码的标准制定。

MPEG最初的三个任务是制定1.5Mb/s,10Mb/s,40Mb/s的压缩编码标准,即MPEG-1、MPEG-2、MPEG-3,后因MPEG-2的功能使MPEG-3多余,故MPEG-3被撤消[8]。

MPEG-4于1994年开始制定,其目的是实现甚低码率的音/视频压缩编码。

MPEG-1是1991年11月提出草案,1992年11月通过,1993年8月公布的。

它适用于1.5Mb/s速率的数字存储媒体的运动图像及伴音的压缩编码。

MPEG-1追求高的压缩比,去除图像序列的时间冗余度,同时满足多媒体等随机存取的要求。

它的图像类型有三种:I图像,采用内部编码,不参照其他图像,亦称内部编码图像;P图像,采用预测编码,参照前一幅I或P图像作运动补偿编码,亦称预测编码;B图像,采用双向预测编码,参照前一幅和后一幅I或P图像作双向运动补偿编码,亦称双向预测图像[9]。

MPEG-2制定于1994年,其设计目标是高级工业标准的图像质量以及更高的传输率。

它进一步提高了压缩比,改善了音频、视频质量,采用的核心技术是分块DCT和帧间运动补偿预测技术[10]。

MPEG-2所能提供的传输率在3~10Mb/s间,在NTSC制下的分辨率可达720×486;可提供广播级的视像和CD级的音质;向下兼容MPEG-1,使得大多数MPEG-2解码器可播放MPEG-1格式的数据,如VCD;MPEG-2除了作为DVD的指定标准外,还可以用于为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频;MPEG-2可提供一个较广范围的压缩比[11],以适应不同画面质量、存储容量以及带宽的要求。

MPEG-4是对数字音/视频数据进行压缩、通信、存取和操作管理等的新标准,并为各种通信环境提供一种通用的技术解决方案。

MPEG专家组深入分析了信息领域中计算机、通- 2 -信以及以电视为代表的消费电器即3C交叉融合的方式后[12],认为MPEG-4应提供用于通信的新方式,其中心是基于内容的AV信息存储、处理与操作,支持交互性、高压缩比以及通用存储性等功能。

在其结构上应具有适应性与可扩张性,以适应软、硬件技术的不断发展,及时融合新的技术。

由于MPEG-4的中心是基于内容与交互性的,它就不再对低码率范围做出特别要求。

MPEG-4在通信信息描述中,首次提出了对象的概念[13],如视频对象VO(Video Object)、音频对象AO(Audio Object)等,这是一个新的飞跃。

在编码方案上,MPEG-4仍是以块为基础的混合编码。

MPEG-4标准主要应用于视频电话、视频电子邮件和电子新闻等,其传输速率要求较低,在4.8~64kb/s之间,分辨率为176×144。

MPEG-4利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少数据获得最佳图像质量。

MPEG-4更适用于交互AV服务以及远程监控。

MPEG-7由MPEG委员会于1998年10月提出提议,2001年9月正式成为国际标准,又称为“多媒体内容描述接口(Multimedia Content Description Interface)”[12],其目标是建立对多媒体信息内容的标准化描述,试图规范不同种类多媒体信息的描述而不受表达形式的限制。

这些描述要与信息内容直接相关以便用来快速有效的查询、访问各种多媒体信息。

MPEG-7的应用范围广泛,既可以应用于存储,也可用于流式应用(如广播、将模型加入Internet等)。

它可以在实时或非实时环境下应用,如数字图书馆、多媒体编辑等。

另外,MPEG-7在教育、新闻、导游信息、娱乐、研究业务、地理信息系统、医学、购物、建筑等各方面均有较深的应用潜力。

MPEG-21是基于“多媒体框架(Multimedia Framework)标准”[12]的,其最终目的是建立一个多媒体框架,以通过预购网络和设备使多媒体资源在用户之间透明方便的使用。

MPEG-21的基本框架要素包括数字项目说明、内容表示、数字项目的识别和描述、内容管理和使用、知识产权管理和保护、终端和网络、事件报告等。

它支持的功能有:通过网络存储,使用并交互操作多媒体对象;实现多种业务模型,包括对版权和交易的自动管理;对内容进行隐私的尊重等。

目前,这一标准仍处于开发当中。

3.2.2 H.26X系列1984年国际电报电话咨询委员会的第23研究组建立了一个专家组专门研究电视电话的编码问题。

经过研究与努力,1988年形成草案,1990年12月通过ITU-T的H.261建议。

H.261是ITU-T针对可视电话和会议、窄带ISDN等要求实时编码和低延时应用提出的一个编码标准[12]。

它允许“采用p×64kbit的图像业务的图像编解码”,因而H.261简称p×64。

其中p是一个整数,取值范围为1~30,对应比特率为64kb/s~1.92Mb/s[14]。

它建议采用中间格式CIF(Common Intermediate Format)和QCIF(Quarter CIF)解决不同制式通信的矛盾;解决了编码算法问题。

H.261采用了运动补偿预测和离散余弦变换相结合的混合编码方案,获得很好的图像压缩效果。

1995年,在H.261的基础上,ITU-T总结当时国际上视频图像压缩编码的最新进展,针对低比特率视频应用制定了H.263标准。

它提高了运动补偿的精度,常用于超低速率的图像传输,被公认为是以像素为基础的采用第一代编码技术的混合编码方案所能达到的最佳结- 3 -果。

之后,ITU-T又对其进行了补充,以提高编码效率,增强编码功能。

补充修订的版本有1998年的H.263+,2000年的H.263++[12]。

H.263采用第一代编码技术,在低速率视频传输质量,抗误码能力方面有明显提高,在视频业务传输中得到广泛应用。

与H.261只能工作在CIF、QCIF两种格式不同,H.263的信源编码器可以工作于5种图像格式:QCIF、Sub-QCIF、CIF、4CIF、16CIF。

另外,H.263还在H.261基本编码算法的基础上提供了四种可选编码模式:非限制运动矢量模式、基于语法的算术编码模式、高级预测模式以及PB帧模式[15,17]。

相关主题