一个基于“刚刚-明显-失真”测量的视觉感知调整子带图像编码器的概要文件摘要:为了表示一幅具有最低可能比特率的高感知质量图像,一种有效的图像压缩算法不仅要消除统计相关性的冗余,还从消除图像信信息里无关紧要的感知成分,在这篇文章里,将要提出一个视觉感知调整部分波段图像编码器的方案,其中一个公正、明显显示失真(JND)或微创明显的失真(MND)配置文件是采用量化感知冗余。
该JND配置文件提供了每个被编码信号的失真可见性阈值,低于该阈值重建误差被渲染不易察觉。
在由于背景亮度和纹理屏蔽效应而集成阈值敏感度的感知模型基础上,JND文件从分析图像信号的局部属性来估计。
根据人体对空间频率的视觉感知敏感度,全频带JND/ MND信息被分解不同的频率子带的JNDMND成分。
有了这些部分的配置文件,无关紧要的感知信号在每个子波段都可以被筛选出来,并正确编码我们有用的信息以满足可见度阈值。
新的量化保真措施,被称作峰值信号-感知噪声比(PSPNR),拟通过采取评估图像的质量包括考虑明显变形的部分在内。
仿真结果表明,这种近乎透明的图像编码可在不到0.4像素内实现。
相比于ISO-JPEG标准,所提出的算法可以消除原始图像更多的感性冗余,并且重构图像的视觉质量以低比特率更能被我们所接受。
1. 介绍我们通常认为当前图像编码技术的表现是不足够接近基本比特率。
为了支撑未来要求低限制使图像维持高质量接收,为了支持未来低比特率高图像质量的设备,更高效的算法被人们所期待。
在众多达到这个最优性的方法中,感知编码将压缩算法和人类感知机制相连接被认为是最有前途的解决方案,并在最近成为一个重要的研究领域。
这是众所周知的,图像信号的统计是比较非平稳的,重建图像的保真度被人眼所要求的不同是从像素到像素的。
通常来说,感知编码的重要任务是有效地使编码算法适应人体人眼的敏感度。
各种方法已经被提出将人类视觉系统的某些确定的心理视觉特性(HVS)合并到图像编码算法中。
已经作出一些努力来开发HVS的灵敏度到空间频率为适应量化步长频域。
其他的努力试图有效地利用空间掩蔽效应来在空间域隐藏失真。
然而,由于缺乏一个有效的定量测量评估图像质量和HVS非线性的措施,无图像编码方案尚未充分整合这些心理视觉效果提供一个简单而有效的方法用于消除静止图像的视觉冗余。
在最近的图像编码技术评论中,贾扬,提出了感知编码的一个重要概念,即“刚刚明显失真(JND)”。
理想的JND提供各种被编码信号能见度的阈值水平,低于则重建错误难以察觉。
静止图像的JND的配置文件是本地的信号属性的函数,如背景强度、亮度的改变活动和主导的空间频率。
这些属性映射到JND的配置文件需要一个来自广泛主观实验有效的感知模型。
一旦得到的图像的JND配置文件,可感知失真的能量可以被测量,每个感知意义信号可以被评估。
因此,一种有效的知觉模型可以从输入图像产生真实的JND曲线将成为图像感知无损编码的前提。
基于JND概念的方法已经在宽带音频透明编码中非常成功。
设想如果由于紧比特率预算而使透明编码没有获得,最低限度明显失真(MND)而不是JND将被要求,如此一来失真出现在重建图像将被最低限度感知,出现在图像上将均匀分布。
如果比特率降低,重建图像的感知质量将相应的降低。
子带编码是一种很有前途的方法来实现高质量的数字图像压缩,子带编码的基本思路是将空间的图像信号分解成窄的频率子带,每个子带被降低并分别编码。
近期子带编码的兴趣是通过将HVS模型合并到图像编码算法的可行性来驱动的。
子带编码方案为图像压缩使用JND信息的概念在[21]提出,其中每个子带基本敏感度第一次从在midgrey背景下测量明显的噪声的能量的经验中得到。
每个子频带的基本灵敏度通过本地调整亮度和纹理能量来获得感知阈值用于设定DPCM量化器的步长。
尽管总的信号能量非常高比例的包含在最低频率子带,截断带或高频带待编码信号将导致由于混叠效应的感知失真。
另一方面,除非显著信号进行过谨慎编码,高频带信号overcoding代价是付费获得的高感知质量图像。
因此,待解决的问题是优化的子带编码方案是如何定位在每一个频率子波段感知重要的信号,并如何将这些信号具有最低可能的比特率进行编码而不超出误差可视性阈值。
在本文中,一个简单而有效的感知模型被提出来估计灰度级图像的JNDMND信息。
子带编码算法被设计用于去除作为量化JND/MND信息的感性冗余。
在第11节,重要心理视觉特性HVS进行评估,在静止图像感性固有的冗余进行了研究。
在DI部分,所推荐包含两个基本的知觉作用的模型被详细的描述。
为了验证所提出的感知模型在获得JND信息中的有效性,进行了一个主观测试用于比较JND污染的图像感知质量与原始图像,在第四节中,提议的子带编码方案进行说明。
考虑到事实上,传统的PSNR不能充分体现再建图像真实的感知质量,新的保真度评估,以衡量能源残留在能量重建图像感知失真中被在第V节中定义。
仿真结果从PSNRP、SPNR和所要求的比特率几个方面介绍。
为了进行比较,从应用ISO-PEG编码器到相同的测试图像中获得的编码结果也被呈现出来,一个中介总结在本文第六节给出。
2.感知冗余静止图像固有的的感知冗余是基于HVS灵敏度在变化的对照物、亮度在空间域的变化的刺激下不一致性。
运用心理物理学到图像编码中,编码损坏能见度阈值是量化感知冗余最重要措施。
它已被定义为刺激的量级,在那它可见或不可见。
一个特定的刺激能见度取决于许多因素,仅考虑非彩色图像在空间域中,有主要两方面因素影响每个像素的可见性阈值的错误,一个是像素后面的平均背景亮度进行测试,另一种是在空间不均匀的背景亮度。
在实验研究的第一个因素的作用时,研究发现,人的视觉感知对对照物的亮度比固定亮度值更为敏感。
如图中箭头韦伯定律,如果测试刺激的亮度与周围环境亮度是明显的,恰可察觉的亮度的比率不同于刺激亮度,称为韦伯分数,是常量。
事实上,由于周围照明环境包围显示的存在,在非常暗的的区域的噪声发生趋向于更不可见高于更高的亮度区域。
因此,修改已提出的,当背景亮度低时,韦伯分数随着背景亮度减小而增大。
另一方面,如果背景的亮度高,则当背景亮度增加时韦伯分数保持不变。
这个修改已经应用到感知调谐图象编码器,其中高能见度的阈值假设在任一非常暗或亮的区域,并且低阈值在围绕127中等灰度级的区域。
第二个因素反映的事实是,由空间背景亮度不均匀性造成刺激的能见度减少,这一事实被称为空间掩蔽。
已经作出了一些努力利用某些形式的空间掩蔽以提高编码效率。
然而,掩蔽效应是很复杂的过程,没有一个单一的理论已经能够证明各种形式的掩蔽是正当的。
许多对这种效果的调查已被进行,以确定对于一个在位置接近的亮度边缘的小光点或线的刺激亮度差阈值。
空间掩蔽已被广泛使用,以优化差分脉冲编码调制(DPCM)编码器,其中可变步长的量化器被设计以这样一种方式,该量化错误可以由亮度转换被屏蔽。
在许多方法中,亮度差的可视性阈值被定义为亮度边缘的幅度的函数,其中,扰动是变化的,直到它变成刚刚明显。
如图1所示,实验结果之一是将亮度差阈值和亮度边缘高度相联系。
这些结果还表明,可视性阈值不仅取决于边缘的高度,还取决于背景亮度。
在[12]中,空间活动的遮蔽函数的计算是在每个像素水平的加权和,邻近的像素其中垂直亮度斜坡的重量减少作为相邻像素的距离和中心像素点像素的增加。
噪声可见性函数被定义来测量测试刺激的主观大小当屏蔽函数超过给定阈值。
实验结果表明,高值屏蔽函数一般导致能见度函数的值低,反之亦然。
这些结果也证实了噪声可视性的降低发生在空间细节附近,较少的像素具有在大多数图像的高空间细节。
Musmann和埃德曼的方法,可以作为上述掩蔽模型的简化版本,这使量化误差小于可视性阈值。
在这种方法中,可视性阈值和定义在每个像素处的遮蔽函数关联作为四个相邻像素的最大预测误差。
除了对在空间域中的灵敏度阈值的调查,许多心理视觉研究表明失真的感知依赖于它的频度分布。
不同空间频率的对比敏感度已被测定,并作为调制传递函数的模型。
从图2中MTF的响应曲线得出,它表明HVS通常具有类似通带特性。
失真的灵敏度在更高空间域频率比在较低的空间域频率为低。
在第IV节,MTF的特性被用来推导能量的加权函数用于将JND的信号分解成不同频带的分量。
3.所提议的感知模型本文的工作是把HVS的特性与JND曲线的估计合并用于测量图像中固有的感知冗余。
由于为此目没有建立统一的HVS模型,仅知道HVS的特性,如在上一节中提到的,被用于于发展一个估计的感知模型,从空间域的数据得出,JND的值与图像的每个像素相关联。
在现实生活中的图像,JND的可见性阈值可能是上面提到的两个因素的一个非常复杂的函数。
然而,为了简单起见,该模型通过简化的两个因素间的相关性得到,并假定JND值由这两个因素的主导作用而决定。
用于估计全带JND信息的感知模型可以由以下式子描述:其中bg(X,Y)和mg(Z,Y)指的是平均背景亮度和(Z,Y)周围的像素背景亮度差的最大加权平均。
H和W分别表示图像的高度和宽度。
空间掩蔽效应由函数f1(x,y)建模,它的线性特性是在类似于[12]和[15]的测试中得到的,并且图1所示的关系接近。
如图1所示,可见性阈值和亮度差关系曲线的近似斜率当背景亮度增大时趋于增大。
参数a(X,Y)和P(X, Y)是背景亮度依附函数与确定斜率曲线以及可见度阈值轴的交点,背景亮度的可见度阈值由函数F2 (x,y)给出,在其中噪声灵敏度和背景亮度之间的关系由主观测试验证。
在该实验中,小正方形区域32×32像素,是位于在恒定灰度级的平面的中心。
对于平面中每一个可能的灰度级,固定振幅的噪声是从在正方形区域像素中随意的加上或者减去。
通过改变噪声的振幅,当受噪声污染区域刚刚明显时每个灰度级的可见性阈值就为之确定。
与在[21]得到的测试结果相似,并示于图(3),其中对应于低背景亮度的关系(127以下)由另一根方程建模部分(超过127)是由一个线性函数来近似。
两个上述实验是在一个暗室进行,由19-in SPARC-workstation 显示器显示,在距离约6倍图像高度获取。
f2 (X,Y)、T0和γ分别表示当背景灰度级为0下的可视性阈,直线的斜率该模型在较高的背景亮度的功能。
由于空间掩蔽效应,β(x,y)中的λ影响能见度阈值的平均振幅 ,这些可以在实验中找到,这三个变量的值由观看距离的增加而增加。
因此JND/MND 可以被建模为一个单调递增函数观看距离。
对于在上述所采取的观看距离进行了实验,T0,γ和λ的结果分别为17,3/128,和1/2 。
在该情况下的比特率预算紧张的,编码失真有望被均匀地分布在重构的图像上,以使得在不同的障碍位置具有相同的可见度并且图像质量不会因为任何明显的空间局部失真而突然降低。