基于人眼视觉特性的图像质量评价方法研究刘 江 苏未曰摘要:本文是在传统图像质量评价模型的基础上,对人眼视觉理论和各种图像质量评价的主客观方法进行分析。
利用小波变换与人眼视觉系统的多通道特性相匹配的特点,结合对比敏感度函数的带通特性和DCT域加权处理的方法,建立一个利用MATLAB语言实现的基于人眼视觉特性的图像质量模型评价。
关键词:数字图像;人类视觉系统;小波变换;多通道;对比敏感度 The Methods of Based on the HVS ImageQuality EvaluationLiujiang Su WeiyueABSTRACT: This paper analyzed the human visual theory and the various objective and subjective methods of image quality evaluation, and it is based on the traditional image quality evaluation model. Using the characteristic that wavelet transform match the features of human visual system multi-channel, and combining the characteristics that contrast sensitivity function with the band-pass,and the DCT territory weighting processing, it will use the MATLAB to establish an image quality evaluation model which based on HVS.Keywords: Digital Image; Human Visual System; Wavelet Transform; Multi-channel;Contrast Sensitivity Function1前言在遥感影像产品大量应用, 新的影像处理方法不断涌现的同时, 对如何评价遥感影像的质量问题却缺乏全面、客观和统一的方法, 影像质量的好坏常常是依靠观察者的主观感觉, 不但缺乏准确性, 而且也不适应海量数据处理的需要。
同时评价方法的非客观与非准确性, 也使提高影像质量成为空谈。
遥感影像作为一种产品, 对其质量的评价, 必将随着遥感影像应用的进一步深入而引起越来越多的关注。
2 传统图像质量评价方法传统的图像质量评价方法可以分为主观和客观两类,主观评价方法主要是主观平均分(MOS),客观方法主要有均方误差(MSE)、峰值信噪比(PSNR)、信息熵。
1、主观评价方法主观评价方法就是让观察者根据一些事先规定的评价尺度或自己的经验对测试影像按视觉效果提出质量判断,并给出质量分数。
在具体作法上,可在一定的光照、视距、分辨率大小等条件下,由一组专家和非专家观察者分别对所评价的同一图像进行打分,然后按照一定的规则得出一个总的评价结果。
主观评价主要有两种尺度,即绝对尺度和相对尺度[2],所谓绝对尺度就是对给定影像给出绝对的质量评分结果,而相对尺度就是确定某影像在一批相比较的影像中的相对质量尺度。
主观方法相对于客观方法更有说服力,因为图像最终的服务对象是人的眼睛。
而主观的评价测试,其实验的条件较为困难,观察者的知识水平会影响评分的结果,且又受到个人情绪等一些无法预测与控制的因素的影响。
所以我们目前考虑的是基于人眼视觉的图像质量评价模型,它不仅对评价本身而且对图像的成像、处理等都会有很大的帮助。
2、客观评价方法1、均方误差()MSE 和峰值信噪比()PSNR 。
两者的定义分别是[4]: ()2'111N M ij ij i j MSE ff NM ===−∑∑ (1) 21010log L PSNR MSE= (2) 其中N ,M 分别是x ,y 方向图像像素点的个数,ij f 和'ij f 分别是原始图像和重构图像在点(),i j 上的取值,L 是图像中灰度取值的范围,对8比特的灰度图像而言L =255。
峰值信噪比()PSNR 反映的是整个图像的失真程度,一般情况下,峰值信噪比()PSNR 愈大的图像其质量愈高。
2、信息熵对一个随机事件E ,如果它的出现概率是()P E ,那么它包含的信息为:()()()21log log I E P E P E ==− (3) 将一副静止图像看作一个具有随机输出的信源,信源符号集B 定义为所有可能的符号的集合{}1b ,信源产生符号1b 的概率是{}1P b ,那么一幅图像的平均信息率可用下式表示:()()()()()()211log L Li i i ii i H u P b I P b P b P b ===⋅=−⋅∑∑ (4) 将()H u 称为信息的熵,它定义了观察到单个信源符号输出时所获得的平均信息量。
信息熵达到最大的情况出现在信源各符号的出现概率相等时,而信源此时提供最大可能的信源符号平均信息量。
客观评价方法是用恢复图像偏离原始图像的误差,来衡量图象恢复的质量,看起来直观、严格,但用它们所求得的结果常与主观视觉不一致[3]。
这是因为它们是从总体上反映原始图像和恢复图像的灰度差别,并不能反映出少数像点的较大灰度差别和较多像点的较小灰度差别等情况。
显然,对图像中各个像点同样对待,不能反映人眼的视觉特性。
3 人眼视觉特性人类的视觉感知有3个显著的特性[4],即视觉非线性特性(Weber 定律)、视觉敏感度带通和视觉多通道及掩盖效应。
1、视觉幅度非线性特性视觉系统分辨细节的能力用分辨的相邻两点的视角θ的倒数表示,其值与该两点在视网膜上的成像位置有关,以黄斑区为中心向四周作非线性下降,它与亮度的关系取决于相对亮度的变化,而不是取决于整幅图像的基底亮度,那么亮度感觉的增量△S 可用相对亮度的增量来度量,即: B S KBΔΔ= (5) 式中,B 为客观亮度,ΔB 为相对亮度增强。
对上式积分后得到感觉亮度:'00ln lg S K B K K B K =+=+ (6) 其中'ln10K K =,K 0为常数,K 为与整个图像的平均亮度相关的常数,图像的平均亮度较大或较小时,K 的值可选得小一些,对于人眼正常的亮度范围K 可取1。
上式说明人眼的感知亮度S 与实际亮度B 的对数成线性关系,即为韦伯—费赫涅尔(Web-Frecher )定律的基本内容。
CSF 特性曲线[8]如图1所示。
图1 CSF 的归一化空间频率特征曲线2、视觉敏感度带通和多通道特性视觉与对比度的关系用视觉系统的对比度敏感度函数CSF 表示,或称为人眼视觉系统空间调制转移函数(Modulate Transform Function ),简称为MTF 过程,不同实验所得的CSF 函数形式各异,但基本上都认为HVS 的对比度敏感性是空间频率的函数,且具有带通滤波器性质,其对高低频端敏感度下降。
视觉皮层的细胞对不同的视觉信息或激励,如颜色、频率和方向等有不同的敏感性。
而目标识别、掩盖与自适应的研究认为:所有这些特征激励在人的视觉系统中,是在不同的通道进行处理的,这是早期的多通道理论。
而后进一步的理论得出,视觉机制的多通道之间并不是彼此孤立的,而是存在着相互的作用、判决与相互影响,以产生最佳视觉。
对于静止灰度图像来说,图像的多通道特性可以由它的空间频率和方向性来表征,只要用足够多的适当的调谐部件,图像在视觉皮层的整个方向带和频率带都可以被完全覆盖,即可以完全模拟视觉系统的多通道,但多通道之间的相互作用机制尚不明确。
3、掩盖效应一个激励单独存在时,是很容易辨识的,掩盖效应(masking )是指由于另一个激励的存在导致它完全不能或者不容易被检测到,即被掩盖了。
在描述多通道中激励之间的相互作用时,掩蔽效应是必须考虑的一种非常重要的现象。
另外,这种掩盖效应导致的视觉系统的探测阈值(JND ,Just Noticeable Difference )的改变,既可以是抑制,也可以是加强,在计算机视觉中,有时为了识别特定的目标,制作特定的掩盖器(masker ),这也是掩盖效应。
掩盖效应用阈值提升函数表示(TE, Threshold Elevation ),即对比度阈值随背景对比度变化的关系曲线,取决于掩盖物的带宽、相位、方向以及观察者对掩盖物的熟悉程度。
根据引发掩盖效应的起因,如强烈的局部对比度、边缘和局部活动性,把它区分为对比度掩盖、边缘掩盖与纹理(噪声)掩盖. 由于纹理(噪声) 比边缘结构复杂, 相对于观察者而言, 缺的先验信息更多, 因此, 纹理(噪声) 区的掩盖效应强(TE 曲线斜率增大),如图2所示。
图2 空间掩盖所引起的阈值提升4 基于人眼视觉特性图像质量评价算法本文所算法是利用小波变换与人眼视觉系统的多通道特性相匹配的特点,结合对比敏感函数的带通特性,将原始图像和降质图像进行误差合并,求出人眼视觉系统的信噪比,最后与传统图像评价方法PSNR 值进行比较,从而得出此种方法较传统方法的优势。
为了算法的简单有效,同时又能符合HVS 的感知特性,建立如图3的图像质量评价系统。
图3 图像质量评价系统其计算过程为:1、将原图像和降质图像分别进行小波分解,分解的方向为0D ,45D ,135D ,90D, 分解的级数为4级。
2、按“之”形方式对表4.1[11]数据扫描排列,有相同量级的权值可视为同属一个频带,该划分方法与DCT 系数对应上即可得到子带图像。
表1 HVS 特性对DCT 系数的加权矩阵 0.4942 1.0000 0.7023 0.3814 0.1856 0.0849 0.0374 0.01601.0000 0.4549 0.3085 0.1706 0.0845 0.0392 0.0174 0.0075 0.7023 0.3085 0.2137 0.1244 0.0645 0.0311 0.0142 0.0063 0.3814 0.1706 0.1244 0.0771 0.0425 0.0215 0.0103 0.0047 0.1856 0.0845 0.0645 0.0425 0.0246 0.0133 0.0067 0.0032 0.0849 0.0392 0.0311 0.0215 0.0133 0.0075 0.0040 0.00200.0374 0.0174 0.0142 0.0103 0.0067 0.0040 0.0022 0.0011 0.0160 0.0075 0.0063 0.0047 0.0032 0.0020 0.0011 0.0006原图像 降质图像 HVSNR对DCT 系数采用“之”形的排列方法,这样可保证图像低频分量先出现,高频分量后出现。