第44卷 第1期 电 子 科 技 大 学 学 报 Vol.44 No.1 2015年1月 Journal of University of Electronic Science and Technology of China Jan. 2015
基于全变分模型的视觉感知图像质量评价方法 吴亚东1,2,张红英3,4 (1. 西南科技大学计算机科学与技术学院 四川 绵阳 621010;2. 西南科技大学核废物与环境安全国防重点学科实验室 四川 绵阳 621010; 3. 西南科技大学信息工程学院 四川 绵阳 621010;4. 西南科技大学特殊环境机器人技术四川省重点实验室 四川 绵阳 621010)
【摘要】基于人眼视觉系统对图像边缘结构信息和局部亮度刺激敏感的假设,该文提出了一种基于全变分模型的视觉感知图像质量评价PIQA方法。该方法由边缘结构信息评价和局部亮度信息评价两部分组成。本文首先采用全变分模型描述失真图像与原始参考图像之间的图像结构信息变化;为测量亮度失真,又采用失真图像与参考图像之间的差值图像中封闭区域的能量函数来衡量人眼敏感的图像亮度信息。最后,采用3种标准图像数据库验证该评价方法的性能。实验结果表明,所提出的图像质量评价方法优于现有的图像评价标准。 关 键 词 能量函数; 人眼视觉系统; 感知图像质量评价; 全变分 中图分类号 TP394.1 文献标志码 A doi:10.3969/j.issn.1001-0548.2015.01.013
A New Perceptual Image Quality Assessment Method Based on Total Variation Model
WU Ya-dong1,2 and ZHANG Hong-ying3,4 (1. School of Computer Science and Technology, Southwest University of Science and Technology Mianyang Sichuan 621010; 2. Fundamental Science on Nuclear Wastes and Environmental Safety Laboratory, Southwest University of Science and Technology Mianyang Sichuan 621010; 3. School of Information and Engineering, Southwest University of Science and Technology Mianyang Sichuan 621010; 4. Robot Technology Used for Special Environment Key Laboratory of Sichuan Province,
Southwest University of Science and Technology Mianyang Sichuan 621010)
Abstract In this paper, based on the assumption that human visual system(HVS) is sensitive for image structures (edges) and local luminance (light stimulation), we propose a new perceptual image quality assessment (PIQA) metric based on total variation(TV) model in spatial domain. In the proposed metric, the TV’s comparison between a distorted image and its reference image is applied to measure the extent of the loss of the image structural information. As a complementary part to measure the distortion, the energy of enclosed regions in a difference image is used to measure the missing luminance information which is sensitive to human visual system. The performance of the proposed metric is validated with an extensive subjective database. The results show that the proposed metric outperforms the state-of-the-art of image quality assessment metrics. Key words energy function; HVS; PIQA; TV
收稿日期: 2014 − 02 − 25;修回日期: 2014 − 11 − 30 基金项目:国家自然科学基金(61303127);国家科技支撑计划(2013BAH32F02,2013BAH32F03);四川省科技厅项目(2011JQ0041, 11ZS2009); 中国科学院“西部之光”人才培养计划(13ZS0106) 作者简介:吴亚东(1979 − ),男,博士,教授,主要从事图像处理、可视化方面的研究.
图像质量评价方法在视觉处理算法中扮演着重要角色,具有重要的应用价值。人是图像信号的最终接收者,最直观、最符合HVS的图像质量评价方法是主观测试评价,最常用的主观图像质量评价方法是平均意见打分(mean opinion score,MOS)方法。然而,该方法代价昂贵且费时,在实际图像处理应用中不太实用。主观图像质量评价方法的不足,促使研究人员在自动计算图像主观视觉质量的评价方法方面开展了大量研究工作[1-8]。
根据不同的图像质量评价方法,图像质量评价标准可分为两大类:基于HVS特性建模方法和图像信号驱动方法[1]。
基于HVS特性建模方法综合相关心理学属性和生理学知识,包括时间、空间、色彩空间分解、对比度敏感函数(contrast sensitivity function,CSF)、亮度自适应以及掩模效果等[1],采用系统建模方法,
建立图像质量评价模型。近年来,许多基于HVS的图像质量评价方法[2-3]被提出,其中一些方法也考虑 电 子 科 技 大 学 学 报 第44卷 80
了最小可觉差(just noticeable distortion,JND)模 型[4-5]。视觉心理学中的视觉模型被应用到基于HVS的图像质量评价方法中,效果较好。但该类评价方法计算量大,且视觉机理研究与实际工程建模不匹配[1],导致这类方法的应用有局限性。 近年来,基于信号驱动的图像质量评价方法受到广泛关注。该类评价方法基于图像信号的提取与分析,比如统计特征、结构、亮度失真等[6-8]。信号驱动方法不是为了图像质量评价而试图去建立复杂的HVS模型,而是重点关注如何表达图像特征以估计图像整体质量。该类方法通常也会考虑图像内容和失真分析的心理学效应。然而,虽然一些图像保真度模型能够反应图像质量的变化,但由于一些缺陷[1],该类评价方法并不能表达HVS的主观感受。例如,并不是每一个图像的变化都容易被觉察,也不一定导致失真。因此,信号驱动的图像质量评价方法需引入HVS特性来弥补这些不足,从而更加逼近人眼主观感受。 1 全变分模型 变分方法已被广泛应用于图像处理和计算机视觉领域[9]。由文献[10]提出的TV模型是图像处理中最成功的偏微分方程(partial differential equation,PDE)模型之一。全变分可描述为: TV()uuΩ=∇∫ (1) 式中,Ω表示图像区域;u表示图像。 文献[9-10]表明,TV范数描述图像最合适。TV范数本质上是1L范数,更适合估计、描述图像的不连贯性[9]。本文采用它来衡量图像的结构变化,即原始图像与失真图像之间的结构变化距离。 本文提出的基于TV模型的PIQA方法,将重点考虑图像结构和图像封闭区域亮度变化。与其他图像质量评价方法相比,最大的区别是引入了TV模型来评价图像在空间域的结构变化,同时也考虑了图像中封闭区域的亮度变化。 2 基于全变分模型的图像质量评价 2.1 基于TV模型的图像质量评价框架 通过HVS观测自然图像时,有许多因素影响图 像质量。其中,有两种重要因素值得考虑:1) 图像边缘结构信息;2) 亮度信息[11]。基于此,本文提出
一种新的基于TV模型的PIQA (TVPIQA)方法。
图1 基于TV模型的图像质量评价框架 基于TV模型的图像质量评价框架如图1所示。u
表示失真图像;0u表示参考图像;r表示差分图像;
1u表示结构改变度量;2u表示局部区域亮度改变量。TVPIQA方法分为两部分:1) 结构改变度量,采用归一化的TV比较计算,通过对比失真图像与参考图像来度量图像结构信息的改变;2) 局部区域亮度改变度量,采用差分图像(参考图像与失真图像之差)中封闭区域的能量来衡量亮度信息的改变,并进行归一化。设上述两种因素对人眼视觉的影响是同等的,则TVPIQA可描述为:
12TVPIQA
2
µµ+
= (2)
2.2 基于TV的结构改变度量 由于TV范数适合描述图像的不连贯性,因此,图像结构信息的改变可由参考图像与失真图像之间全变分的改变量来衡量:
struct01
TVTV()TV()uu=− (3)
式中,1⋅表示1L范数;TV()u为图像u的全变分,
其离散形式为: 22,1,,,1(,)TV()(()())ijijijijijuuuuuΩ++∈
=−+−∑ (4)
式中,,iju表示在像素点(,)ij的亮度值。
虽然式(3)能很好地评价图像结构信息的改变,但计算结果没有归一化,不能作为衡量图像质量的 评价标准。考虑201
TV()TV()0uu−≥,归一化的图
像结构改变量描述为:
2222,1,,,10,01,0,0,1
12222
,1,,,10,01,0,0,1
2()()()()1()()()()ijijijijijijijijijijijijijijijijuuuuuuuucNuuuuuuuucµ++++++++−+−−+−+=−+−+−+−+