色彩恒常性综述色得对物体颜色的稳定知觉。
计算机视觉的色彩恒常性可以定义为在未知环境光照和单视野的条件下,计算机视觉系统自动地得到图像中物体颜色的稳定描述。
色彩恒常性的研究包括心理学、神经生理学等各个领域,早期对色彩恒常性的研究主要集中于探讨在不同光照条件下,色彩恒常性的保持程度。
研究者经常采用颜色匹配方法,通过计算具有特定意义的数学系数来表示颜色恒常程度,随着色彩恒常性研究的进展,逐步形成了色彩恒常性的理论。
一、色彩恒常性的研究意义及现状我们所看到物体的颜色总好像是物体恒定的属性一样,不论是在晴天、雾天还是阴雨天,或是白炽灯的照射下,总是保持同样的颜色,其实这是人类视觉系统一项很特别的功能。
人类视觉所接受到的信息都是通过瞳孔达到视网膜,所看到的物体事实上是人眼视网膜接受到反射光线的作用,所以,当物体不是发光源时,他本身不能决定进入人眼的信息,视网膜上的信息由光源和物体本身的属性共同决定。
当光源发生变化时,视觉系统中关于物体的色彩信息发生改变,但是我们还是能够对物体的色彩认知保持大致的恒定,这种现象就称为色彩恒常。
这种对颜色的适应特性,对人类适应自然环境具有十分重要的意义。
彩恒常性是人类的视觉认知功能之一,它使人们能够忽略环境光照的光谱成分变化,从而获表 打印机色彩管理样张与自定义ICC样张色差比较由表可知,在前四种打印机色彩管理的驱动程序级的色彩管理方案中,第一种颜色复制流程的最大色差和平均色差远大于后三种颜色复制流程。
这意味照片打印时不做任何色彩色彩管理打印出照片的颜色与屏幕上观看的颜色差异特大而不能接受,即颜色匹配基本不存在,所以不会采用这种方式打印照片。
驱动程序级后三种颜色复制流程(色彩控制、图像增强技术、I C M)的最大色差和平均色差差异较小,但这三种色彩管理方案的照片颜色匹配较好、颜色模拟的准确度较强,原则上这种照片质量是可以接受的。
所以喷墨打印机一般自带丰富的I C C特性文件,这在很大程度提高了使用者对于打印机进行色彩管理的便捷性。
但喷墨打印机即使用原厂商耗材也会产生色彩的偏差,所以原厂商任何预先提供的I C C都很难符合要求,解决办法就是自制适合实际使用墨水和纸张的I C C文件。
在最后一个应用程序级的颜色复制流程中,由于单独针对目标打印条件制作了I C C特性文件,因此该颜色复制流程对应的色差值都是最小的,说明其颜色匹配效果最佳。
所以有条件还是选择自制适合实际使用的I C C文件打印照片。
三、小结实验主要是基于不同的色彩管理条件会导致打印的照片呈色有差异的原理,所以设计出打印照片色彩匹配实验进行研究。
实验选择T C9.18R G B色标共928个色块作为研究对象,通过P h o t o s h o p驱动喷墨打印机以不同色彩管理条件打印照片样张,借助精心设计色差角度进行评价打印照片质量,最终确定自定义喷墨打印机I C C特性文件的色彩管理条件在色差方面进行照片色彩匹配表现是最佳选择。
同时实验采用的五种不同的色彩管理条件对喷墨打印照片进行色彩匹配实验研究是具有广泛性研究意义的。
作者单位:河南工程学院责任编辑/欧定军文/于艺铭王琪对色彩恒常性的研究一直是近年来计算机视觉的研究热点,许多学者对色彩恒常性的研究前赴后继,得到了许多非常有价值的研究成果,目前有许多著名的研究机构都在进行色彩恒常性研究,有美国的德克萨斯农工大学、塔夫斯大学、马来西亚的布特拉大学、韩国水原大学、南京理工大学、上海交通大学、武汉理工大学、合肥工业大学等等、并且都取得了非常显著的研究成果。
目前,R e t i n e x算法在色彩恒常性研究领域非常流行,是第一个可用于计算的色彩恒常重要算法。
R e t i n e x理论是基于照度分量估计的方法理论,其理论认为图像是由反射分量和照射分量的乘积组成,能够反映图像原来本质信息的是其中的反射分量,而照度分量对图像进行干扰,使得采集到的图像视觉效果不理想。
R e t i n e x理论采用某种方法对照度分量进行计算,然后从原图像中将照度分量去除,去除干扰部分,以得到图像的反射分量,实现对图像的增强,得到图像的本来面貌。
二、色彩恒常性理论人眼的视觉过程从离开光源的一束光线开始,照射到物体上的某一点,物体材质特性而形成的反射特性决定了有多少入射光被反射,然后被人眼接受,人类的视网膜细胞存在三类接收器,吸收光谱中长、中、短三种波长的光线,来分析入射光所携带的色彩信息,我们通过分析整个可视光谱率来精确描述物体反射了多少光,而反射特性需要通过分析在各种能量分布光照射下的物体来得知。
像照相机这样的图像采集设备因不知道照射光的能量分布而无法得到物体的反射特性,我们不知道物体的反射特性也不知道光束的类型,而照相机采集到的只是照射到物体上面光束的反射产物,因而也不具备人类视觉的色彩恒常这个特殊功能。
目前计算机视觉研究领域主要的色彩恒常理论有:灰色世界理论、R e t i n e x、V o n K r i e s色适应模型,下面主要介绍一下有关色彩恒常性的这几种经典理论,然后着重介绍R e t i n e x理论的经典算法。
1.色彩恒常性的含义光线透过人眼的水晶体,到达眼球后侧的视网膜(r e t i n a),视网膜由一组组可以采集光线的接受器组成,是一层透明的薄膜,光线刺激视网膜上的感光细胞产生兴奋,并经过视神经传导到大脑,于是视觉中枢产生视觉。
人类看到的颜色是通过大脑和视觉神经处理而得到的结果。
人眼只能接受从物体上反射的那部分光线,而物体反射的光线随着光照发生变化,人类视觉系统在光照发生变化的情况下能够得到恒常不变的视觉结果。
Z e k i在1993年提出人类视觉系统在不理想的光照下,仍然可以区分各种色彩的能力,称为色彩恒常性。
色彩是很重要的生物信号机制,一些其他的物种如金鱼、蜜蜂,也有着色彩恒常机制。
对于人类视觉系统所具有颜色常性的原因,目前存在两种主要解释。
一种是黑林提出的,黑林提出的四色论是对立过程的前身,他认为,在视网膜中存在三对视素,分别是黑-白视素、红-绿视素、黄-蓝视素,当人眼收到光线刺激时,这些视素进行对抗,有同化和异化过程,从而产生色觉。
他认为人眼对色彩具有记忆性,大脑对于我们所看到的视觉信息所作出的判断并不是完全客观的,难以排出其他心理因素,总会带有主观成分。
当外界的光照条件发生变化,大脑会以生活经验所产生的色彩记忆对所看的外面世界进行判断和补正。
在太阳光下所看到的物体颜色被人们确定为“固有色”,支配着人们对物体颜色的知觉。
比如,处于黑暗中的棉花,虽然光的强度弱于阳光下的煤炭,人们还是认为棉花是白色的,煤炭是黑色的。
后来,自卡茨对颜色常性进行了进一步研究,把颜色常性的观点引入到心理实验室,并集中研究了在照明变化的情况下,常性知觉的特性。
另一种是赫尔姆霍茨提出的不同观点,他理解为“建立在无意识感觉上的理智判断”,他对三色说进行发展,假定视网膜中存在红、绿、蓝三种基本色觉。
视网膜中对应的存在三类视锥细胞,接受光线刺激时,这三种视锥细胞分解相应的感光化学物质,然后将刺激传递到相应的神经系统,根据刺激强度的组合比例合并产生各种色觉。
他认为感觉和知觉之间存在区别,刺激的直接作用产生了感觉,没有经验和其他心理因素影响,知觉是对事物认识的一个整个过程,在日常生活中,不存在纯粹的感觉,只有知觉,许多过去的经验和心理因素附着在知觉上,从而使人们无法直接感觉到真实的刺激,加之反复演习和联系,形成“无意识推理”,例如,一个灰色刺激呈现于红色背景上,它便与红色形成对比,我们因无意识推理而把它看成相反的颜色,即绿色。
2.灰色世界理论反射特性,指对于一定波长光的反射量,决定了物体的颜色,生物上称为亮度(l i g h t n e s s )。
当人们依次看着从黑、灰到白色渐变的几个纸片,每一个灰度级的纸片对人大脑的刺激都是不一样的,这种刺激就称为亮度。
亮度无法通过光度计测量,可以通过人类视觉系统实验间接得到。
反射系数和亮度的关系是非线性的,如图1。
图1 反射系数与亮度关系在 1992 年,提出反射特性R 与灰度尺度的相关公式如公式(1)所示Y =k R (1)这里K 为常数,后来又有学者用立方根来代替原有公式中的平方根,图2给出了几种拟合反射特性和亮度关系的几种方法。
图2 几种拟合反射特性与亮度关系最终得到最佳拟合公式(2):Buchsbaum 于1980 提出了灰色世界理论,他假设图像像素的色彩分布是均匀的,来计算接受器接收到光的一些均值。
Buchsbaum 通过假设在视觉范围内有一个标准空间光谱均值存在来估计照度,再通过照度估计出反射系数。
根据彩色图像信息理论,传感器采集到的强度 I (x ,y )=g (x ,y )ψ(x ,y )e (x ,y ),I 是反射光,是被观察者或照相机接受到的我们看到的彩色图像。
摄像机采集图像时,α=0,则可推出 g (x ,y )=1,从而有:反射分量ψ决定了图像的内在性质,照度分量e 直接决定了一幅图像中像素能达到的动态范围。
首先,我们进行整体照度估计,可以将e (x ,y )设为常量e ;图像的像素值在[0,1]之间。
如果图像中的色彩分布均匀,则像素的均值接近于(1/2)e ,后计算图像的均值,几何信息和反射分量是相互独立的,反射分量ψ(x ,y )均匀分布在区间[0,1]内,有:运用公式(5),我们可以估计出照度分量:这里ξ=2/E(g)是与场景有关的因素,可以估计出几何信息和反射分量的集合,计算出与照度无关的色彩恒常标识 Φ :3.Retinex 理论色彩恒常一直吸引着很多学者对其进行研究。
E d w i n H L a n d 是宝丽来公司的创始人,同样也是色彩恒常领域著名的研究学者之一,1974 年,提出色彩恒常性的第一个计算方法 R e t i n e x 对色彩恒常领域影响很大。
在Land 的Retinex 理论中,数码设备采集到的图像s 主要由入射分量e 及反射分量r 两部分组成:s =e × r 在上式中,e 示入射分量,r 表示目标物体本身具有的反射性质,s 表示被数码设备采集到的彩色图像,也就是反射光。
而事实上,入射分量e 直接决定了一幅图像中像素能达到的动态范围,反射分量r 决定了图像的内在固有的属性,基于 R e t i n e x 理论的图像增强方法思路,就是通过某种方法从原图像s 中得到其反射分量 r ,以消除入射分量e 的影响,来获得目标物体本来的面貌。
L a n d 很早就意识到,人们所看到的颜色是依赖(7)1/2(2)(5)a =e E (g ψ )=e E (g )E (ψ )i i ii i (6)(3)(4)I (x ,y )=e (x ,y )ψ (x ,y )i i i Φ (x ,y )=ψ (x ,y )i i e = a = a i i E (g )2iξΦ (x,y)= ≈ =g (x,y)ψ (x,y)iI (x,y)a iξig(x,y)ψ (x,y)e i ie ii i iY =9.033R0.01510.4296-于光谱中不同波长的光束相对排列关系,而非完全决定于反射光线。