当前位置：文档之家› 人类视觉注意力的发展与分析

人类视觉注意力的发展与分析

2012年第12期吉林省教育学院学报No.12，2012第28卷JOURNAL OF EDUCATIONAL INSTITUTE OF JILIN PROVINCE Vol .28（总288期）Total No .296收稿日期：2012—10—18作者简介：陈梦泽（1984—），男，吉林长春人，长春师范学院数学学院，助教，硕士。

研究方向：图像处理，视频图像水印，计算视觉等。

人类视觉注意力的发展与分析陈梦泽（长春师范学院数学学院，吉林长春130000）摘要：人类视觉在面对复杂场景时，会迅速将注意力集中在显著性区域，从而发现其感兴趣的目标。

由于注意力选择机制的存在，这种处理的精确性和速度会超过机器视觉。

因此如何设计出能够模拟人类视觉注意力的模型是现在我们亟待解决的问题。

关键词：视觉注意；显著图；视觉特征中图分类号：TP391．41文献标识码：A文章编号：1671—1580（2012）12—0139—02人类进行视觉信息的处理主要通过人类视觉注意这一重要的心理调节机制，在信息爆炸的社会，有大量视觉信息输入的时候做有机筛选变得非常有必要，视觉注意力提供了这样的功能。

人类视觉系统可以帮助我们过滤一些不相关的信息，更加关注感兴趣的事物，通过及时分析视频中主要的信息（颜色、亮度、轮廓、运动等），从而快速地提取关键目标对象。

将这种机制引入到图像分析领域可以大大提高图像处理的效率。

它主要应用在下面几个主要领域：图像和视频的压缩及编码、信息隐藏和数字水印、目标分割和检测识别、图像检索、场景分析等。

一、静态图像影响视觉注意程度的主要因素图1观察图像最基本的视觉信息包括：颜色、亮度、轮廓、位置等。

根据人类视觉处理信息的流程，对于静止的图像，底层视觉特征是影响视觉注意程度的首要因素：物体的亮度越高越容易被关注、物体的边缘有较高的对比度可以得到更多的注意，颜色越鲜艳则在图片中更突出。

例如我们在看到图1时，我们会在第一时间注意到鱼，两只鱼在视觉上是显著的，它们的颜色和形状都和背景不一样，在水中很明显。

这种明确的视觉特性差异是由物理刺激形成的。

同时高层信息对注意力也有较大影响：例如人们会更注意尺寸大的或者细长条的物体，位于区域中央25%的区域比其余部分注意度高，例如图1中鱼的位置在图片的中央，就单一物体来说在画面中最大；前景比背景包含更多的语义信息，则具有更高的注意程度，例如在包含有人物的图像中，人物尤其是面部及面部器官更容易吸引注意。

对于静态图像的视觉注意力的研究有很多经典的模型。

最早的Treisman 提出的特征整合理论，把视觉信息处理过程分为前注意阶段和集中注意阶段，在前注意阶段提出各种视觉特征，并在注意阶段以串行方式整合为视觉客体。

在此基础上，1990年，Wolfe 提出了指向性搜索理论，对一幅图像，通过滤波得到各个视觉特征的特征图，然后通过不同的加权方式将其综合成一张特征图，图像中幅度大的地方就是感兴趣的区域。

1998年，Itti 等在Koch 的理论框架基础上提出了显著性的视觉注意模型，它的目标选择是基于自底向上数据驱动的，通过特征提取、显著图生成和注意焦点的转移三个过程来选取目标对象。

二、动态图像影响视觉注意程度的主要因素在视频中除了有静态图像影响视觉注意程度的因素外，最引人注意的是运动特征，高速行驶的汽车总要比静止的路标更吸引人的注意。

随着时间的推931移，对目标的注意力也会减弱。

在视频中，人眼对新事物的出现更加感兴趣。

在同一场景中，事物的数量越多则越会激发注意力。

另外，例如突然刺激、突发事件、闪烁等场景物件的事件属性具有较高的注意力程度。

视频或者图片中的感兴趣区域很大程度上和摄像头操作者的目的有关系，可以通过他们操作镜头的运动方式反映出来。

例如图1我们猜想照相的人想要给鱼特写的心理，而推论这张照片的主角应该是它，所以会给以更多的注意力。

当镜头固定时，关注的重点是感兴趣区域的中心。

当镜头在移动的时候，镜头移动的方向的场景要更重要一些。

如果拉伸镜头，镜头远，关注的更多是整体，镜头近，更多关注场景中的细节。

对于动态的图像，运动特征尤为重要。

大多数注意力模型都通过不同方法加入了运动的特征和注意规则。

例如You等人提出了一个用于视频分析的注意力模型，通过提取空间位置（距场景中央25%的区域注意力越强）、目标出现概率、运动向量、清晰度四个特征，最后将其生成一幅灰度图像，来表示注意力的大小强度。

Zhai等人提出了一种基于一致性图来计算运动对比的动态注意力模型，并且引用RANSAC方法估计点与点之间的匹配。

Zhao等人采用稀疏表示的方法进行特征融合，通过特征稀疏描述子来衡量每一个特征对显著度的贡献，给予不同的权重，最后生成最终的显著性图。

基于频域分析的计算模型主要以Hou等人的光谱剩余假说和Hu等人提出的特征值极变换的子空间分析方法为代表。

基于区域分割的计算模型中，M．Aziz等人以区域为单位的颜色、纹理、形状和自身奇异性的显著性度量和H．Liu等人提出的基于图像分割的区域竞争方法，将图形分割为不同的区域，计算相邻区域间的显著性竞争。

三、研究展望1．注意力机制是计算机、生物、心理学和认知科学等学科的交叉，必须首先了解人类的认知规律。

目前人类视觉的认知特性还有很多未被发掘，并且人类视觉注意力机制并没有统一的理论框架作为参考，只有继续加强人类注意机制的研究，发掘人类视觉处理信息的规则将其模型化，才能更好地将之应用于计算机信息处理领域。

2．底层视觉特征和高层视觉特征的综合作用会让我们对事物的注意程度不同，这些特征之间的贡献也是不一样的。

现在有很多不同的加权方法，让不同的特征有不同的贡献度，使之更符合人眼观察事物的规律，那么如何选择权重就显得非常重要。

3．自底向上计算模型与自顶向下计算模型的结合。

人类的视觉注意过程是由自下而上的初级视觉特征的加工和自上而下的任务的指导相结合共同完成的。

而大多数的模型都是单一的过程，将自底向上和自顶向下的计算模型有机地结合起来可以更好地模拟人类视觉注意力机制，对机器视觉有广阔的研究前景。

4．视频由于加入了时间轴特性，相对于自然图像更复杂，视频视觉注意计算模型相对较少，因此在未来有很大研究空间。

对视频中显著区域对象用高维的语义来描述可以更加接近人类视觉，对于视频分析，如视频检索分类等具有相当的研究意义。

［参考文献］［1］L．Itti，C．Koch＆E．Niebur．A Model of Saliency－Based Visual Attention for Rapid Scene Analysis［J］．IEEE Transactions on Pat-tern Analysis and Machine Intelligence，1998．［2］J．You，G．Liu＆H．Li．A novel attention model and its appli-cation in video analysis［J］．Applied Mathematics and Computation，vol．185，2007．［3］Y．Zhai，M．Shah．Visual Attention Detection in Video Se-quences Using Spatiotemporal Cues［J］．ACM International Conference on Multimedia，2006．［4］C．Zhao＆C．Liu．Sparse Embedding Feature Combination Strategy for Saliency－based Visual Attention System［J］．Journal of Com-putational Information System，vol．6，2010．［5］HouX＆ZhangL．Salieney Deteerion：AS Peetral Residual AP-Proach［C］．Proeeedings of IEEE Conferenee on ComPuter Visionand Pat-tern Reeognition，2007．The Development and Analysis of Human Visual AttentionCHEN Mengze（School of mathematics，Changchun Normal University，Changchun，Jilin，130000）Abstract：In the complex scene，human vision focuses on the significant regions quickly，and looks for the objects we are interest-ed in．This processing speed and accuracy of human vision will become much greater than that of computer vision because of the visual attention．So how to design a new model that matches the visual attention is an important issue to resolve．Key words：visual attention；significant diagram；visual features041。

e商务文档

人类视觉注意力的发展与分析

相关文档推荐：