当前位置：文档之家› 图像序列的显著性目标区域检测方法

图像序列的显著性目标区域检测方法

第５期
柯洪昌，等：图像序列的显著性目标区域检测方法
７６９
ｐｅｒｉｍｅｎｔ．Ｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｅａｖｅｒａｇｅｓｉｍｉｌａｒｉｔｙｏｆｆｏｃｕｓｏｆａｔｔｅｎｔｉｏｎｉｓ０畅８７．Ｔｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄｃａｎｍｏｒｅｅｆｆｉｃｉｅｎｔｌｙａｎｄａｃｃｕｒａｔｅｌｙｌｏｃａｔｅｔｈｅｒｅｇｉｏｎｗｈｅｒｅｔｈｅｓｅａｒｃｈｅｄｔａｒｇｅｔｍａｙｂｅｐｒｅｓｅｎｔａｎｄｃａｎｉｍｐｒｏｖｅｔｈｅｅｆｆｉｃｉｅｎｃｙｏｆｔａｒｇｅｔｓｅａｒｃｈｉｎｇ．Ｋｅｙｗｏｒｄｓ：ｖｉｓｕａｌｓａｌｉｅｎｃｙ；ｔｏｐ－ｄｏｗｎ；ｔａｒｇｅｔａｒｅａｄｅｔｅｃｔｉｏｎ；ｓａｌｉｅｎｃｙｍａｐ
Ｇ（ｘ，ｙ）
＝１ｅ２－（ｘ２２σ＋２１ｙ２）２πσ１
－２
１ πσ２２
ｅ
－（
ｘ２２σ＋２２ｙ２）
பைடு நூலகம்
．（２）
当 σ１＜σ２时，Ｇ（ｘ，ｙ）称为二维ＯＮ型ＤｏＧ算子；当 σ１＞σ２时，Ｇ（ｘ，ｙ）称为二维ＯＦＦ型ＤｏＧ算子。 σ１的作用是控制Ｃｅｎｔｅｒ（中央凹）的敏感区，而 σ２的作用是控制Ｓｕｒｒｏｕｎｄ（外围）的敏感区。
本文在前人工作的基础上，设计并实现了一个融入运动特征的视觉显著性模型，基于这个模型，提出一种基于多尺度差分的运动特征提取方法，在指导全局显著图的生成时，基于多通道参数估计方法计算各通道在整合时的权重，从而能准确定位目标在图像上的位置。
本文首先提取当前帧图像的亮度、颜色和方向信息，通过高斯金字塔和小波分解滤波，然后归一化处理计算得到多尺度特征，生成各个通道的显著图；在得到运动显著图时，要对当前帧和前一帧图像分别滤波提取动态特征，然后对两帧图像的特征图进行多尺度的差分，再融合为运动显著图；最终通过多通道加权方法生成全局显著图，采用ＷＴＡ机制来最终得到感兴趣区域，即注意焦点。融入运动特征的视觉显著性模型如图１所示。
３．１静态特征提取静态显著性特征的提取是在Ｉｔｔｉ视觉注意模
型基础上进行的。本文在方向特征提取上进行了改进，使融合后的静态显著图更有利于和动态显著图融合。对输入图像用９层高斯金字塔进行滤波，提取亮度、颜色、方向特征，由于视觉神经元一般对于视觉场景中一小段范围最敏感，而对于它的周围有局部的抑制作用，因此这里对于亮度和颜色，采用中央－外围（Ｃｅｎｔｅｒ－Ｓｕｒｒｏｕｎｄ）算子进行差分，它是基于ＤｏＧ（ＤｉｆｆｒｅｎｃｅｏｆＧａｕｓｓｉｏｎｓ）方式：
收稿日期：２０１５－０７－１２；修订日期：２０１５－０９－２０基金项目：国家高技术研究发展计划（８６３计划）资助项目（Ｎｏ．２０１２ＡＡ０４０１０４）；吉林省科技厅资助项目（Ｎｏ．
２０１２０３３２）；吉林省发改委资助项目（Ｎｏ．２０１３Ｃ０４８）；吉林省科技厅国际合作资助项目（Ｎｏ．２０１４０１０５）；吉林省教育厅资助项目（Ｎｏ．２０１３０４３４，Ｎｏ．２０１４００３２）
Ｉσ（ｘ，ｙ）
＝
１４
Ｉσ－１（２ｘ，２ｙ）
＋１８
［Ｉσ－１（２ｘ
＋
γ，２ｙ）＋Ｉσ－１（２ｘ，２ｙ＋γ）］＋，（６）
１１６
Ｉ
σ－１
（
２ｘ
＋γ，２ｙ
＋γ）
式中，σ代表金字塔的尺度，γ的值取１，－１。
式（７）为
ｘ
和
ｙ
的范围，满足
０
≤２
ｘ
≤ｗ
σ－１ｋ
，０
≤２ｙ≤ｈσ ｋ－１。
摘要：针对传统视觉显著性模型在自顶向下的任务指导和动态信息处理方面的不足，设计并实现了融入运动特征的视觉显著性模型。利用该模型提取了图像的静态特征和动态特征，静态特征的提取在图像的亮度、颜色和方向通道进行，运动特征的提取采用基于多尺度差分的特征提取方法实现，然后各通道分别通过滤波、差分得到显著图，在生成全局显著图时，提出多通道参数估计方法，计算图像感兴趣区域与眼动感兴趣区域的相似度，从而可在图像上准确定位目标位置。针对２０组视频图像序列（每组５０帧）进行了实验，结果表明：本文算法提取注意焦点即目标区域的平均相似度为０畅８７，使用本文算法能够根据不同任务情境，选择各特征通道的权重参数，从而可有效提高目标搜索的效率。关键词：视觉显著性；自顶向下；目标区域检测；显著图中图分类号：ＴＰ３９１．４文献标识码：Ａｄｏｉ：１０．３７８８／ＣＯ．２０１５０８０５．０７６８
图１融入运动特征的视觉显著性模型Ｆｉｇ．１Ｖｉｓｕａｌｓａｌｉｅｎｃｙｍｏｄｅｌｆｕｓｅｄｗｉｔｈｍｏｔｉｏｎｆｅａｔｕｒｅｓ
本文生成全局显著图，将亮度显著图、颜色显
著图、方向显著图和运动显著图进行多尺度融合。
全局显著图Ｓ的计算公式如下，
～
～
～
～
Ｓ＝αＩ＋βＣ＋γＯ＋λＭ，
Ｏ（ｃ，ｓ，θ）＝｜Ｏ（ｃ，θ）磓Ｏ（ｓ，θ）｜，（５）
式中，ｃ代表Ｃｅｎｔｅｒ的某一尺度，ｃ∈｛２，３，４｝，即９层中的第２，３，４层，θ∈｛０，π／４，π／２，３π／４｝，代表４个方向。３．２基于多尺度差分的运动特征提取
运动特征的提取并没有采用传统的帧差法来处理，本文提出一种基于多尺度差分的运动特征提取方法，方法原理为：对相邻两帧图像进行不同尺度的滤波，可得到图像Ｉσ，其中 σ∈｛０，１，２，３，４｝，代表５个尺度，设当前帧图像为Ｉｔ（ｘ，ｙ），前一帧图像为Ｉｔ－１（ｘ，ｙ），图像Ｉｔ（ｘ，ｙ）金字塔中的每一层图像可以通过上一层的图像通过差分迭代生成，同理我们可以得到其他层图像金字塔。如式（６）所示。
第８卷第５期２０１５年１０月
中国光学
ＣｈｉｎｅｓｅＯｐｔｉｃｓ
Ｖｏｌ．８Ｎｏ．５Ｏｃｔ．２０１５
文章编号２０９５－１５３１（２０１５）０５－０７６８－０７
图像序列的显著性目标区域检测方法
柯洪昌倡，孙宏彬
（长春工程学院计算机技术与工程学院，吉林长春１３００１２）
当前有些学者将协同感知理论［１２］、多尺度分析和编组、多尺度熵理论应用到视觉注意的整合阶段［１３－１４］，并取得了较好的效果。但是这些模型仅是基于空间注意，并且在处理动态信息时略显不足。并且大部分模型往往都存在计算复杂性过高的问题。一些关于心理学及神经科学的研究成果表明，在视觉通路中，对于亮度、颜色和方向等特征的提取通常并不需要同等对待，往往都会随着自顶向下给出任务的不同而不同，这种特征权重随任务而改变的视觉信息处理机制使得人们能够快速有效地定位目标［１５－１６］。因此，需要根据任务情境的不同计算相应通道的特征权重值，来指导全局显著图的生成，进而准确地定位目标。
对于输入图像Ｉ的亮度特征Ｉ（ｃ，ｓ），可以用尺度差分得到：
Ｉ（ｃ，ｓ）＝｜Ｉ（ｃ）磓Ｉ（ｓ）｜，
（３）
式中，ｃ代表Ｃｅｎｔｅｒ的某一尺度，ｃ∈｛２，３，４｝，即９层中的第２，３，４层；其中ｓ代表Ｓｕｒｒｏｕｎｄ的某一尺度，ｓ∈｛３，４｝，即９层中的第３，４层，代表两个特征图的每个像素作差分。
因此
Ｉσ
的宽度
ｗσ ｋ
和高度
ｈ
σ ｋ
满足：
ｗσ ｋ
≤
ｗσ－１ｋ２
＋１
．
ｈ
σ ｋ
≤
Ｔｅｃｈｎｏｌｏｇｙ，Ｃｈａｎｇｃｈｕｎ１３００１２，Ｃｈｉｎａ）倡Ｃｏｒｒｅｓｐｏｎｄｉｎｇａｕｔｈｏｒ，Ｅ－ｍａｉｌ：ｋｅｈｏｎｇｃｈａｎｇ１９８１＠１６３．ｃｏｍ
Ａｂｓｔｒａｃｔ：Ｆｏｒｔｈｅｌａｃｋｏｆｔｏｐ－ｄｏｗｎｔａｓｋｇｕｉｄａｎｃｅａｎｄｄｙｎａｍｉｃｉｎｆｏｒｍａｔｉｏｎｐｒｏｃｅｓｓｉｎｇｏｆｔｒａｄｉｔｉｏｎａｌｖｉｓｕａｌｓａｌｉ－ｅｎｃｙｍｏｄｅｌ，ａｖｉｓｕａｌｓａｌｉｅｎｃｙｍｏｄｅｌｆｕｓｅｄｗｉｔｈｔｈｅｍｏｔｉｏｎｆｅａｔｕｒｅｓｉｓｄｅｓｉｇｎｅｄａｎｄｉｍｐｌｅｍｅｎｔｅｄ．Ｔｈｅｓｔａｔｉｃｆｅａｔｕｒｅｓａｎｄｍｏｔｉｏｎｆｅａｔｕｒｅｓａｒｅｅｘｔｒａｃｔｅｄｂａｓｅｄｏｎｔｈｅｐｒｏｐｏｓｅｄｍｏｄｅｌ．Ｔｈｅｓｔａｔｉｃｆｅａｔｕｒｅｓａｒｅｅｘｔｒａｃｔｅｄｆｒｏｍｔｈｅｉｎｔｅｎｓｉｔｙ，ｃｏｌｏｒａｎｄｏｒｉｅｎｔａｔｉｏｎｃｈａｎｎｅｌｏｆｔｈｅｃｕｒｒｅｎｔｆｒａｍｅｉｍａｇｅ．Ｔｈｅｍｏｔｉｏｎｆｅａｔｕｒｅｓａｒｅｅｘｔｒａｃｔｅｄｂａｓｅｄｏｎｔｈｅｍｕｌｔｉ－ｓｃａｌｅｓｄｉｆｆｅｒｅｎｃｅｍｅｔｈｏｄ．Ｔｈｅｓａｌｉｅｎｃｙｍａｐｓｏｆｆｏｕｒｃｈａｎｎｅｌｓｃａｎｂｅｏｂｔａｉｎｅｄｂｙｆｉｌｔｅｒｉｎｇａｎｄｄｉｆｆｅｒｅｎｃｅ．Ｂａｓｅｄｏｎｔｈｅｐｒｏｐｏｓｅｄｍｏｄｅｌａｍｅｔｈｏｄｏｆｐａｒａｍｅｔｅｒｅｓｔｉｍａｔｉｏｎｆｏｒｍｕｌｔｉｃｈａｎｎｅｌｉｓｐｒｏｐｏｓｅｄｔｏｃａｌｃｕｌａｔｅｔｈｅｓｉｍｉｌａｒｉｔｙｂｅｔｗｅｅｎｔｈｅｒｅｇｉｏｎｏｆｉｎｔｅｒｅｓｔｉｎｇｏｆｃｕｒｒｅｎｔｉｍａｇｅａｎｄｔｈｅｒｅｇｉｏｎｏｆｉｎｔｅｒｅｓｔｉｎｇｏｆｅｙｅｓｍｏｖｅｍｅｎｔ，ｔｈｅｎｇｕｉｄｅｔｏｇｅｎｅｒａｔｅｔｈｅｇｌｏｂａｌｓａｌｉｅｎｃｙｍａｐ，ｗｈｉｃｈｃａｎｐｒｏｖｉｄｅａｃａｌｃｕｌａｔｉｏｎｍｅｃｈａｎｉｓｍｆｏｒａｃ－ｃｕｒａｔｅｌｏｃａｔｉｏｎｏｎｉｍａｇｅｓ．２０ｇｒｏｕｐｓｏｆｖｉｄｅｏｉｍａｇｅｓｅｑｕｅｎｃｅｓ（５０ｉｍａｇｅｓｐｅｒｇｒｏｕｐ）ａｒｅｓｅｌｅｃｔｅｄｆｏｒｔｈｅｅｘ－

e商务文档

图像序列的显著性目标区域检测方法

相关文档推荐：