当前位置:
文档之家› 图像序列的显著性目标区域检测方法
图像序列的显著性目标区域检测方法
第5 期
柯洪昌,等:图像序列的显著性目标区域检测方法
769
periment.Experimental results show that the average similarity of focus of attention is 0畅87.The proposed method can more efficiently and accurately locate the region where the searched target may be present and can improve the efficiency of target searching. Key words: visual saliency;top-down;target area detection;saliency map
G( x,y)
= 1 e2 -( x22σ+21y2) 2πσ1
- 2
1 πσ22
e
-(
x22σ+22y2)
பைடு நூலகம்
.(2)
当 σ1 <σ2 时,G(x,y)称为二维 ON 型 DoG 算 子;当 σ1 >σ2 时,G(x,y)称为二维 OFF 型 DoG 算 子。 σ1 的作用是控制 Center( 中央凹) 的敏感区, 而 σ2 的作用是控制 Surround(外围)的敏感区。
本文在前人工作的基础上,设计并实现了一 个融入运动特征的视觉显著性模型,基于这个模 型,提出一种基于多尺度差分的运动特征提取方 法,在指导全局显著图的生成时,基于多通道参数 估计方法计算各通道在整合时的权重,从而能准 确定位目标在图像上的位置。
本文首先提取当前帧图像的亮度、颜色和方 向信息,通过高斯金字塔和小波分解滤波,然后归 一化处理计算得到多尺度特征,生成各个通道的 显著图;在得到运动显著图时,要对当前帧和前一 帧图像分别滤波提取动态特征,然后对两帧图像 的特征图进行多尺度的差分,再融合为运动显著 图;最终通过多通道加权方法生成全局显著图,采 用 WTA 机制来最终得到感兴趣区域,即注意焦 点。 融入运动特征的视觉显著性模型如图 1 所 示。
3.1 静态特征提取 静态显著性特征的提取是在 Itti 视觉注意模
型基础上进行的。 本文在方向特征提取上进行了 改进,使融合后的静态显著图更有利于和动态显 著图融合。 对输入图像用 9 层高斯金字塔进行滤 波,提取亮度、颜色、方向特征,由于视觉神经元一 般对于视觉场景中一小段范围最敏感,而对于它 的周围有局部的抑制作用,因此这里对于亮度和 颜色,采用中央-外围( Center-Surround) 算子进行 差分,它是基于 DoG(Diffrence of Gaussions)方式:
收稿日期:2015-07-12;修订日期:2015-09-20 基金项目: 国家高技术研究发展计划(863 计划) 资助项目( No.2012AA040104);吉林省科技厅资助项 目 ( No.
20120332) ;吉林省发改委资助项目( No.2013C048) ;吉林省科技厅国际合作资助项目( No.20140105) ;吉 林省教育厅资助项目( No.20130434,No.20140032)
Iσ( x,y)
=
1 4
Iσ-1 (2x,2y)
+1 8
[Iσ-1 (2x
+
γ,2y) +Iσ-1 (2x,2y +γ)] + , (6)
1 16
I
σ-1
(
2x
+γ,2y
+γ)
式中,σ代表金字塔的尺度,γ的值取 1, -1。
式(7) 为
x
和
y
的范围,满足
0
≤2
x
≤w
σ-1 k
,0
≤2y≤hσ k -1 。
摘要:针对传统视觉显著性模型在自顶向下的任务指导和动态信息处理方面的不足,设计并实现了融入运动特征的视觉 显著性模型。 利用该模型提取了图像的静态特征和动态特征,静态特征的提取在图像的亮度、颜色和方向通道进行,运 动特征的提取采用基于多尺度差分的特征提取方法实现,然后各通道分别通过滤波、差分得到显著图,在生成全局显著 图时,提出多通道参数估计方法,计算图像感兴趣区域与眼动感兴趣区域的相似度,从而可在图像上准确定位目标位置。 针对 20 组视频图像序列(每组 50 帧)进行了实验,结果表明:本文算法提取注意焦点即目标区域的平均相似度为 0畅87, 使用本文算法能够根据不同任务情境,选择各特征通道的权重参数,从而可有效提高目标搜索的效率。 关 键 词:视觉显著性;自顶向下;目标区域检测;显著图 中图分类号:TP391.4 文献标识码:A doi:10.3788 /CO.20150805.0768
图 1 融入运动特征的视觉显著性模型 Fig.1 Visual saliency model fused with motion features
本文生成全局显著图,将亮度显著图、颜色显
著图、方向显著图和运动显著图进行多尺度融合。
全局显著图 S 的计算公式如下,
~
~
~
~
S =αI +βC +γO +λM,
O( c,s,θ) =|O(c,θ) 磓 O( s,θ) |, (5)
式中,c 代表 Center 的某一尺度,c∈{2,3,4},即 9 层中的第 2,3,4 层,θ∈{0,π/4,π/2,3π/4},代 表 4 个方向。 3.2 基于多尺度差分的运动特征提取
运动特征的提取并没有采用传统的帧差法来 处理,本文提出一种基于多尺度差分的运动特征 提取方法,方法原理为:对相邻两帧图像进行不同 尺度的滤波,可得到图像 Iσ,其中 σ∈{0,1,2,3, 4},代表 5 个尺度,设当前帧图像为 It(x,y),前一 帧图像为 It -1 (x,y),图像 It( x,y) 金字塔中的每一 层图像可 以 通 过 上 一 层 的 图 像 通 过 差 分 迭 代 生 成,同理我们可以得到其他层图像金字塔。 如式 (6 ) 所示。
第 8 卷 第 5 期 2015 年 10 月
中国光学
Chinese Optics
Vol.8 No.5 Oct.2015
文章编号 2095-1531(2015)05-0768-07
图像序列的显著性目标区域检测方法
柯洪昌倡 ,孙宏彬
(长春工程学院 计算机技术与工程学院,吉林 长春 130012)
当前有些学者将协同感知理论[12] 、多尺度分 析和编组、多尺度熵理论应用到视觉注意的整合 阶段[13-14] ,并取得了较好的效果。 但是这些模型 仅是基于空间注意,并且在处理动态信息时略显 不足。 并且大部分模型往往都存在计算复杂性过 高的问题。 一些关于心理学及神经科学的研究成 果表明,在视觉通路中,对于亮度、颜色和方向等 特征的提取通常并不需要同等对待,往往都会随 着自顶向下给出任务的不同而不同,这种特征权 重随任务而改变的视觉信息处理机制使得人们能 够快速有效地定位目标[15-16] 。 因此,需要根据任 务情境的不同计算相应通道的特征权重值,来指 导全局显著图的生成,进而准确地定位目标。
对于输入图像 I 的亮度特征 I( c,s),可以用 尺度差分得到:
I(c,s) =|I(c) 磓 I(s) |,
(3)
式中,c 代表 Center 的某一尺度,c∈{2,3,4},即 9 层中的第 2,3,4 层;其中 s 代表 Surround 的某一 尺度,s∈{3,4},即 9 层中的第 3,4 层, 代表两个 特征图的每个像素作差分。
因此
Iσ
的宽度
wσ k
和高度
h
σ k
满足:
wσ k
≤
wσ-1 k 2
+1
.
h
σ k
≤
Technology,Changchun 130012,China) 倡Corresponding author, E-mail:kehongchang1981@163.com
Abstract: For the lack of top-down task guidance and dynamic information processing of traditional visual sali- ency model, a visual saliency model fused with the motion features is designed and implemented.The static features and motion features are extracted based on the proposed model.The static features are extracted from the intensity, color and orientation channel of the current frame image.The motion features are extracted based on the multi-scales difference method.The saliency maps of four channels can be obtained by filtering and difference.Based on the proposed model a method of parameter estimation for multi channel is proposed to calculate the similarity between the region of interesting of current image and the region of interesting of eyes movement, then guide to generate the global saliency map, which can provide a calculation mechanism for ac- curate location on images.20 groups of video image sequences(50 images per group) are selected for the ex-