2010年第29卷第3期 传感器与微系统(Transducer and M)crosystem Technologies) 23 复杂场景下动态目标视觉跟踪方法 毛建国,柏方超,沈 垣,周华鹏,李芳培,卢文玉 (南京航空航天大学能源与动力学院。江苏南京210016) 摘要:当跟踪目标与背景颜色相近或跟踪目标被遮挡时,传统的均值平移算法失效。提出了一种改进 的均值平移算法,将RGB颜色空间转换成HSI颜色空间,克服背景颜色与跟踪目标颜色相近时带来的干 扰。当发生遮挡时,在较短时间内将目标的运动看作是不变系统,利用Kalman滤波器进行参数辨识使得 发生遮挡后的跟踪系统具有后续状态预测的能力。实验结果证明:提出的算法能在复杂场景下准确地跟 踪目标,在Intel 1.73 GHz处理器上的处理速率达39帧/S。 关键词:均值平移;HSI颜色空间;卡尔曼滤波;状态预测 中图分类号:U 273.99 文献标识码:A 文章编号:1000--9787(2010)03-0023-03 Vision based dynamic target tracking under complicated scenes MAO Jian-guo,BAI Fang—chao,SHEN Huan,ZHOU Hua-peng,LI Fang—pei,LU Wen—yu (College of Energy&Power Engineering,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China) Abstract:Traditional mean shift will fail when the goal’S color is similar to the background or the goal is blocked.An improved mean shift tracking algorithm is presented.RGB color space is coverted into HSI color space.The interference is overcomed when the goal’S color is similar to the background.When the goal is blocked,a time—invariant system is used to describe the movement of the target during a short time sequences. Through Kalman filter,this system is identified SO as to make it have the ability of estimating the coming states. Experimental results demonstrate that the proposed approach can accurately track the goal in complicated scenes, and can deal with 39 pictures per second with a Intel 1.73 GHz CPU. Key words:mean shift;HSI color space;Kalman filter;state prediction 0引 言 目标跟踪技术广泛用于智能监控、交通监控、军事制 导、视频压缩和医学图像处理领域 。均值平移算法作为 一种基于概率密度估计的非参数优化算法最先由Fukunaga K和Hostetler L D提出 J,近年来,均值平移算法以其无需 参数、快速模式匹配的特性被广泛应用到目标跟踪领 域 J。均值平移算法需要合适的模型来表征运动目标, 如,颜色直方图模型 |7 J、边缘直方图模型 等。基于颜色 直方图的均值平移算法,当跟踪目标与背景颜色相近时或 跟踪目标被遮挡时,算法失效。基于边缘直方图的均值平 移算法能利用纹理特性克服部分干扰,但当跟踪目标与背 景纹理相近时,算法也失效。因此,本文把RGB颜色空间 转换成HS1颜色空间,克服背景颜色与跟踪目标颜色相近 带来的干扰,在准确地判断目标是否发生遮挡的前提下,通 过引入Kalman滤波,使算法具有对目标物体后续状态进行 预测估计的能力,从而在目标发生短时间的遮挡后仍可对 目标进行准确跟踪。 1 Mean Shift跟踪算法 均值平移算法实际上为一个迭代过程,即先算出当前 点的偏移值,移动该点到偏移值,然后,以此为新的起始点, 继续移动,直到满足一定的条件结束。均值平移算法是一 种非参数密度估计,因其不需要参数,所以,收敛速度很快, 用于目标跟踪能达到较高的实时性。为了提高概率密度估 计的鲁棒性,本文在特征空间的选择上做了改进,选择HSI 颜色空间取代RGB颜色空间作为特征统计空间,因为HSI 颜色特征反映的是目标的色调,饱和度和强度,能克服目标 与背景颜色相近时带来的干扰。 1.1从RGB到HSI的彩色转换 给定一幅RGB彩色格式的图像,日分量可用下面的公 式得到 收稿日期:2009--07—14
基金项目:江苏省普通高校研究生科研创新计划资助项目(CX08B_044Z) 传感器与微系统 第29卷 日={ . (1) 其中 0 ̄-aYccosI 1[(R—G)+(R一曰)] 1. (2) 【[(R—G) +(R—G)(G—B)] J 分量H的范围为0~2耵,0代表红色,2,u/3代表绿色, 4 ̄r/3代表蓝色。 色饱和度S分量由下式给出 s= 一 蒜[min(R,G, )]・ (3) 最后,强度,分量由下式给出 ,=÷(R+G+ ). (4) 强度分量,归一化后范围为[0,1],0代表黑色,1代表 白色。 1.2目标模型描述 目标区域的中心为‰,假设其中有n个像素用 } 表示,特征值bin的个数为m个,则目标模型的特 征值u=l…m,估计的概率密度为 c (『I . ㈤ 其中,k( )为核函数的轮廓函数,由于遮挡或者背景的 影响,目标模型中心附近的像素比外边缘像素更可靠,k( ) 对中心的像素给一个大的权值,而远离中心的像素给一个 小的权值。函数 ( )中I1 lI的作用是为了消除不同 大小目标计算时的影响,将目标区域归一化。占( )是Delta 函数,6[b(x )一“]总的作用是判断目标区域中像素 的颜 色值是否属于第“个bin,等于值为1;否则,为0。C是一个 标准化的常量系数,使得∑q =l,因此 ‘ 1.3候选模型描述 运动目标在第二帧和以后的每帧中可能包含目标的区 域称为候选区域,其中心坐标为,,,也是核函数的中心坐标。 该区域中的像素用 } … ,表示,对候选区域的描述称为 目标候选模型,候选模型的特征值 =l…m的概率密度为 y)=c nk (1l . (7) 舯 ’ 是标准化的常量系数。 1.4相似性函数 相似性函数是描述目标模型和目标候选模型之间的相 似程度,在理想情况下,2个模型的概率分布是完全一样的。 本文使用Bhattacharyya系数作为相似性函数,其定义为 /3(y)_p( (y),毒)=∑ 丽. (9) 其值在0-i之间。P(Y)的值越大,表示2个模型越相 似,在当前帧中不同的候选区域计算得到的候选模型,使得 P(Y)最大候选区域即是在本帧中目标的位置。 1.5 目标定位 为使J;(y)最大,在当前帧的目标中心先定位为前一帧 中目标中心的位置Yo,从这一点开始寻找最优匹配的目标, 其中心为y。先计算目标候选模型J;( ),在Jl;( )处进行泰 勒展开,Bhattacharyya系数可近似为 p( (,,), )=÷∑ 丽+ 孚i 叫I J√ 6[6( ]. ) 式中只有第二项随Y变化。令 = nk (Il 令上式最大,可以计算出目标偏移后的新位置 nk (fl f2). Yl nk g(I J『) 2基于Kallnaii滤波器的状态预测 Kalman滤波器是根据最小均方误差准则建立起来的 估计方法。它用线性递推的方法,对多个测量数据和多个 信号参数进行处理,给出无偏的最小均方误差的估计。它 只用信号的前一个估计值和最近一个观察值就可以在线性 无偏最小方差估计准则下估计信号的当前值,而不必像维 纳滤波器那样需要全部过去的观察值。因此,它的计算量、 存储量低,实时性高,更重要的是它能利用实际的运动参数 对未来的预测不断地进行修正,从而提高估计的精度。它 根据受噪声干扰的观测输入对未知系统状态和参数进行估 计,观测噪声和扰动输入都看作随机过程 X(t)=AX(t-1)+W(t-1), (14) y(t)=CX(t)+V(t), (15) 式中 (£), (£-1)为£和t-1时刻的状态向量; (t)中 有4个分量,分别为目标在X,Y坐标位置和在X,Y坐标方 向上的速度。y(t)为t时刻观测向量,Y(t)中有2个分量,
在系统中选取 第3期 毛建国,等:复杂场景下动态目标视觉跟踪方法 x(z)=Ix1,Y1, , ] , (16) Y(t)=[ 1,Y1 T, (17) 式中 。为目标在 时刻测量得到的目标中心的 坐标; y1为K时刻测量得到的目标中心的Y坐标; 为 时刻运 动目标在 坐标方向上的速度; 为目标在K时刻运动目 标在y坐标方向上的速度。 其中 A= 0 At 0 1 0 At 0 1 0 0 0 1 ,,1 0、 ,曰:l I. (18) 0 l J 本文采用如下公式预测目标在下一时刻可能出现的位 置为 X1=(X1-1)+V,At, (19) Y1=(yl一1)+VyAt, (20) 式中(X。-1),(Y1—1)为前一时刻的状态;x ,yl为现 在预测目标出现的位置,时间 是处理连续两帧图片的时 间。 本文实验是对视频进行处理的,每处理一帧要把目标 所在的位置信息,速度信息都记录下来,一旦发生遮挡,立 刻启动Kalman滤波器,把前一帧的信息作为Kalman滤波 器的输入信息。 Bhattacharyya系数是表示目标模型和候选模型之间相 似程度的,当目标物体被遮挡时,Bhattacharyya系数会变小, 图l给出了当目标物体被遮挡时Bhattacharyya系数的变化 情况。可以看出:当目标被遮挡时,Bhattacharyya系数会变 的很小,因此,只要设一阈值就可判断目标是否被遮挡,本 文实验用的阈值为0.85。
图1 Bhattacharyya系数变化图 Fig 1 Diagram of Bhattacharyya coefficient change 3实验结果 实验所处理的图片序列是用数码相机在南京不同地点 拍的两段视频,实验用的处理器是Pc机,主频为1.73 GHz 的Intel(R)CPU,内存为。2 GHz。所有算法用Matlab 7.1编 程实现。 图2序列图像是从南京某高速公路上拍的视频中截取 图2高速公路上对车的跟踪结果 Fig 2 The result of tracking vehide on highway
图3校园内对人的跟踪结果 Fig 3 Result oftracking persons On campus 的几帧,由于天气较阴暗,图像中所跟踪的车的颜色与背景 路面相近,但改进的基于HSI颜色空间的均值平移算法很 准确地跟踪了目标。 图3序列图像是从校园内拍的视频中截取的,是对短 暂遮挡的情况进行实验,在判断出遮挡后,立刻引入Kalman 滤波器,对后续状态进行预测,实验结果证明了该算法的有 效性。 本文对算法的实时I生做了测验,结果如表1。 表1测验结果 I-ab 1 Test results 表l是对实验用的两段视频处理后所花时间的统计, 并计算出处理每帧图像所需时间,从数据中可以看出:提出 的算法完全满足实时性要求。 4结论 当跟踪目标与背景颜色相近时,通过将特征统计空间 由RGB颜色空间转换为HSI颜色空间,克服了背景的干扰。 当跟踪目标被遮挡时,引入Kalman滤波器进行参数辩识而 使发生遮挡后的跟踪系统具有后续的状态预测能力,通过 Bhattacharyya系数的大小来决定是否引人Kalman滤波器, (下转第28页)