当前位置:文档之家› 步态识别方法的分类及各类方法的比较

步态识别方法的分类及各类方法的比较

步态识别方法的分类及各类方法的比较程汝珍1,21河海大学计算机及信息工程学院,江苏南京(210098)2水文水资源与水利工程科学国家重点实验室,江苏南京(210098)E-mail:chengruzhen@摘要:步态识别是生物特征识别技术中的一个新兴领域,它旨在根据个体的行走方式识别身份。

步态识别主要是针对含有人的运动图像序列进行分析处理,所涉及到的几项关键技术包括:视频处理、图像处理、模式识别。

步态识别分析可以划分为特征抽取、特征处理和识别分类三个阶段。

在最近的文献中已经有许多研究尝试,提出了许多步态识别的具体方法。

但国内外尚无将步态识别技术分类,本文提出了步态识别的六类分类法,且初步比较了每类方法的适用范围和优缺点,使读者较为全面了解步态识别技术现状。

关键词:步态识别;分类;适用范围;优缺点;比较中图分类号:TP391.41.引言步态识别是生物特征识别技术中的一个新兴领域,它旨在根据个体的行走方式识别身份[1]。

根据早期的医学研究[2]人的步态有24个不同的分量,在考虑所有的步态运动分量的情况下步态是唯一的。

精神物理学[3]中的研究结果显示即使通过受损的步态信息人们也能够识别出身份,这表明在步态信号中存在身份信息。

步态识别主要是针对含有人的运动图像序列进行分析处理,所涉及到的几项关键技术包括:视频处理、图像处理、模式识别[4]。

步态识别分析可以划分为特征抽取、特征处理和识别分类三个阶段[5]。

步态识别部分图1 步态自动识别系统框图Fig1 the framework of gait automatic recognition system步态识别系统的一般框架如图所示[6]。

监控摄像机首先捕捉监控领域来人的行走视频,然后送入计算机进行检测和跟踪,提取人的步态特征,最后结合已经存储的步态模式进行身份识别。

若发现该人是罪犯或嫌疑人,系统将自动发出警告。

图2 步态识别的一般框架Fig2 the general framework of gait recognition步态识别比已有的诸如指纹、视网膜扫描和面像识别等生物识别方法有显著的优势[7]:对图像分辨率要求不高;步态可以通过远距离的摄像机捕获,因此和其他生物测量方法相比,步态是唯一不受距离影响的生物特征;此外,步态还具有非接触性、难以伪装、受环境影响小等特征[5],不要求人停下来被扫描或拍照,对像在机场和城市交通干道等区域中诸如人、车辆等快速移动的研究对象步态识别技术尤其重要。

而且,当别的生物识别技术识别不清时步态仍然可用,在智能监控系统的实际应用中,要获得解析度足够高的人脸或者虹膜信息,要实现非接触式的远距离身份识别是很困难的;而步态信息此时仍是可感知的[1]。

然而,与指纹或虹膜不同,人的步态是高度改变的,它的唯一性是有限的[5]。

由于人的行走姿势受各种因素的影响,在不同环境条件下行走姿势有或多或少的变化,因此步态识别的计算较复杂,识别的准确度还不够高,目前准确性远低于第一代身份识别技术。

在生命力学、人体运动学、心理物理学和物理医学研究领域[8],研究者对人走路的形态进行大量有益的尝试性工作,应用领域包括:步态病理学检测、受伤人员的康复、运动成绩的提高和基于人类工程学的运动器械及办公设备的设计。

步态识别技术的未来应用不可能仅限于生物特征方面[9],还可用于医学推断[10],法医推断(犯罪分析现场),甚至可能用于动画片和电影行业。

也可应用于诊断抑郁症和谎话检测。

在诸如监视、访问控制,雷达系统[9]和聪明的界面,城市场景或自动驾驶中的驾驶支持等的许多应用领域,未来步态识别技术的需求仍不断增长[11]。

尽管步态识别是一个新的研究领域, 近年来也已涌现出一些尝试性的研究[12]。

最早识别行人的方法也许是由Niyogi 与Adelso 提出的[13]。

Cunado 等[14]将大腿建模为链接的钟摆,并从其倾斜角度信号的频率分量中获取步态特征。

Little 与Boyd[15]从光流图像中获取频率和相位特征来识别个人。

Murase 与Sakai[16]提出了一种时空相关匹配的方法用于区别不同的步态, Huang 等[17]通过增加正则分析扩展了他们的工作。

近来,Shutler等[18]提出了一种基于时间矩的统计步态识别算法;Hayfron- Acquach[19]使用广义对称性算子进行步态识别;Johnson 与Bobick[20]在步态中使用了静态身体参数; Yam 等[21]尝试利用跑步行为进行人的识别。

马里兰大学的C.BenAbdelkader 等用步态序列自相似图( SSP) 来提取步态特性[22],南安普顿大学的J.P.Foster 等提出采用区域度量的方法解决识别步态问题[23], 麻省理工学院的L.Lee 等用轮廓各部分的矩特征来分析步态[24], 而CMU 的Robert T. Collins 等则直接利用身体轮廓信息识别步态[25], 代表性的是英国的南安普敦大学所做的工作[26]。

中科院自动所是国内最早开始步态识别研究的, 并提出了一种简单有效的自步态识别算法, 而且拥有相对较低的计算代价[27]。

在最近的文献中已经有许多研究尝试,提出了许多步态识别的具体方法。

大多数关于步态识别的论文中仅仅讨论步态识别的某种具体的方法,为了使读者对当前步态识别研究有个全面的了解,为了给步态识别勾勒出一幅整体的图画,有必要将这些方法进行分类。

但国内外尚无将步态识别技术分类,本文提出了步态识别的六类分类法,且初步比较了每类方法的适用范围和优缺点,使读者较为全面了解步态识别技术现状。

2步态识别方法的分类下面我们将系统地勾勒出已经提出的步态识别方法的分类法,并且为每种分类法给出了一些例子,分析了各类方法的优缺点。

在这篇论文中我们总共提出了步态识别方法的六种分类法,这些分类方法只是从不同角度进行划分,国内外提出的某种具体步态识别方法可能同时属于几个类型。

2.1 基于SFM的方法与基于运动的方法基于SFM(丛运动推断出结构)的方法试图通过跟踪特定的点集复原人的结构,从而识别身体的运动或动作。

然而,因为在三维中跟踪身体部位很长时间仍然是计算机视觉的挑战,而且重建结构是算法很复杂,基于SFM的方法的有效性仍然有限。

基于运动的识别方法表示了身体的运动模式,没有考虑它的底层结构,这类方法由于没有重建结构,算法复杂度较低。

可细分为两类主要方法:一种将人的运动表示成姿态/外形的序列(也就是离散数),即状态-空间方法;另一种表示了由人的运动连续性产生的时空分布特征,即时空方法。

(1)状态-空间方法将步态看成由一系列的身体姿态组成,且通过考虑与那些静止姿态有关的观测值的时间变量来识别步态[28]。

[8]提供了一个运用艾真空间图像来区分不同的步态的模板匹配方法。

他们用主要部件分析(PCA)将运动的人的二维轮廓描述进低维的特征空间。

在这个空间中单个人的步态被表示成(轮廓的)一个簇,通过确定是否所有输入的轮廓都属于这个簇进行步态识别。

为识别而降低的特征空间称为艾真空间,然后在艾真空间中使用一些监督模式分类技术(在这个例子中是k-最近邻居规则)。

[29]使用了一种相似的技术,用一种结合了艾真空间转换(EST)和正则空间转换(CST)的统计学方法,对空间模板的特征抽出进行规范分析,从而用步态识别人。

(2)时空方法表示了由运动的连续性产生的时空分布特征[28]。

通过对图片中运动的人观测得到的整个三维时空(XYT)的数据集来表现动作或运动的特征。

例如这个数据集可以由人的灰度模式图像片断,光学流图片或二维轮廓组成。

因此这个数据集就被处理成“大”向量,典型地,通过将这个向量描述成低维的特征向量且运用这个空间中的标准模式分类技术而对运动进行识别。

可能最早的识别行走的人的方法是Niyogi和Adelson[13]提出的,他们利用曲线匹配“蛇”来抽取行人的步态时空模式从而识别不同的行人。

Little和Boyd[15]使用行人的光学流信息中得到的频率和间隔特征,从而用步态来识别人。

最近,Shutler等[18]将时间的时刻引入统计学步态识别方法,Chiraz Ben Abdelkadery等[8]用运动的人的图片自相似情形来识别单个人的步态。

最近的某些四维模型的方法[14]也含有时间维,这些也是时空方法。

2.2基于整体/基于序列/基于外观/无模型的方法与基于特征/基于模型的方法现在的步态识别方法可以分成两个主要的类:基于整体/基于序列/基于外观/无模型(这几个词虽然在某些文献中也提到过,但这几个词一直都没有同时出现在同一篇文献中,导致读者可能以为它们是不同的类别,但细细分析后就会发现其实它们的含义是相同的)的方法与基于特征/基于模型(这两个词含义也相同,原因同上)的方法。

因为模型匹配涉及图片所以很难,大多数方法都属于第一类。

2.2.1 基于整体/基于序列/基于外观/无模型的方法这些方法通过从行人的图片序列中产生的时空模式的分析表示步态,没有结构复原。

它又可细分为很多类方法,比较有代表性的几类方法介绍如下。

(1)基于运动的形状分析例如,[15]描述了含有一组从高密度的光学流分布的动差中获得的运动特征的形状。

[30]选择侧面影像的外部轮廓作为他们的特征向量。

[28]提供了一个基于Procrustes形状分析方法的自动步态识别算法。

Procrustes形状分析意指两个形状相似性的分析。

) (2)对称分析例如,[19]描述了基于分析人运动的对称的自动步态识别的方法,这种方法利用了综合平衡算子。

这个算子不依赖形状的边界,也不依赖总体形状,而是由它们的对称的性质找出特征的位置。

)(3)密集光学流密度光学流技术用光学流的相关状态形成特征向量从而创建签名[19],将光学流作为分离手段的运动检测[11,15,17]。

基本观点是检测有给定形状或共同特征的斑点(像有相似的光学流值的颜色一样)和在后续帧中跟踪它们的运动。

)(4)图片自相似Jonah McBride等[31]将步态自相似作为一种识别方法。

这种方法通过直接比较图片完全抛弃了分段。

每张图片通过差别的简单计算与别的图片比较。

简单的图片差别可以提供关节运动中有意义的自相似的表示。

Chiraz BenAbdelkade等[8]使用艾真空间中步态的自相似。

他们主张走路的人的二维动态被译成由人的图片序列的成对的图片相似点组成的二维图。

通过序列中的每个图片对计算相似性图。

(5)结合规范分析和艾真空间[11]Ping S. Huang等[32]提出了一种统计学方法,这种方法为得到空间模板特征转换将艾真空间转换(EST)和正则空间转换(CST)结合起来,结果显示空间模板、水平流模板和水平垂直流模板比步态识别垂直流模板更好。

相关主题