当前位置:文档之家› 中国计量学校文献综述

中国计量学校文献综述

中国计量学院现代科技学院毕业设计(论文)文献综述学生姓名:吴鹏晖学号:0930333222专业:电子信息工程班级:电信092设计(论文)题目:基于LVQ神经网络的人脸朝向识别算法研究指导教师:李向军系:信息工程系2013年1月3日基于LVQ神经网络的人脸朝向识别算法研究文献综述一、人脸识别概述人脸识别作为一个复杂的模式识别问题,近年来受到广泛的关注,识别领域的各种方法在这个问题上各显所长,而且发展出了许多新方法,大大丰富和拓展了模式识别方向。

人脸识别、检测、跟踪、特征定位等技术近年来一直是研究的热点、人脸识别是人脸应用研究中重要的第一步,目的是从图像中分割出不包括背景的人脸区域。

由于人脸形状的不规则性以及光线和背景条件多样性,现有的人脸研究算法都是在试图解决某些特定实验环境下的一些具体问题,对人脸识别位置和形状都有一定的要求。

而在实际应用中,大量图像和视频源中人脸的位置,朝向和旋转角度都不是固定的,这就大大增加了人脸识别的难度。

在人脸识别领域的众多研究方向中,人脸朝向分析一直是一个少有人涉及的领域。

在以往的研究中,一些研究者谈及了人脸朝向问题,但其实绝大多数都是希望在人脸识别过程中除去人脸水平旋转对识别过程的不良影响。

但是,实际问题要复杂的多,人脸朝向是一个无法回避的问题。

因此,对于人脸朝向的判断和识别,将会是一件非常有意义的工作。

人脸检测与识别技术是生物特征鉴别技术中研究最多和最热门的技术之一,它已经在身份认证、安全检查、罪犯查询、人机交互等广泛领域得到了初步应用。

在人脸检测研究中,构建快速而精确的检测方法一直是该领域的研究热点;在人脸识别研究中,如何克服获取图像光线、表情、视角等变化的影响,提高识别率则是迫切需要研究的问题。

针对这两个问题,本文以彩色和灰色正面人脸静态图像为研究对象,将模式识别理论和图像处理技术相结合,重点研究基于LVQ人工神经网络(ANN)的肤色像素检测和基于模板匹配的人脸精确检测方法,以及基于小波包分解(WPD)和(2D)2PCA的不同变化条件人脸图像的识别方法,为建立快速精确的人脸识别系统提供技术依据。

二、LVQ神经网络的介绍LVQ(Learning Vector Quantization)即学习向量量化神经网络,属于前向神经网络类型,在模式识别和优化领域有着广泛的的应用。

LVQ神经网络由三层组成,即输入层、隐含层和输出层,网络在输入层与隐含层间为完全连接,而在隐含层与输出层间为部分连接,每个输出层神经元与隐含层神经元的不同组相连接。

隐含层和输出层神经元之间的连接权值固定为1。

输入层和隐含层神经元间连接的权值建立参考矢量的分量(对每个隐含神经元指定一个参考矢量)。

在网络训练过程中,这些权值被修改。

隐含层神经元(又称为Kohnen神经元)和输出神经元都具有二进制输出值。

当某个输入模式被送至网络时,参考矢量最接近输入模式的隐含神经元因获得激发而赢得竞争,因而允许它产生一个“1”,而其它隐含层神经元都被迫产生“0”。

与包含获胜神经元的隐含层神经元组相连接的输出神经元也发出“1”,而其它输出神经元均发出“0”。

产生“1”的输出神经元给出输入模式的类,由此可见,每个输出神经元被用于表示不同的类。

LVQ神经网络是在监督状态下对竞争层进行训练的一种学习网络,它允许指定输入被分到那个类,竞争层将自动对输入进行分类。

相比于其它网络,它能够以较少的计算量处理大量的输入数据。

另外,虽然其结构简单,但却表现出比BP网络更强的有效性和鲁棒性。

Mohammad指出LVQ神经网络具有高斯混合模型相似的分割效率和效果,而运算和实现却十分简单。

因此,可以构建肤色和非肤色像素组,并利用这些像素来训练LVQ神经网络,然后使用训练成功的LVQ 网络实现输入图像中肤色像素的检测(分类)。

目前,LVQ神经网络已经成功地应用于肤色检测[69,70]。

LVQ网络最早是由Kohonen提出的有导师学习的混合网络,其网络结构简单,如图所示,由输入层、隐竞争层和输出层组成。

其中输入层与隐竞争层为竞争层,节点间为完全连接;隐竞争层与输出层为线性层,节点间为部分连接且权值固定为1。

LVQ神经网络结构如图2所示。

LVQ神经网络结构图(图2)LVQ网络隐竞争层的每个神经元通过学习原型向量对输入空间的区域进行分类,但它不是通过计算内积得到输入向量和权值向量中最接近者,而是通过直接计算距离的方法来模拟LVQ网络,从而向量无需规格化。

当训练样本[x1,…,xn]输入网络时,计算其与隐层神经元之间的欧氏距离(Euclidean distance),具有最小距离的隐层神经元因获得激发而赢得竞争,于是产生“1”,其他则被迫产生“0”。

在输出层,与隐层获胜神经元相连接的神经元也发出“1”,其他则被迫产生“0”。

产生“1”的输出神经元给出输入模式的类,每个输出神经元被表示为不同的类,这样线性层将竞争层的分类结果映射到用户定义的目标分类上。

三、人脸识别功能模块1、人脸捕获与跟踪功能人脸捕获是指在一幅图像或视频流的一帧中检测出人像并将人像从背景中分离出来,并自动地将其保存。

人像跟踪是指利用人像捕获技术,当指定的人像在摄像头拍摄的范围内移动时自动地对其进行跟踪。

2、人脸识别比对人脸识别分核实式和搜索式二种比对模式。

核实式是对指将捕获得到的人像或是指定的人像与数据库中已登记的某一对像作比对核实确定其是否为同一人。

搜索式的比对是指,从数据库中已登记的所有人像中搜索查找是否有指定的人像存在。

3、人脸的建模与检索可以将登记入库的人像数据进行建模提取人脸的特征,并将其生成人脸模板(人脸特征文件)保存到数据库中。

在进行人脸搜索时(搜索式),将指定的人像进行建模,再将其与数据库中的所有人的模板相比对识别,最终将根据所比对的相似值列出最相似的人员列表。

4、真人鉴别功能系统可以识别得出摄像头前的人是一个真正的人还是一幅照片。

以此杜绝使用者用照片作假。

此项技术需要使用者作脸部表情的配合动作。

5、图像质量检测图像质量的好坏直接影响到识别的效果,图像质量的检测功能能对即将进行比对的照片进行图像质量评估,并给出相应的建议值来辅助识别。

四、认识识别技术的应用与发展人脸识别技术的应用可以分为两部分:执法应用和商业应用。

人脸识别技术主要是在执法应用中使用,特别是照片相册(静态匹配)和视频监控(实时匹配的视频图像序列)。

本商业应用范围从静态匹配照片上的信用卡,提款卡,护照,驾驶许可证,和照片的身份证实时匹配与静止图像或视频图像序列的存取控制。

每个应用程序提出了不同的约束条件处理。

所有的人脸识别算法一致的两大部分:(1)人脸检测和正常化,(2)面鉴定。

算法包括两个部分称为全自动算法,包括只有部分被称为半自动算法。

半自动算法给出一个面部图像和圆心坐标的眼睛。

充分的自动算法只考虑面部图像。

另一方面,开发的人脸识别在过去几年中允许组织为三个类型识别算法,即前,轮廓,和view-tolerant 识别,对不同类型图像和识别算法。

虽然轮廓识别当然是经典的方法,view-tolerant算法通常执行识别在一个更复杂的方式由以考虑到一些基本物理,几何,与统计。

简介方案作为独立的系统有一个而边际意义识别。

然而,他们是很实际的或者快速pre-searches大型人脸数据库减少随后的一个复杂的算法计算负荷,或作为一个混合识别方案。

这种混合方法有一个特殊的地位之间的人脸识别系统作为他们结合不同的识别方法一个串行或并行的缺点。

人脸识别方法可分为2类:(一)全球方法和(二)基于组件的方法。

在全球方法,一个单一的特征向量,代表整个人脸图像是用来作为输入到分类器。

几个分类已提出在文献如最小距离分类的特征空间,区别分析和神经网络。

全球技术工作分类的脸正面的意见。

然而,他们没有强劲的姿态变化由于全球特征高度敏感的翻译和轮换的脸。

到避免这个问题的一个调整阶段可以添加之前分类的脸。

调整输入人脸图像与基准脸图像需要计算对应两国之间的人脸图像。

信件通常是确定一个小一些突出的点在脸上如中心的眼睛,鼻孔,或角落的嘴。

基于这些书信,输入人脸图像可以被扭曲到基准脸图像人脸识别的研究仍然面临挑战,一些特定域的姿态和光照变化。

虽然有许多方法已经提出了解决这些问题和表现出显着的承诺,困难仍然存在。

由于这些原因,匹配目前的自动人脸识别性能比较穷人相比,实现了指纹和虹膜匹配,但它可能是唯一可用的测量工具一个应用程序。

错误率25%是典型的。

它是有效的如果加上其他生物测量。

当前系统工作的很好时,测试图像被公认是捕获的类似的条件下的训练图像。

然而,他们没有足够强大,如果有变化之间的测试和训练图像。

改变入射光,头部姿势,面部表情,发型(包括面部的头发),化妆品(包括眼镜)与年龄,所有混淆最佳系统。

五、参考文献[1]张勇,李辉,侯义斌等。

一种基于人脸识别与脸部朝向估计的新型交互方式环绕智能显示技术.电子器件,2008[2]陈锐,李辉,侯义斌等.由人脸朝向驱动的多方向投影交互系统.小型微型计算机系统.2007[3]唐秋华,刘宝华,陈永奇等.结合遗传算法的LVQ神经网络在声学底质分类中的应用.地球物质学报,2007[4]张小英,王宝发,刘铁军,基于PCA-LVQ的雷达目标一维距离像识别.系统工程与电子技术,2005[5]胡明慧,陈震,黎明,基于自组织与LVQ神经网络的足球机器人协作策略学习。

南昌航空工业学院报:自然科学版,2004[6]姚谦,郭子祺,袁泉等.遗传算法的LVQ神经网络在遗传图像分类中的应用.遗传信息,2008[7]罗玮,严正,基于广义学习矢量量化和支持向量机的混合短期负荷预测方法。

电网技术,2008[8]史王,小川,郁磊,李洋,MATLAB神经网络30个案例分析,北京航空航天大学出版社,2010[9]陈蕾,黄贤武,孙兵,基于WT和LVQ网络的多姿态人脸识别,计算机工程,2006[10]钟淑瑛,李陶深,基于MATLAB和BP_LVQ神经网络组合分类模型,计算机技术与发展,2006[11]Vladimir Vezhnevets,Vassili Sazonov,Alla Andreeva.A Survey on Pixel-BasedSkin Color Detection echniques[J].Proc.Graphicon-2003,2003[12]P.Kakumanu,S.Makrogiannis,N.Bourbakis.A survey of skin-color modeling anddetection methods[J].Pattern Recognition,2007[13]Teerayoot Sawangsri,Vorapoj Patanavijit,Somchai Jitapunkul.Face SegmentationUsing Novel Skin-Color Map and Morphological Technique[J].Transactions On Engineering,Computing And Technology V2December,2004[14]Melanie Po-Leen Ooi.Hardware Implementation for Face Detection on XilinxVirtex-II FPGA using the Reversible Component Transformation Colour Space[J].Proceedings of the Third IEEE International Workshop on Electronic Design,Test and Applications,2006[15]Yuichi Hori,Kenji Shimizu,Yutaka Nakamura,et al.A Real-Time Multi FaceDetection Technique Using Positive-Negative Lines-of-Face Template[J].Proceedings of the17th International Conference on PatternRecognition,2004.。

相关主题