*******************创新课程*******************兰州理工大学计算机与通信学院2014年秋季学期学习总结报告专业班级:信息与计算科学2班姓名:杨晨学号:11500212指导教师:李睿成绩:目录摘要 (1)1.人脸检测概述 (2)1.1、人脸识别技术概念及现状 (2)1.2、人脸识别技术的应用 (2)1.3、人脸识别技术应用所面临的问题 (4)2.PCA、LDA算法理论 (4)2.1、PCA(主要成分分析)算法原理 (4)2.2、LDA算法原理 (5)3.算法实现 (8)3.1、PCA算法的实现 (8)3.1、LDA算法的实现 (10)4.仿真实验结果及分析 (13)4.1、PCA算法实验结果分析 (13)4.2、LDA算法实验结果分析 (14)5.学习心得 (15)参考文献 (16)摘要人脸检测是指对于任意一幅给定的静态图像或视频序列图像,采用一定的策略和方法对其进行搜索以确定其中是否含有人脸,如果有,则返回人脸的位置、大小和姿态人脸检测技术及应用,是计算机视觉的一个重要分支,是一个多学科的交叉领域。
本课程拟通过教师指导与学生自学相结合的模式,让学生掌握人脸检测技术的相关理论和方法,并自主设计、开发出一个适用于复杂背景和多人脸的人脸检测系统。
使学生通过该课程的学习,可以初步掌握人脸检测的基本原理和应用系统的开发方法,提高综合运用所学知识去解决实际问题的能力,极大限度地发挥出学生的学习主动性和创造性。
关键词:人脸检测、图像处理、原理、应用。
1.人脸检测概述人脸检测是指对于任意一幅给定的静态图像或视频序列图像,采用一定的策略和方法对其进行搜索以确定其中是否含有人脸,如果有,则返回人脸的位置、大小和姿态。
人脸检测可细分为两类:一类是在静止图像中采用一定的策略进行搜索,以判断其中是否存在人脸,若存在,则返冋人脸的位置、大小和姿态信息;另一类是在视频图像序列中判断是否存在人脸,若存在,则动态地跟踪人脸。
1.1、人脸识别技术概念及现状人脸识别,即通过计算机、相关算法对人脸进行分析判断的一种认证技术。
通常也叫做人像识别、面部识别。
严格的来说,我们统称人脸识别。
人脸识别技术从应用层面上主要可分为:人脸检测、人脸识别查询、人脸识别身份认证和人脸识别比对四方面的应用,其可全部归纳为人脸识别查询技术。
目前,我国从事人脸识别技术研究的单位有很多,使得生物特征识别技术形成了一定市场规模,同时也缩小了与国外的差距。
2008年,以清华大学和中科院自动化研究所为代表的北京奥运会实名制票证系统的实施将生物特征识别技术又推到了一个新的水平,为我国生物识别技术在安防领域的应用打下了坚实的基础。
1.2、人脸识别技术的应用(1)人脸检测人脸检测,顾名思义,就是对视频图像进行检测看是否有“清晰”人脸的图像高速处理过程。
目前,被应用在银行的大联网高速图像搜索系统正是基于人脸检测技术与人脸识别查询技术为一体的视频图像快速索引系统。
目前,很多地区的城市视频监控、银行监控都逐渐实施联网工程,浩大的联网工程产生了海量的视频数据。
如何对海量的视频数据进行快速准确的查询成为我们目前必须要解决的问题。
为此,针对银行大联网高速图像搜索系统的现状而开发出了一套综合应用系统。
(2)人脸识别查询人脸识别查询是通过以人脸照片为查找目标,从某个或多个人脸数据库中查找设定相似度照片信息的过程。
普遍应用于公安部门,主要有出入境护照管理、刑事侦查嫌犯查询、走失人口及合法公民身份查询。
通过建立相应的数据库(如出入境护照管理需要建立已办理护照人脸数据库,合法公民身份查询需建立完善的二代证人脸特征数据库),采用C/S或B/S架构,通过在客户端输入要查询人的照片,由服务器端完成相似照片的查询,其核心是基于人脸比对技术。
人脸识别查询根据数据库容量及客户端使用数量及频率设计合理的应用结构。
出入境管理在当今社会起着举足轻重的作用,特别是一些危害国家安全及经济的犯罪分子通过办理多本护照,企图出境躲避法律的制裁,我们更要把其挡在国门之内。
犯罪分子可以改姓名、可以有多种身份、可以有多个证件,但是他只有唯一的一张脸是不变的。
不管你是谁,你叫什么,这张脸就是你能否办理护照的有效依据。
该套系统由于客户端数量有限,且使用频率相对很低,系统采用C/S结构,核心工作基本由服务器完成。
在系统客户端输入所要办理护照人员现场拍摄的照片,系统会在多个类型的数据库中一一查询并返回查询结果。
在已办理护照人员人脸数据库中查询,可以防止一人多本护照;在法律不准出境人员人脸数据库中查询,可以防止该类人员出境逃避法律;在办理过且未被审核通过人员数据库中查询,可以对其进行重点审核等。
(3)人脸识别身份认证人脸识别身份认证,就是通过人脸识别完成对某个人或某些人身份的认证。
该项应用主要适用于参加大型活动身份认证、大型会议身份认证、重要机构重要人员身份认证等。
目前比较成熟的应用主要有大型活动身份认证,如2008北京奥运会实名制票证系统认证;重要机构重要人员身份认证,如银行押运员身份认证。
该类系统,人脸识别起到的是对人员身份的一种认证,是为了提高安全性。
通常需要射频技术配合完成。
如奥运会实名制票证系统认证,购票人在购票的时候已提交其规定格式的照片,人票合一,完成对进场观众的认证;银行押运员身份认证,通过与其之前使用的工卡完成对押运员的“人卡合一”认证。
其核心是一对一比对,不论从认证速度还是准确率来看,已经很成熟的应用在上述场合。
人脸识别身份认证,已经越来越受到很多相关部门的重视。
1.3、人脸识别技术应用所面临的问题目前,人脸识别技术在上述几方面应用基本上已经很成熟,但还面临着更多的问题需要去解决,如模糊照片的人脸识别、远距离的人脸识别、快速行进中的人脸识别等,这些都是人脸识别将来所要研究的问题。
在此,我们看到生物特征识别技术这一庞大的市场需求,但我们也很清醒的认识到人脸识别技术的某些应用是在特定环境下的应用,其中每一项技术的成熟应用,都要有很多科研人员、系统建设人员和用户的共同努力来实现的。
所以,人脸识别技术不是属于某人或某群体的技术,而在整个行业链中每一个环节都是特别重要的,人脸识别在多个领域应用的成功。
需要让越来越多的企业和研发人员参与进来。
2. PCA 、LDA 算法理论2.1、PCA (主要成分分析)算法原理主成分分析是数学上对数据降维的一种方法。
其基本思想是设法将原来众多的具有一定相关性的指标X1,X2,…,XP (比如p 个指标),重新组合成一组较少个数的互不相关的综合指标Fm 来代替原来指标。
那么综合指标应该如何去提取,使其既能最大程度的反映原变量Xp 所代表的信息,又能保证新指标之间保持相互无关(信息不重叠)。
设F1表示原变量的第一个线性组合所形成的主成分指标,即11112121...p p F a X a X a X =+++,由数学知识可知,每一个主成分所提取的信息量可用其方差来度量,其方差Var(F1)越大,表示F1包含的信息越多。
常常希望第一主成分F1所含的信息量最大,因此在所有的线性组合中选取的F1应该是X1,X2,…,XP 的所有线性组合中方差最大的,故称F1为第一主成分。
如果第一主成分不足以代表原来p 个指标的信息,再考虑选取第二个主成分指标F2,为有效地反映原信息,F1已有的信息就不需要再出现在F2中,即F2与F1要保持独立、不相关,用数学语言表达就是其协方差Cov(F1, F2)=0,所以F2是与F1不相关的X1,X2,…,XP 的所有线性组合中方差最大的,故称F2为第二主成分,依此类推构造出的F1、F2、……、Fm 为原变量指标X1、X2……XP 第一、第二、……、第m 个主成分。
11111221221122221122...............p p p p m m m mp pF a X a X a X F a X a X a X F a X a X a X =+++⎧⎪=+++⎪⎨⎪⎪=+++⎩ 根据以上分析得知:(1) Fi 与Fj 互不相关,即Cov(Fi ,Fj) = 0,并有Var(Fi)=ai’Σai ,其中Σ为X 的协方差阵(2)F1是X1,X2,…,Xp 的一切线性组合(系数满足上述要求)中方差最大的,……,即Fm 是与F1,F2,……,Fm -1都不相关的X1,X2,…,XP 的所有线性组合中方差最大者。
F1,F2,…,Fm (m ≤p )为构造的新变量指标,即原变量指标的第一、第二、……、第m 个主成分。
由以上分析可见,主成分分析法的主要任务有两点:(1)确定各主成分Fi (i=1,2,…,m )关于原变量Xj (j=1,2 ,…, p )的表达式,即系数ij a ( i=1,2,…,m ; j=1,2 ,…,p )。
从数学上可以证明,原变量协方差矩阵的特征根是主成分的方差,所以前m 个较大特征根就代表前m 个较大的主成分方差值;原变量协方差矩阵前m 个较大的特征值i λ(这样选取才能保证主成分的方差依次最大)所对应的特征向量就是相应主成分Fi 表达式的系数i a ,为了加以限制,系数i a 启用的是i λ对应的单位化的特征向量,即有'ai ai = 1。
(2)计算主成分载荷,主成分载荷是反映主成分Fi 与原变量Xj 之间的相互关联程度:(,)(,1,2,,;1,2,,)k i ki P Z x i p k m ===2.2、LDA 算法原理LDA (线性判别分析)算法与PCA 算法一样,都属于子空间分析中的一种,又叫Fisher 算法。
关于线性判别分析的研究应追溯到Fisher 在1936 年发表的经典论文。
其基本思想是选择使得Fisher 准则函数达到极值的向量作为最佳投影方向,从而使得样本在该方向上投影后,达到最大的类间离散度和最小的类内离散度。
可以考虑把d 维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维。
这在数学上总是容易办到的。
然而,即使样本在d 维空间里形成若干紧凑的相互分得开的集群,若把他们投影到一条任意的直线上,也可能使几类样本混在一起而变得无法识别。
但在一般情况下,总可以找到某个方向,使在这个方向的直线上,样本的投影能分开得最好,问题是如何根据实际情况找到这条最好的、最易于分类的投影线。
这就是Fisher 线性判别法所要解决的基本问题。
首先,讨论从d 维空间到一维空间的一般数学变换方法。
假设有一集合χ包含N 个d 维样本1x ,2x ,……,N x ,其中1N 个属于ω1类的样本记为子集1x ,2N 个属于2ω类的样本记为2x 。
若对N x 的分量作线性组合可得标量N n x w y n T n ,...2,1,==这样便得到N 个一维样本N y 组成的集合,并可分为两个子集1y 和2y 。