当前位置:文档之家› 模式识别作业人脸识别

模式识别作业人脸识别

1引言
模式识别就是机器识别,计算机识别或者机器自动识别,目的在于让机器自动识别事物,如手写数字的识别,智能交通管理信号的识别,文字识别,语音识别等。

模式识别这个学科的目的就是让机器能做人类能做的事情,具备人类所具有的对各种事物与现象进行分析,描述与判断的部分能力。

模式识别是直观的,无所不在。

人与动物具有模式识别的能力是非常平常的事情,但是对计算机来说实现模式识别是非常困难的。

让机器能够识别,分类需要研究识别的方法。

而模式识别可以概括为两个类型,一个是直接形象的,例如图片,相片,图案,字符图案等;另外的就是无知觉形象而只有数据或信号的波形,如语音,声音,心电图,地震波等。

人脸识别是目前模式识别领域中被广泛研究的热门课题,它在安全领域以及经济领域都有极其广泛的应用前景。

人脸识别就是采集人脸图像进行分析和处理, 从人脸图像中获取有效的识别信息, 用来进行人脸及身份鉴别的一门技术。

2算法介绍
2.1主成分分析
主成分分析(Principal Component Analysis, PCA)是经典的特征维数压缩算法。

设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析。

在多特征的研究中,往往由于特征个数太多,且彼此之间存在着一定的相关性使问题复杂。

主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

PCA是最简单的以特征量分析多元统计分布的方法。

如果一个多元数据集能够在一个高维数据空间坐标系中被显现出来,那么PCA就能够提供一幅比较低维度的图像,这幅图像即为在讯息最多的点上原对象的一个‘投影’。

这样就可以利用少量的主成分使得数据的维度降低了。

2.2奇异值分解
设A是一秩为r的n r
⨯维矩阵,则存在两个正交矩
阵:
011
[,,]n r
r
U u u u⨯
-
=∈ℜ
,T
U U I
=;
01
[,1,,]r r
r
V v v v⨯
-
=∈ℜ
,T V V I
=;以及对角阵:011
[,,,]r r
r
diagλλλ⨯
-
Λ=∈ℜ
,且
011r
λλλ
-
≥≥≥
满足
1
2T
A U V
=Λ,其中:()
0,1,,1
i
i r
λ=-
为矩阵T
AA和T A A的非零特征值,
i
u和
i
v分别为T
AA和T
A A对应于
i
λ的特征向量。

上述分解成为矩阵A的奇异
A的奇异值。

这种分解方法可以通过计算较低维矩阵的特征值和特征向量而间接求出较高维矩阵的特征值和特征向量。

因此,奇异值分解可以用于解决特征维数比样本数目多的情况下的PCA算法。

2.3基于PCA算法的人脸图像的特征提取
一个m×n 的二维脸部图片将其按列首位相连,可以看成是m×n 的一个一维向量。

ORL 人脸
数据库中每张人脸图片大小是92×112,它可以看
成是一个10304 维的向量,也可以看成是一个10304 维空间中一点。

图片映射到这个巨大的空间后,由
于人脸的构造相对来说比较接近,因此可以用一个
相应的低维子空间来表示。

我们把这个子空间叫做
“脸空间”。

PCA 的主要思想就是找到能够最好地
说明图片在图片空间中的分布情况的那些向量,这
些向量能够定义“脸空间”。

每个向量的长度为m
×n,描述一张m×n 的图片,并且是原始脸部图片
的一个线性组合,称为“特征脸”。

对于一副m×n 的人脸图像,将其每列相连构成一个大小为D=m×n 维的列向量。

D 就是人脸图像的维数,也即是图像
空间的维数。

设N 是训练样本的数目;表示第j 幅
人脸图像形成的人脸向量;为训练样本的平均图像向量,则所需样本的协方差矩阵为:
()()
1
N T
r j j
j
S x u x u
=
=--

2013年《模式识别》课程论文
《模式识别》课程论文人脸识别
姓名
摘要: 本文在MATLAB环境下,取ORL人脸数据库的部分人脸样本集,基于PCA方法提取人脸特征,形成特征脸空间,然后将每个人脸样本投影到该空间得到一投影系数向量,该投影系数向量在一个低维空间表述了一个人脸样本,这样就得到了训练样本集。

同时将另一部分ORL人脸数据库的人脸作同样处理得到测试样本集。

然后,根据欧几里得距离判据进行人脸图像的匹配识别。

关键词: PCA 人脸识别
1
1N
j j u x N
==

令A=1x u - 2x u - … N x u -],则有
T r S AA =,其维数为D*D 。

根据K-L 变换原理,需要求得的新坐标系由矩阵T AA 的非零特征值所对应得特征向量组成。

直接计算的计算量比较大,所以采用奇异值分解(SVD )定理,通过求解T A A 的特征值和特征向量来获得T AA 的特征值和特征向量。

依据SVD 定理, 令()1,2,i l i r = 为矩阵T AA 的r 个非零特征值,
i v 为T A A 对应于i l 的特征向量。

由于特征值越大,
与之对应的特征向量对图像识别的贡献越大,为此将特征值按大小排列,依照公式
11min 0.9,k i i r k
i i l p k r l ==⎧⎫
⎪⎪⎪⎪
=≥≤⎨⎬⎪⎪⎪⎪⎩⎭
∑∑
选取前p 个特征值对应的特征向量,构成了降维后的特征脸子空间。

则T
AA 的正交归一特征向量i
u
为:()1,2,,i i u Av i p =
= 则特征脸空间为:12[,,]P W u u u =
将训练样本y 投影到“特征脸”空间W ,得到一组投影向量T
Y W y =,构成人脸识别的训练样本数据库。

3 实验结果与分析
3.1 数据库介绍
实验时人脸图像取自英国剑桥大学的ORL 人脸数据
库,ORL 数据库由40个人组成,每个人有10幅不同的图像,每幅图像是一个92×112像素、256级的灰度图,他们是在不同时间、光照略有变化、不同表情以及不同脸部细节下获取的。

3.2 实验设计
在ORL 数据库中,取每人前5幅图像用于训练样本,后5幅图像用于测试样本,分别存放于训练样本数据库“TrainDatabase ”、测试样本数据库“TestDatabase ”。

在MATLAB 中分别编写主程序、用于将训练样本中的二维图像转换成一维列向量的GreatDatabase 函数、用于计算各张人脸中最明显特征的EigenfaceCore 函数、用于识别测试样本中的人脸图像的Recognition 函数。

3.3 实验结果
在MATLAB 中运行程序得到的结果如图1所示。

给出测试样本,都能给出正确的匹配。

图 1. 几组测试人脸的匹配结果
3.4 结果分析
从实验所得出的图中可以看出,应用PCA 和欧几里得判据能够准确的根据训练样本中的人脸识别测试样本中的人脸。

同时,也可以看到这种方法计算量较大、存储量较大,不适用于大型的人脸数据库。

4 结束语
本文应用PCA 和欧几里得距离判据,较好的完成了对ORL 数据库中的人脸的识别,本文中所用的方法对于现实中的人脸识别有一定的引导作用,可以用于相关模式识别系统的设计。

致谢
本次课程论文的完成,离不开老师的指导,和同学的帮助,在此,对所有帮助过我的人表示衷心感谢。

参考文献
[1] 边肇祺,张学工等. 模式识别, 第二版. 清华大学出版社,
2000.
[2] R.O.Duda ,P.E.Hart and D.G.Stork ,Pattern Classification ,
New York ,2001. [3] 张尧庭,方开泰. 多元统计分析引论. 科学出版社,1982.。

相关主题