预处理就是在图像分析中,对输入图像进行特征抽取等前所进行的处理。
输入图像由于图像采集环境的不同,如光照明暗程度以及设备性能的优劣等,往往存在有噪声,对比度不够等缺点。
另外,距离远近,焦距大小等又使得人脸在整幅图像中间的大小和位置不确定。
为了保证人脸图像中人脸大小,位置以及人脸图像质量的一致性,必须对图像进行预处理。
图像预处理的主要目的是消除图像中无关的信息,滤除干扰、噪声,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取的可靠性.人脸图像的预处理主要包括人脸扶正,人脸图像的增强,以及归一化等工作。
人脸扶正是为了得到人脸位置端正的人脸图像;图像增强是为了改善人脸图像的质量,不仅在视觉上更加清晰图像,而且使图像更利于计算机的处理与识别。
归一化工作的目标是取得尺寸一致,灰度取值范围相同的标准化人脸图像[4]。
几何规范化由于图像在提取过程中易受到光照、表情、姿态等扰动的影响,因此在识别之前需要对图像做归一化的预处理[4],通常以眼睛坐标为基准点,通过平移、旋转、缩放等几何仿射变换对人脸图像进行归一化。
因为人脸虽然是柔性的三维曲面,同一人脸因表情变化会有差异,但相对而言人的两眼之间的距离变化不会很大,因此双眼的位置及眼距,就成为人脸图像归一化的依据。
定位眼睛到预定坐标,将图像缩放至固定大小。
通过平移、旋转、缩放等几何仿射变换,可以对人脸图像做几何规范化处理,仿射变换的表达式为:]100][1,,[]1,,[323122211211a a a a a a v u y x = (2-1) 其中(u,v)表示输入图像中像素的坐标(x,y)表示输出图像中像素的坐标。
将上式展开可得322212312111u a x a v a u a y a v a ++=++=(2-2)平移变换就是给图像中的所有点的坐标都加上u ∆和v ∆ ,其变换表达式为]1u 010001][1,,[]1,,[v v u y x ∆∆=(2-3)将图像中的所有点相对于坐标原点逆时针旋转θ角的变换表达式为]1000cos sin 0sin cos ][1,,[]1,,[θθθθ-=v u y x (2-4) 缩放变换既是将图像按给定的比例r 放大或缩小,当1>r 时图像被放大,当10<<r 时图像被缩小,其变换表达式为]1000000r ][1,,[]1,,[r v u y x =(2-5)本论文在对人脸图像特征提取之前,首先对所有的图像进行几何规范化,将两个人眼的位置固定在同一位置上,结果如图,图所示。
图 几何规范化之前的人脸图像图几何规范化后的人脸图像灰度级插值图像经过空间变换后,变换后的空间中各像素的灰度值应该等于变换前图像对应位置的像素值。
但实际情况中,图像经过几何变换后,某些像素会挤压在一起或者分散开来,使得变换后图像的一些像素对应于变换前图像上非整数坐标的位置,为此需要通过插值求出这些像素的灰度值,通常采用的方法有最近邻插值、双线性插值和双三次插值。
最近邻插值最近邻插值是一种最简单的插值方法,输出的像素灰度值就是输入图像中预期最邻近的像素的灰度值,这种方法的运算量非常小,但是变换后图像的灰度值有明显的不连续性,能够放大图像中的高频分量,产生明显的块状效应。
双线性插值双线性插值输出像素的灰度值是该像素在输入图像中2*2领域采样点的平均值,利用周围四个相邻像素的灰度值在垂直和水平两个方向上做线性插值。
这种方法和最近邻插值法相比,计算量稍有增加,变换后图像的灰度值没有明显的不连续性,但双线性插值具有低通滤波的性质,会导致高频分量信息的部分丢失,图像轮廓变得模糊不清。
双三次插值双三次插值利用三次多项式来逼近理论上的最佳正弦插值函数,其插值邻域的大小为4*4,计算时用到周围16个相邻像素的灰度值,这种方法的计算量是最大的,但能克服前两种插值方法的缺点,计算精度较高。
灰度规范化灰度规范化是通过图像平滑、直方图均衡化、灰度变换等图像处理方法来改善图像质量,并将其统一到给定的水平。
图像平滑图像平滑处理的目的是为了抑制噪声,改善图像质量,可以在空间域和频域中进行。
常用的方法包括:邻域平均、空域滤波和中值滤波等。
邻域平均法是一种局部空间域处理的方法,它用像素邻域内各像素的灰度平均值代替该像素原来的灰度值,实现图像的平滑。
由于图像中的噪声属于高频分量,空域滤波法采用低通滤波的方法去除噪声实现图像平滑。
中值滤波是一种非线性处理技术,能抑制图像中的噪声。
它是基于图像的这样一种特性:噪声往往以孤立的点的形式出现,这些点对应的像素数很少,而图像则是由像素较多、面积较大的小块构成[12]。
无论是直接获取的灰度图像,还是由彩色图像转换得到的灰度图像,里面都有噪声的存在,噪声对图像质量有很大的影响。
进行中值滤波不仅可以去除孤点噪声,而且可以保持图像的边缘特性,不会使图像产生显着的模糊,比较适合于实验中的人脸图像。
中值滤波的步骤:(1)将模板在图中漫游,并将模板中心与图中某个像素位置重合;(2)读取模板下各对应像素的灰度值;(3)将这些灰度值从小到大排成一列;(4)找出这些值里排在中间的一个;(5)将这个中间值赋给对应模板中心位置的像素。
由以上步骤可以看出,中值滤波的主要功能就是让与周围像素灰度值的差比较大的像素改取与周围像素值接近的值,所以它对孤立的噪声像素的消除能力是很强的。
由于它不是简单的取均值,所以产生的模糊比较少。
换句话说,中值滤波即能消除噪声又能保持图像的细节[13]。
实例如下:图 原始图像与5*5中值滤波后的效果图直方图均衡化灰度直方图反映了图像中每一灰度级与具有该灰度级的像素出现的频率之间的关系,可以表示为:Nn P k k =)r ( (2-6)其中,k r 表示第k 个灰度级,k n 为第k 级灰度的像素数,N 为一幅图像的像素总数,灰度直方图是图像的重要统计特征,可以被认为是图像灰度概率密度函数的近似,直方图均衡化就是将图像的灰度分布转换为均匀分布。
对于对比度较小的图像来说,其灰度直方图分布集中在某一较小的范围之内,经过均衡化处理后,图像所有灰度级出现的概率相同,此时图像的熵最大,即图像包含的信息量最大。
以r 和s 分别表示归一化了的原图像灰度和直方图均衡化后的图像灰度,T(r)为变换函数,则在[0,1]区间内任意一个r 经变换后都对应一个s ,)(r T s =。
)(r T 应满足下列条件:1.s 在[0,1]区间内为单调递增函数;2.在[0,1]区间内,反变换)(1s T r -=也存在,且为单调递增函数。
条件1保证了灰度级从黑到白的次序,条件2确保了映射后的像素灰度在允许的范围内。
有概率论论可知,已知随机变量r 的概率密度函数为)(r P r ,而随机变量s 是r 的函数,则随机变量s 的概率密度函数)(s P s 可由)(r P r 求出。
假定随机变量s 的分布函数)(s F s ,根据分布函数的定义:dr r P ds s P s F rr s s s ⎰⎰∞-∞-==)()()( (2-7) 根据概率密度函数和分布函数之间的倒数关系,将上式两边对s 求导得:)(s -1|)()(s T r r s ds dr r P s P -=∞=⎰ (2-8)从上式可以看出,通过变换函数)r (T 可以控制图像灰度的概率密度函数,因为直方图均衡化有1)(=s P s ,则:)]([)(r T d dr r P ds r ==(2-9)两边积分得:⎰==rr r P r T 0)()(s(2-10)上式表明变换函数为原图像直方图的累计函数。
对于灰度为离散的数字图像来说,用频率代替概率,变换函数)(r T 的离散形式可以表示为:∑∑=====k l l k l l r k k Nn r P r T s 00)()( (2-11)式中:1r 0≤≤k ,L L k ,1...2,1,0-=,L 为灰度级数目。
示例如下:图直方图均衡化前后的图像由两幅图像处理前后的效果变化可以看出经过直方图均衡化后,图像的细节更加清楚,直方图各灰度等级的分布更加平衡。
灰度变换灰度拉伸又叫对比度拉伸,它是最基本的一种灰度变换,使用的是最简单的分段线性变换函数,它是将原图像亮度值动态范围按线性关系扩展到指定的范围或整个动态范围。
它的主要思想是提高图像处理时灰度级的动态范围,适用于低对比度图像的处理,一般由两个基本操作组成:⑴直方图统计,来确定对图像进行灰度拉伸的两个拐点;⑵灰度变换,根据步骤⑴确定的分段线性变换函数进行像素灰度值的映射。
实例如下:图 原始图像以及灰度拉伸处理后的效果由两幅图像处理前后的效果变化可以看出灰度拉伸后增强了图像的对比度,使得图像细节更加的突出。
通过灰度变换,将不同图像的灰度分布参数统一调整到预定的数值,称为灰度归一化,通常是调整图像灰度分布的均值和均方差分别为0和1。
设一幅尺寸为N M *的图像的灰度值分布可以用矩阵),i (j I 形式表示,N J M ≤≤≤≤1;i 1,矩阵每个元素值即为图像中该点的像素值,则图像的灰度值分布概率密度函数的均值和均方差分别为∑∑∑∑====-==M i N j M i N j j i I MN j i I MN 11211)),((1),(1μσμ(2-12) 本章小结本章对图像预处理技术进行了简单的介绍,包括不同方法对图像的作用区域和作用效果都做了介绍,并对其中比较常用的图像处理技术进行效果图展示,在对图像进行定位之前,图像处理的好坏也能影响到定位的精准度,选择合适的图像处理方法,有效地减少光照、图像质量等对定位的影响,也成为本文研究的一个重点。