图像识别技术浅析Analysis of Image Recognition Technology刘峰伯软件学院2010544029【摘要】:本文描述了图像识别系统的结构与工作原理,在对图像预处理、特征提取、分类、图像匹配算法进行深入研究和分析的基础上,分析和比较了各种算法的优缺点,并讨论了其中的关键技术。
【关键词】:图像识别;预处理;特征提取;匹配【Abstract】This paper describes the structure and working principle of an image recognition system. The advantages and disadvantages of various a1gorithms are compared on the basis of in-depth analysis of the image pre-processing, feature extraction, classification and image matching algorithms, and discussed the key technology.【Key Word】Image Recognition;Pre-Processing;Feature Extraction;Matchi ng.一、引言图像识别,是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。
随着计算机技术与信息技术的发展,图像识别技术获得了越来越广泛的应用。
例如医疗诊断中各种医学图片的分析与识别、天气预报中的卫星云图识别、遥感图片识别、指纹识别、脸谱识别等,图像识别技术越来越多地渗透到我们的日常生活中。
二、图像识别系统1、概述自动图像识别系统的过程分为五部分:图像输入、预处理、特征提取、分类和匹配,其中预处理又可分为图像分割、图像增强、二值化和细化等几个部分。
(1)图像输入将图像采集下来输入计算机进行处理是图像识别的首要步骤。
(2)预处理为了减少后续算法的复杂度和提高效率,图像的预处理是必不可少的。
其中背景分离是将图像区与背景分离,从而避免在没有有效信息的区域进行特征提取,加速后续处理的速度,提高图像特征提取和匹配的精度;图像增强的目的是改善图像质量,恢复其原来的结构;图像的二值化是将图像从灰度图像转换为二值图像;图像细化是把清晰但不均匀的二值图像转化成线宽仅为一个像素的点线图像。
(3)特征提取特征提取负责把能够充分表示该图像唯一性的特征用数值的形式表达出来。
尽量保留真实特征,滤除虚假特征。
(4)图像分类在图像系统中,输入的图像要与数十上百甚至上千个图像进行匹配,为了减少搜索时间、降低计算的复杂度,需要将图像以一种精确一致的方法分配到不同的图像库中。
(5)图像匹配图像匹配是在图像预处理和特征提取的基础上,将当前输入的测试图像特征与事先保存的模板图像特征进行比对,通过它们之间的相似程度,判断这两幅图像是否一致。
下面将从图像预处理、特征提取、图像分类及特征匹配这几个方面来讨论自动图像识别技术的研究现状和一些不足之处。
2、图像的预处理预处理是图像自动识别系统中非常重要的一步,它的好坏直接影响图像识别的效果。
预处理的目的是去除图像中的噪声,把它变成一幅清晰的点线图,以便于提取正确的图像特征2.1 方向图的计算方向图因具有真实性且能以简化的形式直观地反映图像最基本的形态特征,因此广泛应用于图像增强、图像特征的提取、图像的自动分类、方向模版匹配等图像识别的关键处理环节。
提取方向图的方法为:(1)将图像分割成足够小的予块。
例如将图像分为16×l6的非重叠小块。
(2)对每个子块的每一个点利用Sobel算子分别计算其x方向梯度和y方向梯度1111(,)(1,1)(,)xu v dx i j S u v f i u j v =-=-=++++∑∑ 1111(,)(1,1)(,)y u v dy i j S u v f i u j v =-=-=++++∑∑上式中x S ,y S 表示Sobel ;(,)f i j 表示各像素的灰度值。
(3)根据梯度值,每个子块方向的计算公式如下:222222222(,)(,)1(,)arctan (,)022(,)(,)i w j w u i w v j w x i w j w u i w v j w dx u v dy u v i j V i j dx u v dy u v θ++=-=-++=-=-⎡⎤⎢⎥⎢⎥=≠⎢⎥⎢⎥⎣⎦∑∑∑∑ (,)2i j πθ= (,)0x V i j =上式中:w 表示图像块的宽度,这里是16,得到θ后再将其量化为8个方向,从而得到图像的方向。
2.2 图像分割传统的图像分割方法包括灰度方差法分割和局部灰度差法等,但是这两种方法对于太湿或太干的图像分割效果往往不准确。
也有利用图像具有较强的方向性的方向图分割法,但基于方向图的分割效果依赖于所求图像的方向图的可靠性,而对图像对比度的高低并不敏感,对于单一灰度的区域,方向图分割难以取得令人满意的效果。
近几年也有学者提出了基于D-S 证据理论的图像分割方法。
总之,目前用于图像分割的方法均各有利弊,采用单一特征的图像分割方法难以达到理想的分割效果。
可以把多种方法结合起来并加以改进,构造一种多级分割体系。
对于一幅图像,把它分为四类图像区域:背景区、不可恢复区、清晰区、可恢复区。
图像分割的目的就是保持后两类区域,而去除前两类的区域。
所谓三级分割是指:第一级分割出背景区域;第二级从前景中分割出模糊区域;第三级从模糊区域分割出:不可恢复部分。
经过这样的处理不仅节省了运算时间,而且提高了分割的可靠性。
2.3 图像的增强目前用的较为广泛的是基于Gabor 滤波的增强方法和基于傅里叶滤波的低质量图像增强算法。
Gabor 滤波增强的基本出发点是基于图像的数学模型,总的定义形式如下式:22221(,)exp()exp()22x x y x y x y G x y iw πδδδδ=-- 要将Gabor 滤波器用于图像的处理,需要将偶Gabor 函数改变为数字滤波器,如下式所示,这样将Gabor 函数的实部作为模板得到的滤波器更真实接近图像的特征。
22221(,)exp(())cos(2)2x x yx y G u v f πδδ'=-+- 该方法综合考虑到了图像的方向特性和频率特性。
虽然本方法的滤波效果比较好,但是Gabor 滤波过程中频率计算和滤波计算所消耗的时间在整个图像的预处理过程中所占用的时间比重较大。
2.4 二值和细化根据图像的灰度分布,统计其最佳的阈值是二值化算法研究的核心。
传统的二值化算法有静态算法和动态算法。
动态算法比静态算法有着较好的效果,静态算法对质量差的图像区域产生大量的伪特征点,动态算法能够在一定程度上弥补静态算法的缺陷,但这样也会引入更多的噪声。
在图像二值化方面,近来又出现了一些新的方法,如一种基于方向图的动态阈值图像二值化方法。
该方法直接从图像灰度图像中获取动态阈值对图像二值化,一次性完成一般图像预处理中的分离无效区域、滤波、增强、二值化的过程。
对细化问题,国内外已提出多种细化算法,各有特点和不足,其中较具代表性的有以下几种细化算法:经典快速细化算法、R .W .Hall 细化算法、Rosenfeld 细化算法、及Zhang & Suen 细化算法等。
目前使用较多的图像细化算法有两种:基于形态学处理的快速细化算法和OPTA 算法及其改进形式。
快速细化算法为4连通并行细化算法,原理是判断出图像纹线的边界点并逐步删除。
该算法速度很快,但细化不彻底,细化后的纹线不是单像素宽。
3、图像的特征提取和分类直接从图像原始灰度图提取特征,效率高,但容易提取出大量的伪特征信息。
基于全局结构特征的分类方法,通过提取和分析方向图、奇异点等全局结构特征来实现分类。
采用模仿人类进行图像分类的做法,对图像的变形有较强的鲁棒性;但图像质量较差时很难提取可靠的结构特征。
目前主流的特征提取和分类算法是基于局部细节特征的算法。
局部细节特征提取的算法如下:利用一个3×3的模版来对细化后的图像进行端点和分歧点的特征提取,如下图所示,M 是待检测的点,沿顺时针排列的P1,P2,P3,···P8是它的8个邻域点,R(1),R(2),R(3)···R(8)分别是P1,P2,P3,···P8的灰度值。
如果M 是端点,则它的邻域点满足下式:81273654P P P P M P P P P特征提取模板81(1)()2,(9)(1)N k G R k R k R R ==+-==∑如果M 分支点,则它的邻域点满足下式:81(1)()2,(9)(1)N k G R k R k R R ==+-==∑通过对图像进行遍历。
可以找到图像的特征点,同时记录它们的类型和位置。
4、图像匹配在图像匹配方面,很多学者进行了研究工作,但目前最常用的方法是细节匹配。
细节点模式中细节点特征向量集合和输入细节点模式中细节点特征向量集合可分别表示为:{}|1,,p i P F i M == {}|1,,p j Q F j N ==其中模板细节点特征集合P 包括M 个细节点,输入细节点特征集合Q 包括N 个细节点。
在以上表示方法的基础上,细节点匹配问题表述为:搜索P 和Q 中点之间的最佳对应关系,根据在此对应关系下相对应细节点的数目得到匹配分值MS ,并与阈值T 比较,如果MS T ≥,则两个细节点模式匹配,如果MS T <,则两个细节点模式不匹配。
近年来,以遗传算法和神经网络为代表的计算智能理论和技术获得了不断丰富和发展,为细节点匹配问题的求解提供了很多新的思路和工具。
如:基于遗传算法的点模式匹配算法,该算法首先定义匹配误差,然后搜索使匹配误差最小的点对应关系,遗传算法具有搜索全局最优解的能力,因此具有较强的鲁捧性。
三、总结以上对图像识别系统的关键算法进行了讨论和比较研究。
图像识别的整个过程步骤很多,每个步骤也有若干种算法,算法的好坏直接影响后续步骤的效果。
虽然图像识别技术已取得了巨大的成就,但目前的方法对质量较差的图像的处理不太理想,算法的效率低,都是图像识别需要解决的问题,还需要注重和提高以下几个方面:(1)由于Gabor r变换对特征点区域的不敏感性,使得这部分的增强效果不佳,时常无法区分端点还是分支点,致使这一特征信息无效,考虑能否做出一定的改进,使得特征点类型划分的可信度更高。
此外,Gabor变换的效率虽然随着计算机运行速度的提高而改善,但是与空域变换算法相比还有相当差距,考虑能否通过查表的方式提高Gabor变换的运行速度。