图像识别技术综述杨列 20821152
摘要
本文对图像识别的基本方法,并展望了图像识别技术所面临的问题及发展方向。
1. 前言
图像识别所研究的问题,是如何用计算机代替为人自动去处理大量的物理信息,解决人类生理器官所不能识别的问题,从而从部分上代替人的脑力劳动。
图像的含义也比较广泛,最早是指图片,后来把如声波的波形图也归为图像。
具体来说,图像可以是各种图画,字符,声波信号,透视胶片,空间物体。
综合来说,又可以分为直观视觉图像(图案,文字)和间接转换图像(声音,心率等)两类。
由于图像识别涉及许多学科,图像本身含义也相当广泛性和丰富性,本文只从由光学采集器获得二维灰度图像的识别的几个重要方面做一些综述。
t.
2. 图像识别方法
2.1图像识别的基本方法及特点
图像识别的方法很多,可概括为三种:统计(或决策理论)法,结构(或句法)方法和神经网络法。
[1]
对于一幅实际图像来说,目标和背景常常不是线性可分的,统计法是一种分类误差最小的方法。
它以数学上的决策理论为基础,根据这种理论建立统计学识别模型。
其基本模型是对研究的图像进行大量的统计分析,找出规律性认识,提出反映图像本质特点的特征进行识别。
如Bayes模型和马尔科夫(MRF)模型。
但是统计方法基本严格的数学模型,而忽略了图像中被识别对象的空间相互关系,即结构关系,所以当被识别物体的结构特征为主要特征时,用统计方法便会很难识别。
句法识别是对统计识别方法的补充,统计方法用数值来描述图像的特征,句法方法则是用符号来描述图像特征的。
它模仿了语言学中句法的层次结构,采用分层描述方法,把复杂图像分解为单层或多层的简单子图像,主要突出识别对象的结构信息。
模式识别是从统计方法发展起来的,而句法方法更扩大了模式识别的能力,使其不仅限于对象物的分类,而且用于景物的分析与物体结构的识别。
神经网络方法是指用神经网络的算法对图像进行识别的方法,神经网络系统是由大量简单的处理单元(神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特性,是人脑神经网络系统的简化,抽象和模拟。
句法方法侧重于模拟人的逻辑思维,而神经网络侧重于模拟和实现人的认知过程中的感知觉过程,形象思维,分布式记忆和自学自组织的过程,与符号处理是一种互补的关系。
但神经网络具有大规模并行,分布式存储和处理,自组织,自适应和自学习的能力,特别适用于处理需要同时考虑许多因素和条件的不精确和模糊的信息处理问题。
2.2 其它图像识别方法
模糊集(Fuzzy Set)识别方法。
在模式识别,自动控制等方面有广泛应用。
在图像识别中,有些问题极其复杂,很难用一些确定的标准作出判断。
人脑的识别精度不高,却能够用一些不够精确,也即模糊的概念准确地辨识复杂事物的特征,怎样用不太精确的方式来描述复杂的系统,怎样建立合理的数学模型来研究模糊现象,并能快速准确地进行识别,就是模糊识别法研究的目的。
标记松弛法(Relaxation Labeling) [2]是另一种采用符号来描述图像特征的识别方法,在这种方法中,处理对象一般称为目标,而描述目标的符号则称为标记,标记松弛法先对目标给定一组不确切的标记,通过迭代运算[3]逐次更新标记,最后求得这组目标的较为确切的标记集,算法的整个过程与人对某一事物的猜测推理过程相类似。
由于以迭代方式进行,所以易于实现,但所缺点是计算量太大[4],只有采用并行处理的方法,标记松弛法才能充分发挥它的作用。
此外,还有实用性很强的识别方法,就是模板匹配(Template Matching)法,模板匹配法是按
照预置在机内的模板用匹配的方法来识别目标,模板可以是数字量,也可以是符号串等。
因此可以把它看作是统计法和句法方法的一种特例来研究。
模板匹配法简单方便,各种自动售货机,字符阅读机等往往按此构成,但由于噪声的影响和实际图像结构千变万化,模板匹配在较复杂的情况下往往得不到理想的效果。
3. 图像识别技术所面临的问题和发展趋势
分辨现实世界中的各种复杂景物对为类来说是一件轻而易取的事,而用计算机进行图像识别却非常困难,图像识别大多数成功的应用是相对简单(或对识别环境有严格的限制)的领域,并且多是二维的。
当前图像识别所面临者许多问题:
首先,完成一幅图像的识别要经过许多不同的处理过程,图像的识别正是这些过程的综合作用的结果。
但是缺少一个普遍的原理来指导这些过程在完成特定任务时应该如何组织和搭配,即使是对于各种常用的图像分割算法之间的性能比较,也没有一个较好的统一的标准。
还有,现在的各种图像识别算法都或多或少带有一定的局限性,在一种环境下效果很好,但另一种环境下就可能很差,传统的只简单处理方法很难构造图像中景物的完整描述。
再次,一些能用性,效果好的算法往往计算量很大,难以实时应用。
最后,为类对生物体的视觉机理还不清楚,不能给计算机图像识别提供有力的指导。
尽管计算机图像识别技术面临着很大的挑战,但还是取得了很大的发展,多年的发展变化,不难看出一些特点:
1)立体视觉与人工智能仍然是计算机图像识别今后发展的方向,短时间内实现全自动的通用性很大的计算机视觉系统的可能性不大,今后应结合各种实际应用开发各种用途的计算机视觉系统。
2)七十年代末Marr提出的视觉计算理论极大地促进了计算机视觉的发展,但同时也存在不少缺陷,视觉识别是一个极其复杂的过程,在Marr的理论中,有些东西是作为一种假设出现的,有些重要问题甚至还没有涉及,图像识别技术的发展必须以视觉计算理论的发展为前提。
3)一些优秀的数学方法,如神经网络,模糊集,分形理论,小波分析,遗传算法纷纷应用于图像识别领域,取得了一定的成就,这些方法的继续发展完美以及各种方法相互融合,取长补短的综合集成是往后发展的重要任务。
4. 结束语
本文对图像识别的基本方法,图像识别技术所面临的问题及发展方向做了简要的综述。
我们必须认识到计算机视觉还处于婴幼期,人类的视觉是有目的的,定性的,主动的视觉,计算机图像识别要达到这一步还有很长的路要走。
5. 参考文献
[1] R.M. Haralick and L. G. Shpiro. Survey Image Segmentation Techniques. Computer Graphics Image Process, 1980, 12:60-73
[2] Zucker S.W. Hummul R.A and Rosenfeld A. An Application of Releaxation Labeling to Line and Enhancement. IEEE Trans. Computer, 1977, 26:394-403 [3] Nikhil R.Pal and Sankar K.Pal Review on Image Segmentation Techniques. Pattern Reconginiton. 1993,
26(9):1272-1279
[4] C.KLeung and m. Performance Analysis for a Class of Iterative Image Thresholding Algorithms. Pattern Recognition. 1996, 29: 1523-1530。