计算机视觉综述摘要:自从1956 年Dartmouth学会上提出“人工智能”后,世界各国的研究者发展了众多理论和原理。
人工智能是一门极富挑战性的学科,研究他的工作人员必须懂得多门学科的知识,比如计算机、心理学、哲学、生物学、仿生学等等,它涉及的范围相当的广泛。
并且在这些广泛的学科又由不通的领域组成,如计算机学习、计算机视觉等。
研究人工智能的目的是使机器能够担任一些需要人工处理的工作。
而这些工作需要做一定的决策,要求机器能够自行的根据当时的环境做出相对较好的决策。
这就需要计算机不仅仅能够计算,还能够拥有一定得智能。
而要对周围的环境进做出好的决策就需要对周边的环境进行分析,即要求机器能够“看”到周围的环境,并能够理解它们。
就像人做的那样。
所以计算机视觉是人工智能中非常重要的一个领域。
关键词:人工智能计算机; 视觉; 图像;1、计算机视觉的应用人类正在进入信息时代,计算机将越来越广泛地进入几乎所有领域。
一方面是更多未经计算机专业训练的人也需要应用计算机,而另一方面是计算机的功能越来越强,使用方法越来越复杂。
这就使人在进行交谈和通讯时的灵活性与目前在使用计算机时所要求的严格和死板之间产生了尖锐的矛盾。
人可通过视觉和听觉,语言与外界交换信息,并且可用不同的方式表示相同的含义,而目前的计算机却要求严格按照各种程序语言来编写程序,只有这样计算机才能运行。
为使更多的人能使用复杂的计算机,必须改变过去的那种让人来适应计算机,来死记硬背计算机的使用规则的情况。
而是反过来让计算机来适应人的习惯和要求,以人所习惯的方式与人进行信息交换,也就是让计算机具有视觉、听觉和说话等能力。
这时计算机必须具有逻辑推理和决策的能力。
具有上述能力的计算机就是智能计算机。
计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。
计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。
而计算机视觉技术正广泛的应用于各个方面,充医学图像到遥感图像,充各有检查到文件处理。
在需要人类视觉的场合几乎都需要用感到计算机视觉,许多人类视觉无法感知的场合,如精确定律感知、危险场景感知、不可见物体感知等,计算机视觉更突出他的优越性。
现在计算机视觉已在一些领域的到应用,如零件识别与定位,产品的检验,移动机器人导航遥感图像分析,安全减半、监视与跟踪,国防系统等。
它们的应用于计算机视觉的发展起着相互促进的作用。
2、计算机视觉与人类视觉计算机视觉正如它的名字一样,就是一门研究计算机“看”的学科,即使指通过摄像机和计算机的处理来对目标进行识别、跟踪和测量等,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。
作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取“信息”的人工智能系统。
同时计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。
通过这些技术来让计算机代替人完成对问题的处理。
计算机视觉最终的目标是让计算机能够像人一样通过视觉对外部环境进行观察和理解,从而具有自主适应环境的能力。
虽然当前还难以实现,但人们正超这一目标努力。
现在的前期目标是建立一个初步的系统,这个系统能够反馈某种程度的信息,能在一定程度上完成一些任务。
比如自主车辆的视觉导航,这种导航能够使车辆在高手公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。
这种系统就像是在开车一样,它是模仿人脑进行各种判断。
而就目前而言人类视觉系统是人们所知道的功能最强大和完善的视觉系统。
因此,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。
视觉是人类最重要的感觉,它是人类的主要感觉来源,人类认识外界信息80%来自视觉。
人们看东西的时候视乎是毫不费力、轻而易举的事,但实际上视觉系统在你看东西的时候所完成的工作是十分复杂的。
当眼睛看到某种东西时,先要对它的各部分进行分类,然后从中选出有用的特征信息来做出判断。
人的眼睛并不会对事物、信息进行判断,它是将信息反馈给大脑,然后大脑根据得到的信息与原来大脑里的信息来进行比较得出解释结果。
敏感、感觉、认识是视觉系统的3个重要的概念。
敏感是把外界的各种刺激转换成人体神经系统能够及时的生物点信号。
它所完成的是信号的转换,并不涉及对信号的理解。
感觉的任务是把敏感器官的各种输入转换和处理成为对外部世界的理解。
而认识是以人们对周围客观世界的概念为基础的。
如果没有感觉作为人与外部世界的桥梁或窗口,人的思维活动就失去了基本的依据了。
因此人们在模仿人类视觉时需要相应的各种处理,比如摄取图像,处理图像,理解图像。
3、计算机视觉的研究3.1计算机视觉的处理过程模仿人类的视觉系统,计算机视觉系统中信息的处理和分析大致可以分成两个阶段:图象处理阶段又称视觉处理中的低水平和中水平阶段;图象分析、理解阶段又称视觉处理中的高水平处理阶段。
在图象处理阶段,计算机对图象信息进行一系列的加工处理,这主要是:(1)、校正成象过程中系统引进的光度学和几何学的畸变,抑制和去除成象过程中引进的噪声—统称为图象的恢复。
(2)、从图象信息如亮度分布信息中提取诸如边沿信息,深度信息图象点沿轴方向的尺度,表面三维倾斜方向信息等反映客观景物特征的信息。
(3)、根据抽取的特征信息把反映三维客体的各个图象基元,如轮廓、线条、纹理、边缘、边界、物体的各个面等从图象中分离出来,并且建立起各个基元之间的拓朴学上的和几何学上的关系—称之基元的分割和关系的确定。
在图象分析和理解阶段,计算机根据事先存贮在数据库中的预知识模型,识别出各个基元或某些基元组合所代表的客观世界中的某些实体称之为模型匹配以及根据图象中各基元之间的关系在预知识的指导下得出图象所代表的实际景物的含义,得出图象的解释或描述。
3.2计算机视觉的处理技术3.2.1图像获取图像的获取是通过输入设备来得到的。
输入设备包括成像设备和数字化设备。
成像设备是通过光学摄像机或红外、激光、超声、X射线对周围场景或物体进行探测成像,得到关于场景或物体的二维或三维数字图像。
好的成像系统能够很好的对图像的处理做好前期准备。
如红外成像系统,激光成像系统,还有计算机成像系统,即每个像素元(或)若干像素元对应一个简单的处理器,这样可以适应复杂场景动态变化的场合。
3.2.2图像预处理这一过程主要对输入的原始图像进行处理。
这一过程借助大量的图像处理技术和算法,如图像滤波、图像增强、边缘检测等,以便从图像中抽取诸如角点、边缘、线条、边界已经色彩等官员场景的基本特征;这一过程还包括了各种图像变换(如校正)、图像纹理检测、图像运动检测等。
在对图像实施具体的计算机视觉方法来提取某种特定的信息前,一种或一些预处理往往被采用来使图像满足后继方法的要求。
3.2.3图像复合主要任务是恢复场景的深度、表面法线方向、轮廓等有关场景的2.5维信息,实现的途径有立体视觉、测距成像、运动估计、明暗特征、纹理特征等所谓的葱X恢复形状的估计方法。
系统表达、系统成像模型等研究内容一般也在这里进行。
3.2.4图像恢复任务是在以物体为中心的坐标系中,在原始输入图像,图像基本特征、2.5为图像的基础上,恢复舞台的完整三维图,建立舞台三维描述,识别三维物体并确定舞台的位置和方向。
3.2.5图像理解到这一步是为了辨别物体并对物体进行分类。
经过前几个步骤的处理将被认为含有目标物体的部分进行处理。
验证得到的数据是否符合前提要求,估测待定系数,比如目标姿态,体积,位置等。
最后进目标进行分类理解,解释目标的各种特性。
4 对计算机视觉研究的认识计算机视觉研究经历了近40年的过程,仍面临许多问题。
主要由于这一方向是多学科的交叉与结合,同时视觉是一个涉及生理、心理的复杂过程,不仅与眼睛有关,还和大脑的推理、学习有关。
研究计算机视觉的目的是要实现对人类视觉的模拟和延伸。
对于人类而言,视觉是一个轻而易举的功能,对机器却不同。
视觉过程很难用类似于问题求解的方法符号化。
随着计算机科学领域中对定量研究的重视,这种状况会得到改善。
在计算机视觉的研究过程中,应考虑将功能模拟与认知模拟相结合。
人类延伸其他能力的过程中,功能模拟起到了主要作用,但视觉是涉及心理和生理两方面的过程,因此必须在功能模拟的同时重视认知模拟。
计算理论的进步与感知手段的改进有助于计算机视觉的研究。
在计算机视觉中计算理论占有十分重要的地位,计算理论的进步,新的计算模型的提出可以解决以往一些困难的问题;另一方面,感知手段的进步也可以起到同样的作用。
采用主动视觉可从另一个侧面去处理面对的视觉问题。
要实现完整的视觉系统,视觉知识的获取、管理和利用是必不可少的。
一个相对完备的视觉系统同时也是一个知识管理系统,在视觉过程中对一幅图像的理解需要大量的关于任务领域的知识,这些知识不同于问题求解中的知识可以明确的显性表示,而且人类获取信息的80%是通过视觉得到的,因而这些知识涉及面之广难以预测,因此视觉系统中的知识管理是一个重要问题。
从以往的研究看,过去的几十年虽然提出、解决了一些问题,但是由于视觉问题的特殊性和复杂性,还有大量的问题需要研究。
研究的重点包括对新方法、新手段的探索。
当然,在原有问题上采用新的描述方法、求解手段也是一个可能的突破点。
在视觉领域中多数的问题不是问题本身正确与否,而是描述是否恰当以及求解是否有效的问题,因而描述方式、求解手段的探索是十分重要的。
总之,随着对定量研究的重视,新的描述方式、求解手段的研究,以及感知手段的改进,计算机视觉的研究必将迎来一个更加繁荣的时代。
参考文献:[1] 陈熙霖.计算机视觉:算法与系统原理,清华大学出版社,2000[2] 高满屯.计算机视觉研究中的投影理论和方法,西北工业大学出版社,1998[3] 马颂德,张正友.计算机视觉—计算理论与算法基础,科学出版社,1998[4] 章毓晋.图像工程下-图像理解与计算机视觉,清华大学出版社,2000[5] 贾云得.机器视觉,科学出版社,2002。