图像处理及识别技术在机器人路径规划中的一种应用摘要:目前,随着计算机和通讯技术的发展,在智能机器人系统中,环境感知与定位、路径规划和运动控制等功能模块趋向于分布式的解决方案。
机器人路径规划问题是智能机器人研究中的重要组成部分,路径规划系统可以分为环境信息的感知与识别、路径规划以及机器人的运动控制三部分,这三部分可以并行执行,提高机器人路径规划系统的稳定性和实时性。
在感知环节,视觉处理是关键。
本文主要对机器人的路径规划研究基于图像识别技术,研究了图像处理及识别技术在路径规划中是如何应用的,机器人将采集到的环境地图信息发送给计算机终端,计算机对图像进行分析处理与识别,将结果反馈给机器人,并给机器人发送任务信息,机器人根据接收到的信息做出相应的操作。
关键词:图像识别;图像处理;机器人;路径规划ABSTRACT:At present, with the development of computer and communication technology, each module, such as environment sensing, direction deciding, route planning and movement controlling moduel in the system of intelligent robot, is resolved respectively. Robot path planning is an part of intelligent robot study. The path planning system can be divided into three parts: environmental information perception and recognition, path planning and motion controlling. The three parts can be executed in parallel to improve the stability of the robot path planning system. As for environment sensing, vision Proeessing is key faetor. The robot path planning of this paper is based on image recognition technology. The image processing and recognition technology is studied in the path planning is how to apply, Robots will sent collected environment map information to the computer terminal, then computer analysis and recognize those image information. After that computer will feedback the result to the robot and send the task information. The robot will act according to the received information.Keywords: image recognition,image processing, robot,path planning1 引言机器人是人类社会发展的象征,是具有代表性的高技术,它集中了机械、电子、计算机、自动控制以及人工智能等多种学科的最新科研成果,代表了机电一体化的最高成就"。
拥有感知、规划和控制能力的智能机器人,能够通过感知器自主的收集环境信息,通过内部程序做出规划,控制自身的动作。
路径规划是移动机器人导航技术的重要组成部分,机器人对环境的感知、环境建模、路径规划是影响机器人活动能力的重要因素。
目前在机器人路径规划研究中已经有很多优化算法,但很多都有局限性,如何让机器人利用已经有的运动学以及动力学的约束,结合自身所处的环境特点进行高效的、实时的选择路径,是路径规划领域的重要研究课题。
图像处理一般是用计算机处理或实时的硬件处理,因此也称之为计算机图像处理,其优点是处理精度高,处理内容丰富,可进行复杂的非线性处理, 有灵活的变通能力, 一般来说只要改变软件就可以改变处理内容。
其缺点是处理速度还是一个问题, 特别是进行复杂的处理更是如此。
图像识别技术的研究目的是利用计算机自动处理图像信息,来替代人完成图像的分析和识别等任务,数字图像的处理和识别技术作为模式识别领域的一个重要研究方向,已得到广泛的研究和迅速的发展。
图像识别技术在 PC 终端上已经有很多成熟的应用实例,最常见的有人脸识别、指纹识别和医学影像分析等,随着数字图像技术的成熟,以及智能终端的发展,图像识别技术现在已经开始应用到智能手机中,但是,由于一些硬件上的限制,还存在速率、运行内存以及系统空间等问题,因此主要还是在 PC 终端上的应用比较多。
2 本文所用的图像处理及识别技术基础2.1 图像识别技术基础模式识别是利用计算机对物理对象进行处理分析以及分类,在错误概率最小的条件下,使识别的结果尽量与客观事物相符。
模式识别是以应用为基础的学科,主要目的是使机器能够自动识别物体并进行信息处理,以便可以替代人去独立的完成任务。
图像识别技术是模式识别在图像领域里的具体应用,是通过计算机对图像进行处理、分析以及分类理解,以识别不同模式的目标和对象的技术。
图像识别是对观测对象或者过程进行分类辨别和描述,做出有意义判断的研究。
狭义的说,图像是图像识别要研究的模式,图像识别它是建立在图像处理技术的基础上对图像进行识别的学科。
图像识别主要技术如下。
图像预处理阶段。
图像增强是数字图像处理过程中常用的一种方法,根据处理空间不同,分为在图像所在像素空间处理的空域法和在傅里叶变换后的频域上间接处理的频域法两大类。
具体主要方法如图1图像增强方法所示。
图1 图像增强方法基于小波变换的图像去噪是非线性方法去噪的,小波变换在数学领域中是一个函数逼近问题,根据实际的需求,寻找小波函数伸缩、平移后的函数空间中与原始图像信息的最佳接近。
同时基于小波变换的图像去噪也是一个信号滤波问题,小波去噪是在低通滤波的同时保留图像的边缘等特征细节信息,其去噪流程如图2小波变换去噪流程所示。
图2 小波变换去噪流程小波阈值去噪,其中包含信号重要信息的是图像信号对应的小波系数部分,这部分幅值较大,但数量较少;噪声信号对应的小波系数则幅值较小,数量很多,并且一致分布。
在最小均方误差的定义下该算法达到近似最优,能够取得良好的视觉效果。
找到阈值δ,将低于δ的小波系数设定为零,保留高于δ的系数或者进行压缩处理,从而得到估计小波系数,然后对其进行重构。
图像特征提取。
特征提取是图像识别过程中保证后期分类判别质量的重要阶段,提取的图像特征需要能够表述识别物体的典型特征,具备独特性、完整性、几何不变性以及抽象性,常见的用来做特征提取的元素有:颜色、纹理、边缘、形状等特征。
颜色是图像信息的基本组成要素,每个被识别物体都具有颜色这一特征,基于颜色特征的分类判别检索是图像识别中最基本的判别方法,并且与几何特征相对比,颜色更加稳定,对大小和方向也都不像几何特征那么敏感。
纹理特征是通过图像灰度分布函数对图像局部性质的统计,是对图像中各像素灰度空间分布的一种描述,局部看来可能没有规则,但在图像整体的特征上会呈现一定的规则。
形状特征形象而且直观,是物体的本质特征之一,主要通过图像外部边界的轮廓特征和区域特征来表示,是物体的稳定特征,对于已知几何形状的物体识别,形状特征可以是很好的判别准则。
在实际应用中,形状特征经常是初步筛选条件。
图像边缘检测。
图像边缘检测是预处理阶段中对图像特征的提取,是在数字图像处理中应用很广泛的技术,尤其在模式识别中应用最为频繁。
物体的边缘主要有两个特征:方向和幅度,通常灰度变化在边缘处会比较平缓,而在垂直方向会比较剧烈,根据这种变化将图像边缘分为:屋顶型、凸缘型和阶跃型三种类型。
边缘检测的过程为首先利用经典的边缘检测算法将有用的特征进行提取,然后对图像进行初步检测,最后利用边缘的空间结构进行协调,增强边缘效果。
传统的边缘检测模板是 N * N 权值方阵,通过小区域卷积近似计算得来,经典算子主要有:Sobel 算子、Prewitt 算子、Roberts 算子、Canny算子和 LOG 算子,其中前四个算子属于一阶微分算子,LOG 算子属于二阶微分算子。
在经典算子的基础上最优算子开始发展起来,最优算子是通过信噪比获得的边缘检测滤波器。
2.2 图像处理技术基础完整的数字图像处理大体上可分为图像信息的获取(Image information acquisition)、图像信息的存储(Image information acquisition)、图像信息的传递(Image infoemation transmission)、数字图像处理(Digital imageprocessing)、图像的输出与显示(Image output and showing)。
图像处理的主要技术如下。
图像数字化。
由于计算机只能处理数字图像,而自然界提供的图像都是其他的形式,所以数字图像处理的一个先决条件是将图像转化为数字形式。
我们可以通过图像数字化器将图像划分为若干图像元素(像素)并给出它们的地址,可以度量每一个像素的灰度,并把连续的度量结果量化为整数,再将这些整数结果写入存储设备。
主要过程为:图像移动扫描——采样——光传感器——量化器——输出存储。
流程图如图3所示。
图3 图像处理流程图像信息的传输。
图像信息的传输一般是相机和计算机之间的传输,主要靠USB缆线传输图像信息的数据。
摄像机与计算机之间通过专用的iLink电缆连接,按IEEE1394标准进行数据传输, 其最大比特率为400Mbps。
空间滤波增强。
频域滤波是频域乘一个H(u,v)滤波(传递)函数而成, 这时相当于在空域把图像与滤波函数的空域函数h(x,y)做卷积。
常用的程序往往都是选择3 x 3的h(x,y)作卷积,选择不同的3 x 3的h(x,y)就相应于图像作各种高通、低通、带通、带阻滤波。
为了突出增强图像中的孤立点、孤立线或线端点, 在某些实际应用中常采用拉氏算子, 如机场、公路、铁路勘测图像就常用线性微分拉普拉斯算子。
中值滤波是一种非线性滤波。
它首先确定一个奇数像元的窗口W,窗口内各像元按灰度大小排队后,用其中间位置的灰度值代替原f(x,y),灰度值成为增强图像g(x,y)。