当前位置:文档之家› 基于势点的未知动态环境下多移动机器人协作围捕

基于势点的未知动态环境下多移动机器人协作围捕

V01.6 NO.7 Ju1.2Ol 1 中国科技论文在线SClENCEPAPER ONLINE 第6卷第7期 2011年7月 

基于势点的未知动态环境下多移动机器人协作围捕 

王 斐 ,-,魏 巍 ,闻时光 ,吴成东 

(1.东北大学流程工业综合自动化国家重点实验室,沈阳110819; 

2.哈尔滨工业大学机器人技术与系统国家重点实验室,哈尔滨150001) 

摘要:提出一种在未知动态环境下实现多移动机器人自适应协作围捕运动目标的整体方案。为成功实现围捕,设计 了基于势点的夹击策略,势点由效率最优原则获得。同时为躲避围捕过程中遇到的动态随机障碍,提出了基于碰撞风 险的随机避障策略。围捕机器人的综合行为通过融合避障行为、合围行为和抓捕行为获得。在MicrosoftRobotic Studio (MRS)仿真环境下进行了模拟实验,获得的不同条件下的围捕结果证明了围捕策略的有效性和鲁棒性。 关键词:多移动机器人;协作围捕;随机避障;势点;模糊规则;包容结构 中图分类号:TP183 文献标志码:A 文章编号:1673—718o(2ol1)07 0524—7 

Cooperative hunting under unknown environment for multiple mobile 

robots based on potential point 

Wang Fei '_,Wei Wei ,Wen Shiguang ,Wu Chengdong 

(1.StateKeyLaboratoryofSyntheticalAutomationforProcessIndustries,Northeastern University,Shenyang 110819,China; 

2.StateKeyLaboratoryofRobotics andSystem,HarbinInstituteofTechnology,Harbin 150001,China) 

Abstract:A general scheme of cooperative hunting for a moving target by multiple mobile robots in unknown dynamic 

environments is presented.To realize successful hunting,potential po based strategy is proposed and potential points were obtained by optimal efficiency principle.Simultaneously,collision risk based obstacle avoidance scheme is used to avoid 

randomobstaclesduringhunting.The synthesizedbehaviorisobtainedbyfusingavoidancebehavior,formationbehaviorand approach behavior.Simulated hunting experiments were conducted under different conditions in Microsoft Robotics Studio 

and simulation resultsdemoustmtetheeffectivenessand robustnessoftheproposed scheme. 

Key words:multiple mobile robots;cooperative hunting;random obstacle avoidance;potential point;fuzzy rules; 

subsumption architecture 

随着科技的飞速发展,作为多前沿学科交叉的机 

器人学在理论和应用上取得了巨大进展。近年来,机 

器人在工业、航天、军事和民用服务业等各领域的应 

用越来越普及,集成化、自动化和智能化程度也在不 断提高u J。作为一个新兴的研究热点,近年来多机器人 

系统因具有空间上的分布性、功能上的多样性、执行任 务时的并行洼、较强的容错能力和更低的经济成本等单 

机器人无法比拟的优越性而广受关注。 

多机器人协作是多机器人系统控制中的基本问题, 在研究中主要集中在以下几个方面:群体结构、学习、 

资源冲突解决、协作的起源和几何问题等。为了使研究 

成果具有普遍意义,人们主要集中对一些基本的标准问 

收稿日期:2011-04一O1 基金项目:国家自然科学基金资助项 ̄(60705031);中央高校基本科研业务费专项基金资助项目(N090404007);机器人技术与系 统国家重点实验室开放课题基金(重点)资助项目(SKLRS一2010一ZD-03) 作者简介:王斐(1974一),男,副教授,主要研究方向:智能控制和多机器人系统的研究与开发,wangfei@ise.neu.edu.

cn 第6卷第7期 2011年7月 基于势点的未知动态环境下多移动机器人协作围捕 525 

题进行研究,如搬运、编队、搜索、分类 围捕和跟踪 等。其中,协作围捕可以说是非常典型的一类问题。文 

献[2]探讨了以势场栅格法为基础的协作围捕策略,在引 

入“虚拟范围”后减少了围捕机器人的路径规划次数, 

然而,“虚拟范围”与机器人速度的对应关系问题并没 有得到很好地解决。文献p-4] ̄fj提出了不同的编队方 

法,使移动机器人在围捕前首先形成一定队形(如圆 

形),然后对目标进行合围。其优点是编队行进扩大了 搜索目标的范围,而缺点也很明显,编队易受到环境因 

素的影响,队形不容易保持。文献[5】提出一种强化学习 

算法,利用Q学习算法得出各种行为的输出,并进行加 

权求和获得综合行为以实现多移动机器人围捕。这种方 法适用于连续环境中有障碍物和围捕移动目标的隋况, 

缺点是当围捕机器人接近目标时,对状态聚类的分类较 

粗,包围效果较差。 笔者提出一种在未知环境下实现多移动机器人协 

作围捕动态目标的整体方案。为成功围捕动态目标,将 

基于势点的控制算法用于各围捕机器人的路径规划中。 通过效率最优原则不断对势点进行计算,围捕机器人可 

以最大速度向势点运动。同时,为了躲避未知环境中出 

现的随机障碍,采用模糊逻辑构建了围捕机器人的避障 控制器,并建立了碰撞风险与躲避角度之间的映射关 

系。围捕机器人的综合行为通过包容式控制体系结构通 

过融合避障行为、合围行为和夹击行为获得。在实现合 围后,围捕机器人采用圆弧运动的末端处理算法对抓捕 

目标进行钳形夹击。在MRS仿真环境下进行了模拟实 

验,获得的不同条件下的围捕结果证明了围捕策略的正 确性和有效性。 

1系统组成 

1.1仿真环境 

笔者以Microsoft Robotics Studio仿真平面上的 两轮差速移动机器人的围捕控制为研究对象,图1 

所示为移动机器人围捕的仿真截图。 

图1 Microsoft Robotics Studio仿真环境 

Fig.1 Simulation environment in Microsfot Robotics Studio MRS是一个人工智能应用开发工具包,主要用于 机器人技术的开发,适合学术、理论和商业研究等领域。 

其仿真工具来自AGEIA公司的AGEIA PhysX技术。 

该公司是用硬件加速技术进行物理仿真的先驱。这项技 

术可以保证在机器人设计中真实模拟现实世界的物理 

条件。一个简单的MRS应用程序基本由3部分服务组 

成,以控制一台机器人。这些服务是:1)驱动服务(驱 

动器),它可以让机器人具有不同的速度和运动方向; 

2)缓冲服务(传感器),由信号来感应环境中的对象; 

3)探测服务(适配器),根据传感器的输入来改变机器 

人的速度和方向。与同类仿真软件相比,MRS仿真平 

台具有如下优势: 

1)可逼真模拟真实世界运行的机器人的物理特性; 

2)可轻松处理多个机器人传感器的异步输入和电 

机输出; 

3)可重复利用的模块化服务; 

4)同时支持远程连 ̄PC),I3机器人自身的控制; 

5)可使用多种编程语言进行应用程序开发。 1.2协作围捕模型 

在进行多移动机器人协作围捕算法研究之前,首先 

做如下条件假设: 

1)整个系统是在平面上运动; 2)移动机器人车轮纯滚动无滑动; 

3)移动机器人车体是刚体; 

4)所有移动机器人的位姿和速度信息都是透明 

的,围捕机器人和被动态目标可以感知到自身及对方的 瞬时运动学信息。 

图2所示为多移动机器人围捕动态目标的示意图。 本文设定的情况为3抓1,即围捕机器人通过协作对1 

个抓捕目标实施动态抓捕。 

图2多移动机器人围捕动态目标 

Fig.2 Cooperativehtmtingfordynamictargetbymultiple 

mobile robot

s 526 中国科技论文在线 SClENCEPAPER ONLINE 第6卷第7期 2011年7月 

围捕机器人可根据自身安装的激光测距仪感知环 

境中随机障碍的距离和方位,并根据避障规则进行躲 

避。同时根据仿真环境反馈抓捕目标的位置信息,规划 自己的运动轨迹对目标进行合围。此外,在合围过程中, 

围捕机器人每隔一定时间都要根据效率最优原则获得 相应的势点位置,以最大速度直接向势点运动。效率最 

优原则能够使围捕机器人向着距离自己最近的势点运 

动(当多个围捕机器人距离其中一个势点最近时,距离 

该势点最远的围捕机器人优先选择向该势点运动),并 

且保证各围捕机器人到达势点的总时间最短。当到达势 

点位置后,围捕机器人则各自采用圆弧运动来完成对抓 捕目标的三角形夹击。抓捕目标可以实时地感知到围捕 

机器人的运动信息。当围捕机器人在逃避区域外(本文 

设定为2.5 m)运动时,抓捕目标保持静止,一旦感知 

到围捕机器人侵入逃避区域时,它则根据势场法计算出 

逃逸速度矢量来进行躲避。仿真中将围捕机器人与抓捕 

目标的最高速度设定为相同,这样就可以保证一个围捕 机器人无法单独完成对动态目标的抓捕。 

2协作围捕 

2.1动态目标的运动形式 

为使协作围捕算法具有更好的适应性和鲁棒性,放 

弃了普遍采用的简单匀速直线运动模式,而是采用势场 

法来决定抓捕目标的运动模式,其逃逸速度的大小由式 (1)计算得出,逃逸方向则是围捕机器人与动态目标质心 

连线的反向延长线方向。 

f 1.5, 0≤ <1. … I ={一 +2.5l,1≤L,k≤2.5; L J l 0,L,k>2.5o 

式中, 为动态目标与第k个围捕机器人之间的相对距 离,当围捕机器人侵入其逃避区域内时,抓捕目标即按 

照上式计算得出的速度矢量控制执行机构进行逃逸。当 

有多个围捕机器人同时进入逃避区域时,抓捕目标的最 终速度矢量由来相对于多个围捕机器人逃逸速度矢量 

合成。 

2l2合围行为的获取 保持相应的围捕队形是围捕任务的关键。已知的被 

围捕目标机器人的当前坐标为 , ,速度为 ,运动 

方向为 ;围捕机器人的位姿信息为O , , ),m=1, 2,…,n,n为围捕机器人数。设围捕机器人要到达的势 

点位置为 ,卢1,2,…, Ⅳ为围捕机器人数 ≠ 。 

方向与被围捕机器人的运动方向保持一致。被围捕机器 人的势场半径为R,相邻“势点”之间的弧长为L,则 

势点坐标为: = os(屈 _1) (2) 

=J,o+R sin(flo州_1) 

为保证围捕有效,需要确保一定的队形紧密度。设 

围捕机器人的最大半径为r,被围捕机器人的最大半径 为ro,机器人之间的避碰安全距离为D(D> D>ro)。为 

使各围捕机器人能够形成基于势点的围捕队形,势点半 

径和相邻势点之间的弧长需要满足的条件为 

R≥ D, (3) 

≥2什K2D。 (4) 

式中, 、如为调整系数,k1≥1, ≥1,kl、 越大时, 

围捕机器人的势点距被围捕机器人越远,形成的包围圈 就越大;相反,k 、k2越小时,围捕机器人的势点距被 

围捕机器人越近,形成的包围圈就越小;弧长 也是受 

到限制的,即参与围捕的机器人不能太多。根据圆的周 长公式2r ̄R=NL,可以得到三者之间的关系。取式(3) 

和式(4)的等号部分,并设势场半径最小时,kl=l, =2, 

由周长公式可以求得 

N:—rt(r+ro+D)。 (5) r+J[) 

由于围捕机器人的数目必须为整数,当势场半径和 

弧长均为最小时,若要实现有效围捕,至少需要 

[兀( D) 一D]个围捕机器人。围捕机器人的数目增加 时,尺也会相应增加,以保证有效围捕。若设围捕机器 人的数目Ⅳ已经确定,则由周长公式和式(3)、(4)可知 

kl、k2之间的关系为: 

k.: 尼,+—2(Ttr+nro-Nr)。 (6) ‘ N ND 

2.3避碰行为的获取 

避障问题是机器人运动规划中最为复杂的基本问 

题。常用的方法包括边缘检测法(EDM)、矢量图法 (VFHM)和虚拟势场法(VFFM)等。EDM的缺点是需要 

停在障碍物前获得足够的传感器信息,对硬件要求较 

高,实时性差。VFHM和VFFM的缺点则是不能利用 

局部的传感器信息逃离陷阱状态,容易陷入死锁。传统 

的避障策略也无法应付环境中存在动态随机障碍的导 

航任务。 针对上述问题,笔者提出一种基于模糊逻辑的碰撞 

风险评估(cpm)方法。在未知动态环境下,机器人首先 

通过激光测距仪感知周围障碍物的信息。环境信息经模 

糊化后,被输入到规则库里进行模糊推论,最后通过反 

模糊计算得到量化的碰撞风险。将碰撞风险与机器人的

相关主题