当前位置:文档之家› 多机器人合作与协调研究进展

多机器人合作与协调研究进展

ComputerEngineeringandApplications计算机工程与应用2008,44(24)1引言在近50年中,伴随着计算机技术和人工智能的飞速发展,机器人技术也日新月异。

近几年机器人已成为高技术领域内具有代表性的战略目标,机器人的应用领域不断扩展。

从自动化生产线到海洋资源的探索,乃至太空作业等领域,机器人可谓是无处不在。

然而就目前的机器人技术水平而言,单机器人在信息的获取、处理及控制能力等方面都是有限的,对于复杂的工作任务及多变的工作环境,单机器人的能力更显不足。

于是人们考虑由多个机器人组成的多系统通过协调、协作来完成单机器人无法或难以完成的工作。

多机器人系统比单机器人系统具有更强的优越性,主要表现在以下几方面:设计和制造多个简单机器人比单个复杂机器人更容易、成本更低;使用多机器人系统可以大大节约时间,提高效率;多机器人系统平行性和冗余性可以提高系统的柔性和鲁棒性等;通过多机器人系统内在特性提高完成任务的效率;通过共享资源(信息、知识等)弥补单机器人能力的不足,扩大完成任务的能力范围;利用系统内机器人资源的冗余性提高完成任务的可能性,增加系统的性能。

因此,进行多机器人系统的研究是机器人技术发展的必然趋势,必将对机器人技术的发展带来划时代的变革。

2多机器人系统的研究对于多机器人研究,目前国际上和国内已经取得了一定的成果,多机器人系统的研究是多种技术的综合。

与之关系最密切相关的领域包括:控制理论,分布式人工智能,计算机技术,社会科学等。

多机器人的研究开始于20世纪80年代末期,经过20年的发展,目前已经出现了一些典型的多机器人系统。

它们包括:(1)ACTRESS(Actor-BasedRobotandEquipmentSyn-theticSystem)[2]这是一个由三个机器人和三个工作站组成的异构系统,其中三个工作站分别作为人机界面、图形处理器以及环境管理设备,它们共同协作完成环境中物体的移动工作。

在该系统中可以采用不同的通讯机构进行通讯。

(2)CEBOT(CellularRoboticSystem)[2]CEBOT系统是由日本Nagoya大学的T.Fukuda教授领导的研究小组开发的一个典型的自重构机器人系统(Self-Recon-figurableRoboticSystem)。

自重构机器人系统以一些简单的功能、同样的形状(或种类)的标准模块为组件,根据目标任务的需要,对这些模块进行相应的组合,进而形成具有不同复杂功多机器人合作与协调研究进展张捍东,吴玉秀,岑豫皖ZHANGHan-dong,WUYu-xiu,CENYu-wan安徽工业大学电气信息学院,安徽马鞍山243002SchoolofElectricalEngineering&Information,AnhuiUniversityofTechnology,Maanshan,Anhui243002,ChinaE-mail:yuxiu_wu@163.comZHANGHan-dong,WUYu-xiu,CENYu-wan.Researchprogressofmulti-robotcooperationandcoordination.ComputerEngineeringandApplications,2008,44(24):238-241.Abstract:Thispaperintroducesdomesticandforeigndevelopmentsituationofthemulti-robotcooperationandcoordination,ana-lyzeswithemphasistheresearchvectorofthemulti-robotscooperativework—themulti-robotdynamicpursuitissueundertheunknownandcomplicatedenvironment,andmakessimpleexplanationandcomparisonfortypicalapplicationalgorithms.Anditstatesmulti-robotcooperationandcoordinationsystematicstudy,suchasobjectivedefinition,environmentexploration,learninganddecisionmaking,andcontradictremoving,andsoon.Onthisbasis,theforecasttothemulti-robotsystemsresearchismade.Keywords:multi-robotsystem;dynamicpursuit;reinforcementlearning;decisionmakingsystem摘要:介绍了多机器人合作与协调的国内外发展现状,重点讨论了多机器人合作与协调的研究载体———未知环境下的多机器人动态追捕问题,并针对不同的典型应用算法,作了简单的说明和比较。

系统地阐明了多机器人合作与协调研究的有关方面,例如对象定义、环境探索、学习与决策、冲突消解等。

在此基础上,对多机器人合作与协调的研究方向进行了展望。

关键词:多机器人系统;动态追捕;强化学习;决策系统DOI:10.3778/j.issn.1002-8331.2008.24.072文章编号:1002-8331(2008)24-0238-04文献标识码:A中图分类号:TP24基金项目:国家自然科学基金(theNationalNaturalScienceFoundationofChinaunderGrantNo.50407017);安徽省教育厅自然科学基金重点项目(theNaturalScienceFoundationofDepartmentofEducationofAnhuiProvinceofChinaunderGrantNo.2006KJ019A,No.2007KJ052A)。

作者简介:张捍东(1963-),男,博士,教授,主要研究领域为控制理论与控制工程,系统理论,机器人系统;吴玉秀(1982-),男,在读硕士研究生,主要研究领域为多智能体信息处理与系统;岑豫皖(1951-),男,教授,主要研究领域为机电液系统与产品设计,机器人。

收稿日期:2007-11-13修回日期:2008-03-072382008,44(24)能的系统。

(3)群智能机器人系统群智能机器人系统是由许多无差别的自治机器人组成的分布式系统,它主要研究如何使能力有限的个体机器人通过交互产生群体智能[3]。

在自然界的蚂蚁、蜜蜂等昆虫的群体中,个体能力有限,但它们的交互中却呈现出智能的行为。

这种行为对于生态系统中个体的生存是必要的。

通过人工模拟昆虫社会,有助于群智能机器人系统的研究。

加拿大Alberta大学开发的CollectiveRobotics实验系统是一个典型例子。

该系统将许多简单机器人组织成一个团体来完成一些有意义的工作。

另一个代表性的系统是美国USC大学开发的TheNerdHerd系统。

(4)协作机器人系统协作机器人系统由多个具有一定智能的自治机器人组成,机器人之间通过通信实现相互间的协作以完成复杂的任务[3]。

美国OakRidge国家实验室的LynneE.Parker及其研究小组在协作机器人学方面取得了许多成果,并建立了实验平台(CESAREmperor和CESARNomads机器人系统)进行理论的验证。

中科院沈阳自动化所则以制造环境应用多机器人装配为背景,建立了一个多机器人协作装配系统(Multi-RobotCoop-erationAssemblySystem,MRCAS)。

该系统采用集中与分散相结合的分层体系结构,分为合作组织级和协调作业级。

同时MRCAS系统为深入研究多机器人协作理论与方法提供一个良好的实验平台,对多机器人协作系统的实际应用具有参考价值。

另外,现在兴起的足球机器人大赛也说明多机器人的研究有很大的现实意义,同时,我国在该项上取得的成绩也证明了我国多机器人技术发展迅速。

我国群体机器人的研究相对于国外起步较晚,目前已逐渐引起人们的重视,上海交通大学、中国科学院、哈尔滨工业大学机器人研究所、东北大学等已先后开发出各种形式的多机器人系统。

综上所述,多机器人的发展已经形成了一定规模,田纳西大学的LynneE.Parker2003年的论文currentresearchinmul-ti-robotssystems[3]指出了目前多机器人研究方向的几个方面:来自生物学的启示;机器人之间的通信;定位、建立地图和探索环境;多机器人结构、任务规划和控制;用多机器人协作实现对物体的移动和操纵;动作协调;多机器人重构;多机器人学习机制等。

3未知环境下的多机器人动态追捕多机器人动态追捕问题是多机器人合作与协调的典型问题,这是因为该问题牵涉到多机器人合作与协调的多个方面[4-26]:(1)多机器人对环境的探索;(2)机器人之间的信息共享;(3)机器人的学习;(4)根据所知环境信息决策各个机器人的动作策略;(5)机器人动作冲突消解;(6)机器人社会化。

未知环境下的多机器人动态追捕,是一个比较新的课题,涉及到多机器人的很多层面,各个层面之间联系起来构成了一个完整的系统。

整个系统各个部分之间联系结构关系如图1所示。

3.1对象定义要对整个系统进行研究,首先要对系统涉及的对象进行定义,有了明确的定义,才能把问题抽象到数学的领域进行研究。

对象的定义现在大都采用的是集合的方法,一种定义是基于栅格法的,一种定义是基于二维的实际环境的。

(1)典型的栅格法的定义[3]np个追捕者:P={P1,…,Pnp};ne个逃避者:E={E1,…,Ene};追捕者和逃避者统称为智能体H:H=P∪E,时间:t∈{1,2,…};xnpp(t)≠xnee(t);t时刻追捕者的位置:Xp(t)=(x1p(t),…,xnpp(t))(1)t时刻逃避者的位置:Xe(t)=(x1e(t),…,xnee(t))(2)障碍物:由映射m∶!→{0,1}指定;%x∈!,m(x)=1表示该栅格为障碍物。

(2)典型的二维空间的对象定义[24-25]发射者(追捕者)和目标(逃避者)的动作方程可以表示为:x!i=vicos!i(3)y!i=visin!i(4)!!i=viRiui=1vivi2Riui&’="ivi,|ui|≤1(5)v!i=-vi2Ri(bi+ciui2)(i=M,T)(6)其中:x、y:发射者和目标的位置坐标;v:速度;u:规范的控制输入;!:运动轨迹与x轴的夹角;a:旋转加速度;R:最小的旋转半径;b、c:牵引系数;M:追捕者的个数;T:目标的个数。

相关主题