文章编号:100220446(2005)0520431205集控式足球机器人决策与控制系统设计与开发3薛方正1,徐心和2,冯挺2(1.重庆大学自动化学院,重庆 400044; 2.东北大学人工智能与机器人研究所,辽宁沈阳 110004)摘 要:构建了由视觉子系统、决策子系统、无线通信子系统、机器人小车子系统和总控子系统组成的集控式足球机器人系统.总结了具有集中视觉、决策与控制的集控式足球机器人系统的控制问题.设计了基于分层递阶控制结构的足球机器人决策子系统.小车控制器构成“无脑”的执行器,运动控制器中集成了各种各样的动作函数,组织层则融合了不同的决策方案.长期的开发实践和实战成绩都表明,该系统具有良好的结构和优异的性能.关键词:机器人足球;决策;分层递阶控制;推理模型;反应式策略中图分类号: TP24 文献标识码: BD esi gn and D evelopm en t of the D ec isi on2mak i n g andCon trol Syste m of Cen tra li zed Soccer RobotXUE Fang2zheng1,XU Xin2he2,FENG Ting2(1.School of Auto m ation,Chongqing U niversity,Chongqing400044,China;2.Institute of A I&Robotics,N ortheastern U niversity,Shenyang110004,China) Abstract:A centralized s occer r obot syste m composed of such subsyste m s as visi on,decisi on2making,wireless communi2 cati on,r obot car and cons ole is constructed.This paper su mmarizes the contr ol p r oble m s of the centralized s occer r obot sys2 te m with central visi on,decisi on2making and contr ol syste m,and designs a s occer r obot decisi on2making subsyste m based on the hierarchical contr ol structure.The r obot car contr oller is a“brainless”execut or,the moti on contr oller includes all kinds of acti on functi ons,and different decisi on sche mes are collected in the organizing level.Longti m e devel opment p rac2 tices and competiti on achieve ments p r ove that the system has good structure and high perf or mance. Keywords:r obot s occer;decisi on2making;multilevel hierarchical contr ol;reas oning model;reactive strategy1 引言(I n troducti on)集控式足球机器人[1]是指具有集中视觉和统一决策的足球机器人系统,如F I RA的M ir oSot和N ir o2 Sot比赛,RoboCup的小型组(F2180)比赛.每个球队有3~11个机器人不等(因比赛项目而异),但是作为机器人的眼睛(视觉),全队只有一个,高挂在球场上方,通常由CCD摄像头采集图像,并由主计算机统一进行图像处理和识别.每当识别出本队(或双方)球员和球的位置与朝向之后,或将检测信息发送给本方球员(F2180),或交给主机上的决策子系统进行决策(M ir oSot,N ir oSot,F2180).由于视觉功能的统一实现,也由于视觉获得信息比较完整(如果视觉系统设计与临场调试得当),给统一决策带来极大的方便.尽管每个球队都有多个机器人小车,但将此类系统称之为多机器人系统或多智能体系统(multi2agent syste m)却比较勉强,因为它们只具有同一个眼睛和大脑.很显然,此类机器人足球系统相对于其它类型,比如自主机器人(F I RA:RoboSot,RoboCup:F2 2000每个机器人都有自己的眼睛和大脑)与人形机器人(F I RA:Hur oSot,RoboCup:Humanoid既要直立行走,又要独立感知),结构简单,容易开发.所以集控式机器人足球开展得最为普及.集控式足球机器人一般由5个子系统组成,即视觉子系统、决策子系统、无线通信子系统、机器人小车子系统和总控子系统,如图1所示.许多文献 第27卷第5期 2005年9月机器人 ROBO T Vol.27,No.5 Sep t.,20053基金项目:国家863计划资助项目(2001AA422270).收稿日期:2004-09-16中没有将总控子系统独立出来(其功能多包括在视觉子系统当中),这不利于系统的模块化开发和多种视觉模块的置换.图1 集控式足球机器人系统构成Fig .1 Structure of centralized s occer r obot syste m 总控子系统处于系统的最高层,它的任务是负责系统初始化、创建数据交换缓冲区、任务调度、时间分配、系统卸载等过程处理.它相当于一个程序容器(container ),内部包容了多个子系统.对于总控子系统来讲,其内部各子系统的地位是平等的.总控子系统的功能与机器人软件系统的整体结构有很大的关系.由于足球机器人的一大难点———机器视觉———可以集中解决(或购入),也由于通信、小车和总控子系统的功能单一且无需智能,研究与开发足球机器人的最大魅力便体现在决策子系统,亦即决策与控制任务的实现.它将体现教练完全个性化的策略安排与球员独特的动作行为.通常足球机器人的决策与控制系统(以下简称决策子系统)的任务便是根据视觉子系统的辨识结果:场上实体(机器人与球)的位姿(位置x 2y 与朝向θ),决定本方各机器人的左右轮速度,以便各机器人走出期望的轨迹,实现理想的配合,在双方激烈的竞争中,将球踢进对方球门,而力争我方不失球.如果将视觉子系统送来的位姿信息用(m +1)×3矩阵I 表示(m 为识别机器人个数),而将决策子系统发出的轮速信息用n ×2矩阵O 表示(n 为我方机器人个数),那可以将决策子系统的开发形式化为设计如下函数关系:O =f (I )(1)不难看出,方程(1)具有如下特征:1)描述的应是一个动态过程,而不应该为一个静态过程;2)没有唯一解,因为决策过程是丰富多彩和不断发展的;3)无法给出解析解,因为除了部分演绎推理之外,更多的函数关系表现为规则知识和产生式推理;4)求解复杂而困难,因为在人类的足球活动中,形象思维占有很大比例,而形象思维如何描述和抽象还是当今没有很好解决的难题.本文便是结合我们多年的研究与实践,对于足球机器人决策与控制系统的设计与开发给出的系统总结.在接续的各节中,将分别阐述智能机器人的分层递阶控制结构,介绍执行层、协调层、组织层的设计内容,以及当前应该关注的热点研究问题.2 智能机器人的分层递阶控制结构(M ulti 2level h i erarch i ca l arch itecture of i n telli 2gen t robots)由于机器人是通过多个关节的协调动作而使其效应器(effect or )实现或期望轨迹,或期望位姿、速度、加速度,或期望的能力特性,因此分层递阶控制结构是比较适合的.一般智能机器人具有三层(级)结构[2],即组织层、协调层、执行层.组织层代表控制系统的主导思想,由人工智能起控制作用.它作为推理机的规则发生器,处理高层信息,用于机器推理、规划、决策、学习(反馈)和记忆操作,以给出最佳的任务序列.协调层是上下级间的接口,承上启下,该层采用的研究方法通常属于运筹学领域.协调层由一定数量的具有固定结构的协调器组成,每个协调器都具有某些指定的功能.执行层是递阶智能控制的最底层,要求具有较高的精度和较低的智能,它按控制论进行控制,对相关过程执行适当的控制作用.对于集控式足球机器人系统也是采取上述的分层递阶结构.组织层分析场上的态势,确定我方的基本对策与队形,进行角色分配.协调层确定各机器人的目标位置和行为,并将其分解为各关节的指令,即每个机器人小车的左右轮速度与位移.执行层则根据协调层给出的指令控制小车的左右轮转速,使其运动结果实现预期目标.如果出现偏差,下一层的状态还可以直接反馈到上一层,以便影响和修正上一层的结果.234 机 器 人2005年9月 3 执行层———机器人小车控制器(Executi onlevel:robot car con troller)机器人小车是足球队的球员,是比赛中引人注目的表演者.然而令人遗憾的是,它们仅仅是些无脑遥控机器人(brainless and re mote contr ol r obots ),因为它们没有对外界的感知器官,也没有自主决策的能力.它们只是忠实地执行主机发来的左右轮速指令.为了达到较高的精确性、快速性和鲁棒性,小车左右轮分别装有轮速检测装置(一般为增量式码盘),并由单片机、DSP 或FPG A 等构成数字反馈系统.图2为典型的由单片机构成的小车速度控制系统.图2 机器人小车控制系统原理图Fig .2 Sketch of r obot car contr ol syste m 显然,这是一个最基本和最简单的执行器.为了提高小车的快速性,还可以增加电流环.为了提高小车的走直线性能,还可以加入左右轮速度平衡调节装置[3].为了克服系统的不确定性和提高系统的控制性能,还可以加入自适应控制、模糊控制等高级算法[4,5].为了提高运算速度与控制频率,更换芯片更是提高小车性能的重要手段.不论怎样,执行层所做的一切,无非是要通过控制理论的成果提高控制精度,而无需考虑任何智能.鉴于目前小车芯片在时间和空间上都有了一定的余地,有些球队将运动控制器的部分功能下放到小车控制器,如在小车芯片上存储了一些用于罚点球的开环控制序列,并都取得良好的效果.4 协调层———运动控制器(Coord i n a ti onlevel:m oti on con troller)既然执行层的任务是确保机器人小车左右轮速的精确实现,那么协调层的任务则是如何通过小车的左右轮速的配合,而让小车完成各种各样的动作.动作是比赛活动的基本单元.任何精彩激烈的比赛都是由球员的一系列动作构成的.准确有效的动作实现,意味球员具有良好的基本技能.因此,动作是决策子系统的最终归宿,是决策的基础和保证.动作同样是分层次的.我们将动作分为4种类型,即基本动作、技术动作、组合动作和战术动作.基本动作(Basic Acti on,BA )亦可称之为元动作,如:原地转向(TurnAngle )、行进到定点(ToPosi 2ti on )、过某点做定向运动(Move A l ong ).它们既是其他动作的基本单元,又将机器人的动作变换成小车的左右轮速的指令.技术动作(Skilled Acti on,S A )是机器人球员在赛场上的基本技能,如:大脚踢球(KickBall )、射门(ShootGoal )、防止撞墙(AvoidBound )、传球到定点(Pass Ballt oPoint )、盯人防守(B l ock Man )等,显然它是由多个基本动作来实现的.比如,射门动作的本质是让机器人以一定的姿态和速度通过球所在的位置(假设球是静止的),于是它就需要由原地转角和到定点等基本动作构成.人类球员的射门动作是多种多样的,机器人的射门动作也是如此,我们可以设计出运行不同的轨迹的动作函数来实现射门功能,如走折线、走圆弧等.避碰规划[6]也是技术动作设计的重要内容.组合动作(Combinat orial Acti on,CA )是指一名球员为了某种需求而完成的一系列技术动作,如罚334 第27卷第5期薛方正等: 集控式足球机器人决策与控制系统设计与开发 点球(PenaltyKick)、争球(Free Ball)、开门球(Goal2 Kick)和罚任意球(FreeKick)等.他们都是上述基本动作和技术动作的简单叠加,类似于基本动作的批处理.对于不同队伍和不同对手,这些动作还可以通过菜单选项临时改变,以适应不同情况.战术动作(Tactical Acti on,T A)也是基于基本动作和技术动作之上的、由多个机器人共同完成的、相互之间配合的动作,包括一传一射(PassT oShoot)、中场开球(Nor malKick Off)等.由于各类动作均可以通过解析算法的函数实现,这就可以将决策的“粒度”增大,直接调用各种动作函数,使决策系统进入“宏思维”的层次.5 组织层———全局决策方案(O rgan i za ti on level:globa l dec isi on2mak i n g)对于机器人足球而言,如果说决策子系统充当的是教练员的职责,那么教练员是个盲人,他无法用眼睛看到比赛场景,反映到大脑进行形象思维,而是根据传来的关于队员的场上位姿和球位置的精确数据对比赛场上的形势进行分析,再指挥全队球员的左右脚行动(左右轮速).这是一个非常复杂的决策过程,也是策略系统设计的重点和难点,引起了不少队伍的关注[7,8].我们认为,决策子系统在制定决策时就应该参照盲人教练的思维过程展开,认真抽象推理链上的每一个环节,从而实现专家知识与决策过程的形式化.按照这种思路,文献[9]提出了六步推理模型:1)输入信息预处理(计算有关实体速度、相对距离等);2)态势分析与策略选择;3)队形确定与角色分配;4)目标位置确定;5)运动轨迹规划;6)左右轮速确定.一般说来,1、4、5、6步为演绎推理,可以由数学模型计算.而2、3步为产生式推理,应该由专家系统来完成.前节已经将4、5、6步的演绎推理集成为各种各样的动作函数,形成了智能控制的协调层.那本节组织层所要解决的就是1、2、3步所要实现的功能.5.1 从信息空间到状态空间从视觉子系统给出的I矩阵得到的信息是场上各实体的位姿,即x、y坐标和朝向角.显然,I矩阵给出的信息是十分有限的.我们需要弄清楚双方态势如何、哪个球员处于最有利于进攻的位置等一系列重要问题.在失去形象思维的情况下就只能设法获得相对角度、距离、速度等附加信息,然后根据归纳出的一系列判断准则,回答决策过程遇到的各种问题.为此,需要通过信息的预处理,从信息空间过渡到状态空间,给一系列的状态变量赋值,构成可以分析和聚类的状态空间,为后面的推理准备尽量充分的条件.如何设计和使用状态空间?这还是一个未能解决和没有受到足够重视的问题.在未能解决复杂算法与判据的情况下,我们先将球场分成了一定数量的区域,以球落在哪一区域和奔向哪一区域作为态势分析和策略选择的出发点.我们定义如下的状态变量:S ta te={S1,S2,S3,S4}(2)其中,S1为球的位置;S2为球的运动方向;S3为球的运动速度;S4为敌我双方的控球状况.显然,这是一个相对简单和可以扩展的状态空间,随着竞争的激烈,应该考虑更为复杂的情况.5.2 映射式决策方案如何解决从状态空间到动作空间的映射关系,现已成为组织层需要解决的关键问题.一种解决方案则是经过任务空间的过渡.本文介绍的方案是根据当前的状态表达式(2)进行攻守态势分析,提出当前需要完成的任务,确定我方机器人的最佳站位与任务角色,以队形方式给出.这种映射关系(规则)放在队形库与角色库当中.图3 映射式决策模型Fig.3 Mapp ing2type decisi on2making model434 机 器 人2005年9月 角色是能完成特定任务的逻辑机器人,它是通过调用具体的机器人动作来完成任务的.队形是场上队员位置和作用的全局反映,它表示的是某种特定的组合.从本质上说,队形是角色的有序排列,可表示为:F={role1,role2,role3,role4,role5}(3)其中,F表示队形,role1~role5为角色.队形中角色的排序和角色的重要性有关,重要的角色排在前面.从任务规划的角度看,队形就是多机器人的“联合动作”,而从单个机器人的角度看,队形就是联系其他机器人的桥梁.角色分配就是为已知队形中的每个角色选择机器人的过程,通过角色分配[10]把队形中的角色和实际的机器人联系起来.角色分配的顺序是先给排在前面的角色选择机器人.对于队形库与角色库的设计,我们采用了表格模型来存储我们的设计内容.其中保存3类内容,即队形、角色定义和角色分配参数.为了把决策的具体内容抽象化、统一化和参数化,也就是说,原先不同的内容,现在要尽量用同一个模式来表示,不同的内容通过不同的参数来得到反映.6 结论(Conclusi on)本文总结了集控式足球机器人决策与控制系统近年来的研究成果,但仍然存在一系列亟待解决的问题.在执行层中车型机器人的控制精度、速度及可靠性问题还有待于提高.在协调层中动作函数在不断丰富,但在球运动过程中的射门函数还是没有很好解决,需要研究有效实用的先进算法,使得精彩的战术动作,如二过一、一传一射等得以实现.相比之下,智能程度最高的组织层中的问题最多.一方面,由于有关机器人足球的策略、队形、战术配合等还没有系统地总结出规律性的结果,另一方面,如何将总结出来的知识加以实现也没有很好的手段.显然这是和人工智能学科的发展密切相关的,这也正是机器人足球倡导者的初衷,借助机器人足球这一试验平台,通过对抗和竞争来推动这一领域的研究工作,推动人工智能科学的发展.参考文献 (References)[1]高大志,张春晖,徐心和.机器人足球———智能机器人的新领域[J].机器人,1998,20(4):309-314.[2]Saridis G N.Self2organizing Contr ol of St ochastic System s[M].NewYork:Marcel Dekker I N C,1997.[3]曹洋,徐心和.一种基于交叉耦合的速度控制器[J].东北大学学报(自然科学版),2003,24(5):420-423.[4]曹洋,周云龙,徐心和.轮式移动机器人预见预测运动控制[J].计算机工程与应用,2003,31(3):5-7.[5]Xu C H,L i H M,Xu X H.A composite contr oller based on fuzzyrules and neural net w orks f or s occer r obot syste m[A].Pr oceedings of the First I EEE I nternati onal Conference on Machine Learning and Cybernetics[C].Beijing:I EEE,2002.511-514.[6]吴丽娟,徐心和.基于遗传算法的足球机器人比赛中障碍回避策略的设计[J].机器人,2001,23(2):142-145.[7]Mess om C.Deter m ining offensive and defensive p r ocessi on in multi2agent tea m based competitive ga mes[A].Pr oceedings of the2nd M i2 cr o RobotWorld Cup Soccer T ourna ment[C].Taj on:1997.71-75.[8]Shi m H S.Devel opment of visi on2based s occer r obots f or multi2agentcooperative system s[A].Pr oceedings of the2nd M icr o Robot World Cup Soccer T ourna ment[C].Taej on:1997.29-36.[9]Xu X H.Six2step reas oning model for r obot2s occer[J].Journal ofHarbin I nstitute of Technol ogy,2001,8(8):244-248.[10]吴丽娟,翟玉人,徐心和.足球机器人系统中角色分配策略的设计[J].基础自动化,2000,7(1):4-6.作者简介: 薛方正(19772),男,博士生.研究领域:智能机器人. 徐心和(19402),男,教授,博士生导师.研究领域:智能机器人. 冯 挺(19802),男,硕士生.研究领域:智能机器人.534 第27卷第5期薛方正等: 集控式足球机器人决策与控制系统设计与开发 。