VoI.35.NO.10 Oct.2010 火力与指挥控制
Fire Control 8L Command Control 第35卷第1O期
2010年10月
文章编号:1002—0640(2010)10—0004—04
多智能体信息一致性在机器人编队控制中的应用 王银涛,严卫生,闫 伟 (西北工业大学航海学院,西安 710072)
摘要:对固定拓扑结构下多智能体有向网络一致性问题进行了研究,提出了~类协调控制器并证明了使多智能体网络 在固定拓扑结构下取得全局渐进一致的充要条件,考虑到智能体之间通讯过程中存在的时延问题,给出了最大固定延时时间 的紧凑上界,取得了满意效果,最后将信息一致性思想应用于多机器人的编队控制。结果表明,基于信息一致性的方法可成功 应用于机器人编队控制。 关键词:多智能体,一致性,机器人,编队控制 中图分类号:TP319.9 文献标识码:A
Application of Multi-agents Consensus to Robot Formation Control WANG Yin—tao,YAN Wei—sheng,YAN Wei (College of Marine,Northwestern Po6,technic Uniz,ersity,Xi’an 710072,China)
Abstract:The consensus problem in directed networks of multi—agents under fixed topology is studied. A class of cooperative controller is applied to consensus seeking,moreover,the sufficient and necessary condition for the multi—agents under fixed networks topology to achieve global asymptotically is proved out.Considering the time—delay problems during the communicaton between multi—agents,a tight upper bound on the maximum fixed time—delay is proposed.Based on the consensus concept,formation control for muhiple robots iS studied.Simulation results show the validation of the method. Key words:multi—agents,consensus,robot,formation control
引 言 近年来,机器人学取得的进步使得利用大量廉 价机器人合作完成任务成为可能。在一些任务中,相 比智能化程度较高、较昂贵的单个机器人,利用多个 廉价机器人可能更容易更便宜,并且随着一些任务 复杂程度的提高,采用多个机器人协作往往能完成 一些单个机器人难以完成的任务。在实现这些复杂 任务的多机器人协同控制中,编队控制是其最典型 的问题,对于增强系统的鲁棒性,提高系统效率具有 重要意义。 多机器人编队协作过程中,有着确定的协作目 收稿日期:2009—06—10 修回日期:2009—09—08 *基金项目:国家自然科学基金资助项目(60875071) 作者简介:王银涛(1979一),男,河南漯河人,博士研究 生,讲师,研究方向:多机器人编队控制与仿 真。 标,为了达到这个目标,队伍中的成员必须进行信息 的交互。成员之间进行交互或者共享的变量称为协 同变量(Cooperative Variable)L】]。它描述了为完成 指定的协作任务,成员之间需要交换的最小信息。这 些变量可以是一组机器人的位置、共同追赶的目标、 相对速度等。在编队过程中,单个机器人经常要在这 些变量值上与其余机器人趋于一致,这就是所谓的
一致问题。最早关于~致性问题的研究出现在计算 机科学相关领域 ],近年开始在无人机(UAVs)协 调控制、多机器人编队控制、智能体群体群集 (Flocking/Swarming)运动、分布式传感器网络、人 造卫星群位姿调整、水下自主航行器(AUV)等协同 控制领域广泛应用[3。 并取得了大量研究成果。在 文献[3]中,Jadbabaie等用无向图描述多智能体之 间的信息流,并证明了当无向图满足一定的流通性 时,一致问题可以得到保证。为了提高航行器编队控 制性能和系统稳定裕度,文献E43对信息交互技术进 王银涛,等:多智能体信息一致性在机器人编队控制中的应用 (总第35—1637) ・5・ 行了研究;文献Es3给出了变拓扑结构无向通讯网络 下智能体航向角保持一致的充分条件;与之相比,文 献[13]则采用有向图,并证明了对变拓扑网络,如果 信息流图每经过一定时间间隔的联合图有一生成 树,则系统实现一致。 本文在以上研究的基础上,对于有向信息流多 智能体固定拓扑网络,提出并证明了使多智能体机 器人连续控制系统取得全局渐近一致的充要条件, 接着考虑到智能体通讯过程中存在时延,给出了一 个关于延迟时间的非保守界,最后将控制器成功应 用到机器人编队系统。 l 预备知识 1.1代数图论 通常,用图(Graph)来表示多智能体的通讯拓 扑,也称为信息流(Information Flow)。设G(V,E, A)表示顶点集为 ,边集为E,权重邻接矩阵为 的权重有向图。图的每个节点表示为V ∈V或iE ,一(1,2,…,n},其中 为节点个数;图的每条边表 示为e一( Vj)或e=ij,其中73 为边的尾,73 为边 的头; —a ],fieE甘口。>O( ≠ ),且对于任意的 iEI,a 一0。 定义:已知有向图G的加权邻接矩阵为A一 。 ],则节点 的人度和出度定义如下: degi ̄( )一∑ J=1 —1 deg。 ( )一。2 口 , J=1 如果deg ( )一deg。 ( ),那么有向图G称为 权平衡,简称为平衡的。有向图G出度矩阵定义为: △一[△ ]=diag(deg。 ( 1),deg (口2),…,deg。 ( )) 有向图G的拉普拉斯矩阵定义为: L(G)一 一△一A (1) 1.2一致性问题的数学描述 设有向图网络中每个节点的状态用.27 表示,当 所有智能体的状态两两相等时,即满足z — ,,i,J ∈ ,也即对于任意的初始值517 (0),当t—o<3时, II z 一-z lI一0,称所有的智能体信息达到渐进一 致,并称所有的智能体信息达到一致时的状态为决 策状态。 2 有向网络一致性控制律设计 假设网络中的每个智能体可以表示为一阶系统 (积分),即: ,一Ui,i一1,…, (2) 对于智能体i来说,其控制目标为lim . z —z,l J一0,Ni表示智能体i的所有入邻居集 合。考虑如下线性一致性协议作为控制输入: “ 一25 J∈N,ku(z,一z ),N ≠≯ (3) 其中是 为权重系数。将式(3)写成矩阵形式: “一一Lx (4) 式中L为智能体网络G的拉普拉斯矩阵,整个 系统的特性由矩阵一 的性质来决定。 下面将证明如果控制律式(4)中给出的矩阵L 只有一个零特征值而且其他非零特征值都位于左半 平面,则有向智能体网络能达成渐进一致且可以由 下面的定理计算出最终一致值,为了便于说明,记 C&L。
定理:如果矩沣( 由式(4)给出,则对于V f>o,
。是一对角线元索为正的随机矩阵。而且,如果C 仅有一个零特征值,则 0—1 ,且当z一。。时 ( )
一 ( z o)),其中1一[1,…,1] . ::=[ , …,
] ’≥o, 1Z;i一1。
证明:假设特征值 Ed(C)对应的特征向量 , i一1,2,…, ,d( )代表矩阵 的谱半径。我们知道 ∈a(e。)且和矩阵( 有相同的特征向量 。因为 c有一零特征值且对应特征向量为1.则eCt有一特 征值为1且对应特征向量为1。也即 1—1,表明矩 阵 0的行元素之和总为1。矩阵C可以写成非负矩 阵 和一 之和,其中 为矩阵C的对角线元素 的最大绝对值。可以看出 0一 恤 “非负且对角线 元素为正。因此,对于V t>0,ect是一对角线元素为 正的随机矩阵。 此外,如果c仅有一个零特征值,则 。仅有一 特征值为1且其他特征值的模均小于1。记与矩阵c 相关的Jordan阵为 [ ], ,zEI,则.i 一 。 不失一般性,假定 :0, ( =】,…, 一1)位于左 半平面。 设c:PJP一。,P一 一,P ]为 × 矩阵。P 为特征值 一0对应的特征向量1。由eCt—Pe P~, 可以证明当£一 时, r 0 …0] 一 ::: ;j
经运算处理可知当t—o。时, 0一l , ( 一1,…, )与矩阵P一 的最后一行相对应,由任
意时刻eCt的行之和为1可知 一 一1。考虑矩阵 (壶一。o,1,2.…),显然当 一。。时,eCk-一1 。由引 ・6・ (总第35—1638) 火力与指挥控制 2010年第lO期 理8.2.7[“ 可知, 为矩阵( ) 特征值1对应的特 征向量。同时由定理8.3.1 E“],(P。) 特征值1对应 的特征向量z≥0,且对于 ≠0, 可以表示为 一 a ,因 "Ui一1则必然有a>o, 一[ 一, ≥ 0。 对于任意的初始值z(O),式(4)的解为.72(f)一 eCtz(O)。因此,当 一。。时,z (f)一乙一 (口,.z (O)), i=1,2,…,72。 上述定理得出了系统的任意解渐进收敛到具有 零特征值的特征向量空间的点 (口m(O)),这 意味着图G的所有节点取得了全局加权平均一致。 然而智能体之间的通讯有可能由:3 某些客观原因, 不能够接收到其邻居的实时信息。假设节点i的信 息可能在时间间隔r 之后才能够传输到节点 ,此 时对系统(2)应用协议(3)有: Ui一 ,∈Ⅳ kf,(z (t-Z'ji)一 (t-f )),N ≠≠(5) 下面的引理给出网络节点间通讯延迟的一个非 保守界,使得所有节点仍然取得全局加权渐进平均 一致。 引理 引:假定图G中每个节点的动态模型为系 统(2),且每个节点从其邻居接收信息有一固定的时 间延迟r>0.应用控制输入式(5),则图G中所有节 点取得全局加权平均一致当且仅当下列条件成立: ①r∈(0,r ),r 一7c/2 ,2N— ( ) ②e--rs/s的Nyquist图不环绕一1/ ,V五>1 并且系统有一个频率 一 的全局渐进稳定的振荡 解。 3 一致性在机器人编队控制中的应用 为了验证文中所提出的一致性控制协议,以两 个机器人在水平面运动为例,目标要求每个机器人 跟踪水平直线,即在XOY平面内,各机器人保持相 同的x方向的位置及各自不同的y位置 ,以期望 的速度 。编队前进。机器人的模型表示如下: ==:口cos , 一 sin ,妒一7一 (6) 其中,z,Y, 分别代表机器人的 方向位移, 方向位移和朝向角; ,r分别代表线速度以及角速 度,这里用 和 。来表示两个机器人并用下标1、 2来区分。本例中口,r为控制输入。Y方向的控制可 通过调整 ,使机器人逼近所期望的直线。通常,选 取期望的航向为 引: 一--sign( 加rcsin( arctan ](7) 其中,sign(.)为符号函数,△为调整参数,通常 指LOS(I ine Of Sight)距离。这样,y向闭环动力系 统 一一 arctaFl[ ]保证当 —o。时, 一