多智能体系统一致性综述一 引言多智能体系统在20世纪80年代后期成为分布式人工智能研究中的主要研究对象。
研究多智能体系统的主要目的就是期望功能相对简单的智能体系统之间进行分布式合作协调控制,最终完成复杂任务。
多智能体系统由于其强健、可靠、高效、可扩展等特性,在科学计算、计算机网络、机器人、制造业、电力系统、交通控制、社会仿真、虚拟现实、计算机游戏、军事等方面广泛应用。
多智能体的分布式协调合作能力是多智能体系统的基础,是发挥多智能体系统优势的关键,也是整个系统智能性的体现。
在多智能体分布式协调合作控制问题中,一致性问题作为智能体之间合作协调控制的基础,具有重要的现实意义和理论价值。
所谓一致性是指随着时间的演化,一个多智能体系统中所有智能体的某一个状态趋于一致。
一致性协议是智能体之间相互作用、传递信息的规则,它描述了每个智能体和其相邻的智能体的信息交互过程。
当一组智能体要合作共同去完成一项任务,合作控制策略的有效性表现在多智能体必须能够应对各种不可预知的形式和突然变化的环境,必须对任务达成一致意见,这就要求智能体系统随着环境的变化能够达到一致。
因此,智能体之间协调合作控制的一个首要条件是多智能体达到一致。
近年来,一致性问题的研究发展迅速,包括生物科学、物理科学、系统与控制科学、计算机科学等各个领域都对一致性问题从不同层面进行了深入分析,研究进展主要集中在群体集、蜂涌、聚集、传感器网络估计等问题。
目前,许多学科的研究人员都开展了多智能体系统的一致性问题的研究,比如多智能体分布式一致性协议、多智能体协作、蜂涌问题、聚集问题等等。
下面,主要对现有文献中多智能体一致性协议进行了总结,并对相关应用进行简单的介绍。
1.1 图论基础多智能体系统是指由多个具有独立自主能力的智能体通过一定的信息传递方式相互作用形成的系统;如果把系统中的每一个智能体看成是一个节点,任意两个节点传递的智能体之间用有向边来连接的话,智能体的拓扑结构就可以用相应的有向图来表示。
用)(A E,V,G =来表示一个有向加权图,其中}{n 21v ,,v ,v V =代表图的n 个顶点;V V E ⨯⊆是边集合,如果存在从第i 个顶点到第j 个顶点的信息流,则有E v ,v e j i ij ∈=)(;A 是非负加权邻接矩阵0>⇔∈ij ij a E e ;节点i v 的邻居集定义为})({E v ,v |v N j i j i ∈=。
如果对所有的E e ij ∈意识着E e ji ∈,则称G 是无向图。
2个不同的节点i v 和j v 之间有有向路径是指存在1个有序节点序列)()()(j k k k k 1v ,v v ,v v ,v l 211,,, ;如果图G 中任意两个不同的结点间都存在1条有向路径,则称G 是强连通图;如果G 是无向的,则称G 是连通图。
图G 有有向生成树指的是图G 存在1个包含所有定点的子图,除了唯一的根节点以外,其余节点有且仅有1个父节点。
二.主要研究内容2.1多智能体系统一致性问题描述令q i R x ∈表示图中第i 个顶点i v 的状态且满足)u ,f(x x i i = ,这样可利用二元组)(x G,来表示动态多智能体网络系统,其中T T n T 2T 1x ,,x ,x x )( =,系统状态方程为u)F(x,x = 。
如果对于所有的j i,,都有0)()(=-∞→t x t x lim j i t ,则称多智能体系统实现一致性。
2.2一致性协议2.2.1一阶一致性在早期关于一致性问题的研究中,绝大多数研究工作针对智能体为一阶智能体的情形,分析不同网络拓扑结构下实现一致性需要满足的条件和一致性实现时的收敛值。
(1)连续时间情形 当网络中的智能体均具有形如:i i u x = )(R x i ∈ (1) 的状态方程时,经常采用一致性协议为:∑-=∈Ni i j ij i x x a u )( (2)因此,在上述一致性协议下的闭环系统为Lx x -= ,系统(1)的解为)()(0x e t x Lt =,可以利用线性系统理论来分析系统的一致性问题。
在固定拓扑结构下,一致性的相关结论为:定理1 假定G 有一个有向生成树,L 为其拉普拉斯矩阵且有01=L ,0L T =γ,11T =γ,则在协议(2)作用下,多智能体系统可实现一致性,且(0))(x γt x lim T i t =∞→。
特别地,当G 为无向连通图或强连通平衡图时,多智能体系统可实现平均一致性,即∑==∞→n1i i i t x t x lim (0))(。
许多场合下,由于节点间连接的建立或失败,多智能体系统的拓扑结构往往是动态发生变化的。
拥有动态网络的系统一般称之为切换网络,切换网络可以用)(t G 0来表示,其中m},{1,2,J R :)( =→t σ为切换信号,}{m 21G ,,G ,G 为所有可能的拓扑结构组成的集合。
在协议(2)的作用下,且有切换拓扑结构的闭环系统为:x G L x k )(-= (3) 如果上述系统仅在离散时刻)(02121t ,,,n n ≤<<<ττττττ 处切换,则系统(3)的解为:(0)e e e e )t (x 10(1)120(2)1-1)0()0()L()-)(L()-)(L()))(L(x G τG τG τt G h h h h h τττ------=系统一致性分析转化为多个具有非负对角的随机矩阵乘积的极限问题的分析。
在切换拓扑结构下,一致性的相关结论为:定理2 假定切换网络在任意长度有上界的时间间隔内均有一个有向生成树,则在协议(2)作用下,切换多智能体系统可渐进实现一致性。
(2)离散时间情形 当网络中的智能体均具有形如:)((k))(k u x 1k x i i i +=+ (4) 的状态方程时,采用一致性协议:∑∈=iN j i j ij i k x k x a u ))(-)((ε (5)因此,在上述一致性协议下形成的闭环系统为:)()(k Px 1k x =+ (6) 式中,∆<<-=1ε0εL,I P ,∆是网络节点的最大出度。
在固定拓扑和切换拓扑结构下,多智能体系统有类似定理1和定理2相应的结论。
(3)其他研究热点 除了上述关于一致性的经典结论外,还有学者分别考虑带时滞的一致性、有一个动态领导者、多个静态或者动态领导者的一致性问题。
2.2.2二阶一致性多智能体系统二阶一致性的研究中假设智能体具有下列形式的状态方程:⎩⎨⎧==i i i i u xv x n i ,1,2, = (7) 采用一致性协议:∑∈-+=iN j i j ij i i )x (x a kv u (8)则闭环系统的矩阵形式为:[]ξξξΦ=⊗+⊗=BF L BK A I n -)( 其中,⎥⎦⎤⎢⎣⎡=0010A ,⎥⎦⎤⎢⎣⎡=10B ,[]k K 0,=,[]1,0=F ,[]T n 21n 21v ,v ,v ,x ,,x ,x =ξ 以Jordan 标准型理论为基础分析闭环线性系统的一致性,相应结论为:定理3 当系统具有固定无向连通拓扑结构时,协议(8)可实现平均一致性,即当∞→t 时,0)(v )(n 1)t (x i 1i →→∑=t ,0x ni i 。
当网络结构在无向连通图之间切换时,协议(8)可解决平均一致性。
在上述结论的基础上,有学者进一步拓展了上述一致性算法,考虑了有界控制输入,无相对速度测量时的各种二阶一致性问题。
2.2.3 高阶一致性近来,许多研究人员对多智能体系统一致性问题的研究转移到了智能体为n 阶智能体的情况,并以线性矩阵不等式给出系统一致性需要满足的条件,在一定假设分析给出线性矩阵不等式的可解性,并通过实例验证了算法的有效性。
考虑智能体具有状态方程:i i i Bu Ax x += (9) 或:i i i Bu Ax x += i i Cx y = (10)对方程(9)用状态反馈:∑∈+=iN j j b i i b i i x K x K u对方程(10)静态输出反馈:∑∈+=iN j j b i i b i i y K y K u或动态输出反馈:y B x A xD D += Lcy D x C u D D ++= 其中,n c I L L ⊗=2.3 一致性的应用2.3.1 一致性在协作控制中的应用一致性是多智能体实现协同合作、完成共同制定任务的基础。
目前,有许多学者开展了关于一致性应用问题的研究,如聚集问题、蜂涌问题、编队控制问题等。
聚集问题要求对每一个智能体同时达到指定的位置,文献[9]采用一致性搜索思想讨论了同步情形和异步情形下的聚集问题;文献[10]分别就固定拓扑结构和切换拓扑结构下,分别讨论了一类速度恒定,通过局部反馈校正方向的智能体系统的峰拥问题。
2.3.2 同步问题同步问题主要是在假定信息交换拓扑结构在完全图的情况下,通过智能体之间的信息交换,修正智能体的动力学,最终实现同步性。
笔者所研究的随机连接的多智能体系统,和以往确定性的框架不同的是多智能体系统中的多智能体是具有马尔科夫性质,行为是随机的。
每个多智能体的状态随时间变化建模成一个有限维的连续马尔科夫链。
在这种情形下,一致性是当所有多智能体的概率向量达到一个共同的稳定的概率向量,因此在完全随机的背景下,讨论概率一致性才是有意义的。
三.结束语对现有文献中的一致性协议进行了比较详细的总结和分析,由于多智能体一致性相关研究问题的多样性,本文仅对具有代表性的一部分智能体相关的一致性协议进行了综述。
此外,关于多智能体系统一致性问题,还有许多的研究方向和研究热点如随机一致性,非线性一致性协议等。
关于多智能体一致性问题,还有许多的问题亟待研究和解决。
四.参考文献[1]Cvetkovic D, Rowlinson P, Simic S, et al. Algebraic Graph Theory[M]// Algebraic graph theory. Cambridge University Press, 1974:xvi+298[2]Ren W, Beard R W, Atkins E M. A survey of consensus problems in multi-agent coordination[C]// American Control Conference, 2005. Proceedings of the. IEEE, 2005:1859-1864 vol. 3[3]Olfati-Saber R, Fax J A, Murray R M. Consensus and Cooperation in Networked Multi-Agent Systems[J]. Proceedings of the IEEE, 2007, 95(1):215-233[4]Xiao F, Wang L. Consensus protocols for discrete-time multi-agent systems with time-varying delays[J]. Automatica, 2008, 44(10): 2577-2582[5]Ren W, Atkins E. Second-order consensus protocols in multiple vehicle systems with local interactions[C]//AIAA Guidance, Navigation, and Control Conference and Exhibit. 2005: 6238[6]Ren W. Consensus based formation control strategies for multi-vehicle syst- ems[C]//American Control Conference, 2006. IEEE, 2006: 6 pp[7]Zhai G, Okuno S, Imae J, et al. Consensus algorithms for multi-agent systems: A matrix inequality based approach[C]//Networking, Sensing and Control, 2009. ICNSC'09. International Conference on. IEEE, 2009: 891-896[8]Zhai G, Okuno S, Imae J, et al. A new consensus algorithm for multi-agent systems via dynamic output feedback control[C]//Control Applications,(CCA) & Intelligent Control,(ISIC), 2009 IEEE. IEEE, 2009: 890-895[9]Lin J, Morse A S, Anderson B D O. The multi-agent rendezvous problem. Part 2: The asynchronous case[J]. SIAM Journal on Control and Optimization, 2007, 46(6): 2120-2147[10]Ren W, Beard R W. Distributed consensus in multi-vehicle cooperative con -trol[M]. Springer-Verlag, London, 2008[11]肖峰. 多智能体网络系统的一致性[D]. 北京大学, 2008。