当前位置:
文档之家› 智能控制第9章 多智能体系统控制
智能控制第9章 多智能体系统控制
32/42
R2:
R3:
R4:
2. 行为主义方法
行为的分解、合成与选择 模拟生物系统
蚁群算法 免疫算法
模拟物理系统
粒子算法
33/42
群体行为的分解与合成
34/42
行为的选择1:ALLIANCE结构
35/42
行为选择2:行为网
射门行为
36/42
3. 进化主义方法
传统进化计算的推广 协进化(Coevolution)
在传统进化算法的基 上,增加了种群之间 的关系,如共生、寄 生等。
37/42
目录
42/42
18/42
(2)agent间的交互
通信 协调
19/42
9.2 多智能体系统的理论
9.2.1 多智能体系统的理论模型 9.2.2 多智能体系统的通信 9.2.3 多智能体系统的协调与协作
20/42
通信
22/42
9.2 多智能体系统的理论
9.2.1 多智能体系统的理论模型 9.2.2 多智能体系统的通信 9.2.3 多智能体系统的协调与协作
23/42
1. 协调、协商与协作
协调(Coordination):满足系统目标或达到系 统的和谐 。 协商(Negotiation):消除冲突,争取双赢。 协作(Cooperation) :完成共同目标
31/42
R3:
R4:
选择规则
R1:
IF 联合目标G已满足 THEN 放弃所有相关的局部行为 AND 通知协作agent
IF 联合目标G的动机不在存在 THEN放弃所有相关的局部行为 AND 通知协 作agent IF 共同规划P已被破坏 AND P可以重新调度 THEN 暂停与P相关的局部活动 AND 重新设 置与P相关的定时器和描述 AND 通知协作 agent IF 共同规划P1 失效 AND 存在另外的规划 P2 THEN 放弃与P1相关的所有局部活动 AND 通知协作agent P1失效并且建议P2
其中,ui为效用函数,i为策略
简洁准则 :最小系统代价
25/42
2. 协调思想
基于对策论的协调方法 模拟经济现象的协调方法(合同网) 模拟社会心理的协调方法(联合意图理论) 模拟生物系统的协调方法 模拟物理系统的协调方法 模拟学习功能的协调改进
需要了解语言的内容以及内容背后真实的意 图 常见的语言:
KQML(Knowledge Query and Manipulation Language) FIPA-ACL (Agent Communication Language)
21/42
KQML的三层结构
28/42
控制系统举例
用于工业控制的结构ARCHON (Architecture for Cooperative Heterogeneous ON-line systems) ; Jennnings在联合意图理论的基础上提出。
29/42
ARCHON agent的结构
分布式系统 优点
高效性:并行处理。 可靠性:个体冗余、信息融合 灵活性:可重构、扩展、易维护 系统性:自组织
16/42
MAS 的研究内容
结构 相互作用
17/42
(1)组织结构
集中式 分布式 混合型
第9章 多智能体系统控制
智能控制基础
目录
9.1 引言 9.2 多智能体系统的理论 9.3 多智能体控制系统 9.4 多智能体控制系统的应用举例
2/42
9.1.1 多智能体系统的概念
多智能体系统(MAS,Multi-Agent System) 研究一组agent 如何通过相互之间的协调来 形成一个系统; 是一种分布式人工智能 ; 追求1+1>2的效果 。
9.1 引言 9.2 多智能体系统的理论 9.3 多智能体控制系统 9.4 多智能体控制系统的应用举例
38/42
9.4.1 多机器人控制系统
多机械手协调系统 多机器人协作系统 仿生机器人系统 可重构机器人系统
39/42
机器人足球比赛
6/42
目录
9.1 引言 9.2 多智能体系统的理论 9.3 多智能体控制系统 9.4 多智能体控制系统的应用举例
7/42
9.2 多智能体系统的理论
9.2.1 多智能体系统的理论模型 9.2.2 多智能体系统的通信 9.2.3 多智能体系统的协调与协作
agent系统的结构设计 agent的环境感知 agent的技能训练 多agent的协作 MAS的策略形成 agent的高层智能 人机交互
40/42
9.4.2 交通管理系统
交通管理系统的特点: 分布性 自治性 动态不确定性
41/42
城市交通控制系统设计
24/42
协商准则
最大社会利益准则 Pareto效率准则 :在所有的agent都没有损失 的情况,至少使一个agent的利益得到提高。 平衡准则 :Nash平衡点,满足
* * * u i ( 1 ,, i* ,, n ) u i ( 1* ,, i ,, n )
30/42
匹配规则
R1:
IF 任务t完成 AND t产生了满足联合目标G的 结果 THEN G已满足
R2:
IF 接收到与联合目标G触发条件有关的消息i AND i导致继续G的信念失效 THEN G的动机不再存在
IF属于共同规划P的任务t1延迟 AND t1必须与 P中的任务t2同步 THEN P已被破坏 IF共同规划P已经完成 AND P的预期结果没有 产生 AND 存在另外的规划 THEN P无效
8/42
1. 智能Agent
感知 agent
行动
环 境
9/42
Agent的实现
慎思型 反应型 混合型
10/42
(1)慎思型
基于知识的系统,可采用符号逻辑推理 BDI (Belief-Desire-Intention)模型是公认的典 型 (stanford研究所 ) 信念(Belief):信念是agent 对世界的认识 (包括感知的信息) 愿望(Desire): agent的动机(与信念有关) 意图(Intention):理性慎思后,行动的方针。 (要执行的愿望)
3/42
Agent的含义
英文:代理
通常指一个具有智能的实体,如人、机器人、 智能软件等 。
中文翻译: 智能体
4/42
Agent的特点
反应性 • agent 对周围环境应有感知能力,并能根据环境的 变化作出相应的反应。 预动性(前摄性)(pro-activeness) • agent能够通过根据目标,主动地发起和引导行为。 社会性 • agent 可以和其他的agent进行交互,进行协调。
26/42
目录
9.1 引言 9.2 多智能体系统的理论 9.3 多智能体控制系统 9.4 多智能体控制系统的应用举例
27/42
1. 理性主义方法
制定作用规则(契约) 模拟经济现象 (合同网) 模拟社会心理 (联合意图理论 ) 基于对策论
5/42
9.1.2 多智能体系统的发展
最早的MAS是开发产生式专家系统时出现的黑板系 统; 70年代的后期,Standford大学的博士生Smith提出 了“合同网”; 80年代,Rosenschen第一次用博弈论对agent间的交 互进行了分析; 90年代,对MAS系统的理论、技术研究开始深入和 广泛。 在控制中,有80年代欧洲的ARCHON项目以及机器 人足球等。
11/42
流程
感知输入
信念修正 信念集 意见产生 愿望集 筛选 意图集 行为选择 行为输出
12/42
(2)反应型
基础是Brooks于1991年提出的行为主义思想。 该理论认为生命最基本的目的是生存,在了 解高层次的智能之前,首先要了解有关生存 的反应能力,而这种反应能力即环境与行为 之间的对应关系。 智能被描述为黑箱方式的映射
13/42
反应型的包含结构
14/42
(3)混合型
原因没有一种方法可以适应所有的情况。 常见结构:层次型体系结构
15/42
2. 多agent系统
多agent系统 MAS (Multi-agent System)