无人作战体系指控技术关键技术汇编无人作战平台( U CV ) 包括无人机( U AV) 、无人艇( USV ) 和无人潜器( 群) ( UU V) 等, 能够在危险复杂环境中执行情报监视与侦察、目标攻击、通信中继和电子干扰等任务。
作为武器作战平台, 其信息化作战水平相对较低。
针对智能指挥控制, 重点讨论了无人作战平台的指挥控制关键技术, 采用了实用的自主行为建模新技术, 提出了目标分配、自主行为决策控制等研究方法。
最后指出当前的技术解决方案的局限性。
自2000 年以来, 美军对无人作战平台( U CV) 智能指挥控制( 简称指控) 要求包括: UCV 自主远距离航行时, 在无人力控制的情况下, 自动收集并传送信息, 探测、评估并主动规避威胁和障碍物。
在出现不可预知情况及恶劣水文气象条件下, 可根据任务目标、周围环境情况和剩余动力, 迅速做出反应, 自主决策返航或与其他UCV 协作, 组成编队, 协同完成任务。
根据该要求, 目前美军很多军工企业和科研院所都在开展UCV 的智能指控研究, 也取得了相当的成就,但美军依然认为, 未来需进一步提高U CV 的自适应能力、动态威胁规避能力和自主集结能力, 以提高其智能指控水平。
1.指控工作原理U CV 指控工作原理框图如图1 所示, 主要分为U CV 动态控制、自主行为决策控制和地面( 控制站)人工干预控制3 部分[ 1] 。
U CV 动态控制包括平台动态模型和武器系统。
平台动态模型和武器系统改变UCV 的状态和行为, 从而对战场环境产生影响, U CV 所载的各类传感器通过对战场环境不断的探测感知, 形成实时战场态势。
自主行为决策控制根据战场态势、战术知识库和作战规则库实时做出战术决策、实施动作规划和执行战术动作, 为UCV 动态控制部分发出相应的命令和控制信号, 如平台机动和武器发射等。
地面( 控制站) 人工干预控制用于管理和控制UCV 系统, 包括任务/ 目标分配、初始化、启动和干预UCV 的自主行为。
2 UCV 自主行为建模基本框架UCV 自主行为建模或自主行为决策控制的基本框架如图2 所示, 主要包括探测感知、认知处理、行为结果和存储器4部分[ 2] 。
探测感知主要完成有关战场环境和情报信息的收集, 并将收集到的信息转换为能够在认知处理过程被识别的模型内部信息表示形式。
主要是应用信息融合理论, 需要重点研究图像分析处理技术, 提取运动目标, 实现敌我识别以及目标跟踪, 同时为评估和主动规避威胁和障碍物的决策提供依据[ 3] 。
框架中的存储器包括工作存储器和长期存储器2 种。
前者主要保留认知处理过程中的临时信息; 后者用来存储有关的权威知识, 相当于一个知识库。
认知处理主要完成信息处理和自主决策功能,包括态势评估、多任务模型、规划和决策以及学习等, 这是U CV 指控技术中的重点和难点, 也是制约U CV 自主作战能力的主要因素。
态势评估根据当前所获取的信息以及自身的知识, 对战场态势和形势的发展做出评估。
主要采用基于范例的推理以及贝叶斯理论等方法。
规划和决策根据周围战场环境的变化和对战场态势的评估, 确定UCV 的作战行为,目前应用较多的技术主要有基于仿真的规划、产生式规则和决策表等方法。
行为结果主要依据认知处理部分的决策结果,选择合适的作战行为来执行, 执行的过程和结果将对战场环境产生影响, 并形成新的战场态势。
3 UCV 指控关键技术本节重点讨论UCV 地面控制部分中的目标分配技术, 同时对自主行为决策控制部分中的行为建模实现技术作进一步阐述。
3. 1 多UCV 协同攻击多目标的目标分配技术当多个UCV 需要完成对多个目标的协同攻击任务时, 地面控制部分应实现对多UCV 的目标分配。
这一问题可以归结为从全局最优的整体利益出发, 研究多U CV 协同攻击多个不同价值目标时的目标分配问题。
由于问题的解空间随资源和目标总数呈指数级增加, 因此需要一种合适的算法, 既能满足问题对解的性能要求, 又能满足实时性要求。
为了获得多个UCV 的最优目标分配方案, 通常需要某些UCV 做出对自身不一定是最优的折衷选择。
基于满意决策( SD) 的多UCV 协同目标分配方法, 应用满意决策理论( SDT) 解决协同作战目标分配问题。
SD 是一种集合论的思想, 建立在博弈论的基础上, 通过选择函数P S ( u) 和拒绝函数P R ( u) ( 这对度量函数称为综合满意度函数, 具有数学意义上的概率结构形式) , 以量化的形式度量决策智能体中每个决策接近成功达到目标的程度和执行该决策的代价[ 4] 。
基于SD 的多UCV 协同目标分配的基本原理是: 每一UCV 根据自己完成任务的成功概率和预估代价, 确定能够接受的目标集合, 即满意集( SS) 。
在满意集中, U CV 选择合适的决策, 形成多UCV 协同的目标分配决策, 以期用尽可能小的代价及尽可能大的成功概率完成多UCV 的全局目标任务, 从而实现多UCV 对多目标的协同攻击。
满意集为U CV 任务目标分配提供协同决策空间。
在此基础上, U CV通过协同的多目标分配实现多U CV 之间高层次、大范围的快速任务协同。
3. 2 自主行为决策控制的行为建模技术行为建模是对人的智能、思维形式建模, 是U CV自主行为建模或决策控制的核心部分。
传统的行为建模技术一般采用逻辑、规则或框架等方法, 目前多数UCV 系统中的行为推理也基于上述方法。
随着行为建模的日趋复杂, 上述方法已无法满足需求。
伴随着作战指控技术的发展和U CV 的研究, 行为建模日益成为热点, 新的且实用的自主行为建模技术也不断发展和完善, 其中有代表性的4 项建模技术如下[ 5] :3. 2. 1 态势评估模型建模技术认知过程中的态势评估是对当前形势的估计及未来形势的预测, 构建态势评估模型的主要技术包括: 专家系统、黑板系统、基于范例的推理和贝叶斯信任网技术。
专家系统, 即产生式规则系统, 主要包括规则库、事实库和推理机3 部分, 其中, 推理机是专家系统的核心, 它运用事实库中的数据对规则库进行搜索、推理和匹配。
黑板系统将当前状态分解成不同部分, 并添加到黑板上的适当位置, 利用这些信息可以对当前的形势做出分析, 并对未来的发展进行预测, 所得到的分析和预测结果也会添加到黑板上。
基于范例推理的基本思想是从过去相关的范例进行推理。
实际应用时, 把系统的知识用一组范例库表示, 每一个范例都用一组特征表示, 知识库中的所有范例具有同样的数据结构。
当新的形势( 目标范例) 出现时, 便可将它与范例库中的所有范例进行比较, 再依据相似性度量原则, 找出与其最接近的范例, 从而实现态势评估的目的。
贝叶斯信任网技术的理论依据是贝叶斯定理,当已知状态S 的先验概率, 且观察到S 的相关事件E时, 则可计算出S 的后验概率。
该技术适用于系统的推理过程。
3. 2. 2 决策制定模型建模技术决策是为了达到某个特定目标, 从各种不同的方案中选取最优方案。
除了专家系统和贝叶斯信任网可应用于决策制定外, 还有基于效用理论的决策方法。
在基于效用理论的决策中, 状态的效用值用效用函数计算, 它是状态的非线性函数。
在实现过程中, 根据影响效用值的因素选择相应的决策方法, 主要包括基本效用理论、多属性效用理论和随机效用模型3 类。
3. 2. 3 规划模型建模技术规划是制定具体行动的方案或计划, 主要有产生式规则或决策表方法、组合式搜索或遗传算法、规划模板或基于范例的推理以及基于仿真的规划方法4 种模型实现技术。
产生式规则或决策表方法是规划模型采用最多的技术, 其中的规则和决策表都是建立在作战条例基础之上的。
其不足之处是: 仅能处理规则库或决策表存在的情况, 对于其中不存在的情况无法处理。
组合式搜索或遗传算法一般用作规划决策模型的辅助手段, 能够产生完整的规划方案, 在遇到新的情况时, 可以规划出新方案。
其主要缺点是在进行复杂的规划时计算代价太大, 无法用于实时的行为建模。
规划模板或范例与作战规则保持一致时, 作战任务可规划成更为详细的行动计划。
规划模板或基于范例的推理采用的都是经验知识, 符合人的行为特点, 但其灵活性和适应性较差。
基于仿真的规划方法并不产生规划结果, 主要依靠对可供选择的规划方案进行快速仿真, 以实现对这些规划方案的快速评估、修改、细化及优化等。
3. 2. 4 学习模型建模技术学习模型的建立不仅是U CV 的自主行为建模,也是整个人工智能领域研究的难点和发展方向之一。
常见的实现技术有基于规则的学习模型、基于范例的学习模型和神经网络学习模型等。
基于规则的学习模型系指当一个新的情况或者某一冲突出现时, 若现有的规则无法解决, 则启动一问题求解过程来进行求解。
同时, 这一新的情况和问题求解的结果又构成一条新的规则, 并将其添加到规则库中, 即完成了学习过程。
由于该方法在启动一条规则时, 需要对触发状态进行精确匹配。
因此, 存在噪声影响时, 其灵活性较差。
基于范例的学习模型工作原理系指存储对过去求解问题的经验( 即范例) 。
当出现新问题时, 利用其与已知范例的相似性进行求解、更新及存储等。
神经网络学习模型是一种基于人脑工作机制的模型。
该学习模型由一些相同的单元及单元间带权值的连接线组成, 其中每个单元具有一个状态。
进行习时, 先根据问题的需要确定网络的结构和单元的响应函数, 再按照一定的数学规则, 利用输入样本后的输出来调整网络间的连接权值。
4 结束语本文对U CV 指控工作原理和涉及的多项关键技术进行了讨论。
UCV 自主行为决策控制问题涉及人工智能决策建模多项技术的综合应用, 重点对其中的态势评估模型建模、决策制定模型建模和规划模型建模等技术进行了讨论, 同时对各项技术具体实现的应用范围作了说明。