无人作战体系指控技术关键技术汇编 无人作战平台 ( U CV) 包括无人机 ( UAV) 、无人艇( USV) 和无人潜器 ( 群) ( UUV) 等 , 能够在危险复杂环境中执行情报监视与侦察、目标攻击、通信中继 和电子干扰等任务。 作为武器作战平台 , 其信息化作战水平相对较低。 针对智能 指挥控制 , 重点讨论了无人作战平台的指挥控制关键技术 , 采用了实用的自主 行为建模新技术 , 提出了目标分配、自主行为决策控制等研究方法。最后指出 当前的技术解决方案的局限性。
自2000 年以来, 美军对无人作战平台 ( U CV) 智能指挥控制 ( 简称指控) 要求包括 : UCV 自主远距离航行时 , 在无人力控制的情况下 , 自动收集并传送 信息 , 探测、评估并主动规避威胁和障碍物。 在出现不可预知情况及恶劣水文气 象条件下 , 可根据任务目标、 周围环境情况和剩余动力 , 迅速做出反应 , 自主决 策返航或与其他UCV协作,组成编队,协同完成任务。根据该要求,目前美军很 多军工企业和科研院所都在开展UCV的智能指控研究,也取得了相当的成就, 但美军依然认为 , 未来需进一步提高 U CV 的自适应能力、动态威胁规避能力和 自主集结能力 , 以提高其智能指控水平。 1. 指控工作原理
U CV指控工作原理框图如图1所示,主要分为U CV动态控制、自主行为决策控 制和地面( 控制站)人工干预控制 3 部分[ 1] 。 U CV 动态控制包括平台动态模 型和武器系统。平台动态模型和武器系统改变UCV的状态和行为,从而对战场环 境产生影响 , U CV 所载的各类传感器通过对战场环境不断的探测感知 , 形成实 时战场态势。 自主行为决策控制根据战场态势、 战术知识库和作战规则库实时做 出战术决策、实施动作规划和执行战术动作,为UCV动态控制部分发出相应的命 令和控制信号 , 如平台机动和武器发射等。 地面( 控制站 ) 人工干预控制用于管 理和控制UCV系统,包括任务/目标分配、初始化、启动和干预UCV的自主行为。 2 UCV自主行为建模基本框架
UCV自主行为建模或自主行为决策控制的基本框架如图 2所示,主要包括探测 感知、认知处理、行为结果和存储器 4部分[ 2] 。探测感知主要完成有关战场环 境和情 报信息的收集 , 并将收集到的信息转换为能够在认知处理过程被识别的 模型内部信息表示形式。 主要是应用信息融合理论 , 需要重点研究图像分析处理 技术 , 提取运动目标 , 实现敌我识别以及目标跟踪 , 同时为评估和主动规避威 胁和障碍物的决策提供依据 [ 3] 。框架中的存储器包括工作存储器和长期存储 器 2 种。前者主要保留认知处理过程中的临时信息 ; 后者用来存储有关的权威知 识, 相当于一个知识库。认知处理主要完成信息处理和自主决策功能 , 包括态势 评估、多任务模型、规划和决策以及学习等,这是U CV指控技术中的重点和难 点,也是制约UCV自主作战能力的主要因素。态势评估根据当前所获取的信息 以及自身的知识 , 对战场态势和形势的发展做出评估。 主要采用基于范例的推理 以及贝叶斯理论等方法。 规划和决策根据周围战场环境的变化和对战场态势的评 估,确定UCV的作战行为,目前应用较多的技术主要有基于仿真的规划、产生 式规则和决策表等方法。行为结果主要依据认知处理部分的决策结果 ,选择合适 的作战行为来执行 , 执行的过程和结果将对战场环境产生影响 , 并形成新的战 场态势。 3 UCV指控关键技术
本节重点讨论UCV地面控制部分中的目标分配技术,同时对自主行为决策 控制部分中的行为建模实现技术作进一步阐述。 3. 1 多UCV协同攻击多目标的目标分配技术
当多个UCV需要完成对多个目标的协同攻击任务时,地面控制部分应实现 对多UCV的目标分配。这一问题可以归结为从全局最优的整体利益出发 ,研究多 U CV 协同攻击多个不同价值目标时的目标分配问题。由于问题的解空间随资源 和目标总数呈指数级增加 , 因此需要一种合适的算法 , 既能满足问题对解的性 能要求 , 又能满足实时性要求。 为了获得多个UCV的最优目标分配方案,通常需要某些UCV做出对自身不 一定是最优的折衷选择。基于满意决策(SD)的多UCV协同目标分配方法,应用 满意决策理论 ( SDT) 解决协同作战目标分配问题。 SD 是一种集合论的思想 , 建立在博弈论的基础上 , 通过选择函数 P S ( u) 和拒绝函数 P R ( u) ( 这对度量函数称为综合满意度函数 , 具有数学意义上的 概率结构形 式 ) , 以量化的形式度量决策智能体中每个决策接近成功达到目标 的程度和执行该决策的代价 [ 4] 。
基于SD的多UCV协同目标分配的基本原理是:每一UCV根据自己完成任务 的成功概率和预估代价 , 确定能够接受的目标集合 , 即满意集 ( SS) 。在满意集 中,U CV选择合适的决策,形成多UCV协同的目标分配决策,以期用尽可能小 的代价及尽可能大的成功概率完成多 UCV的全局目标任务,从而实现多UCV对 多目标的协同攻击。满意集为 U CV 任务目标分配提供协同决策空间。在此基础 上,U CV通过协同的多目标分配实现多U CV之间高层次、大范围的快速任务协 同。 3. 2 自主行为决策控制的行为建模技术 行为建模是对人的智能、思维形式建模,是U CV!主行为建模或决策控制的 核心部分。传统的行为建模技术一般采用逻辑、规则或框架等方法,目前多数UCV 系统中的行为推理也基于上述方法。 随着行为建模的日趋复杂 , 上述方法已无法 满足需求。 伴随着作战指控技术的发展和 U CV 的研究, 行为建模日益成为热点 , 新的且实用的自主行为建模技术也不断发展和完善 , 其中有代表性的 4 项建模 技术如下 [ 5] : 3. 2. 1 态势评估模型建模技术 认知过程中的态势评估是对当前形势的估计及未来形势的预测 , 构建态势 评估模型的主要技术包括 : 专家系统、黑板系统、 基于范例的推理和贝叶斯信任 网技术。 专家系统 , 即产生式规则系统 , 主要包括规则库、事实库和推理机 3 部分, 其中 , 推理机是专家系统的核心 , 它运用事实库中的数据对规则库进行搜索、 推 理和匹配。 黑板系统将当前状态分解成不同部分 , 并添加到黑板上的适当位置 , 利用 这些信息可以对当前的形势做出分析 , 并对未来的发展进行预测 , 所得到的分 析和预测结果也会添加到黑板上。 基于范例推理的基本思想是从过去相关的范例进行推理。 实际应用时 , 把系 统的知识用一组范例库表示 , 每一个范例都用一组特征表示 , 知识库中的所有 范例具有同样的数据结构。 当新的形势( 目标范例) 出现时, 便可将它与范例库 中的所有范例进 行比较 , 再依据相似性度量原则 , 找出与其最接近的范例 , 从 而实现态势评估的目的。 贝叶斯信任网技术的理论依据是贝叶斯定理,当已知状态S的先验概率,且 观察到S的相关事件E时,则可计算出S的后验概率。该技术适用于系统的 推理过程。 3. 2. 2 决策制定模型建模技术
决策是为了达到某个特定目标 , 从各种不同的方案中选取最优方案。 除了专 家系统和贝叶斯信任网可应用于决策制定外 , 还有基于效用理论的决策方法。 在 基于效用理论的决策中 , 状态的效用值用效用函数计算 , 它是状态的非线性函 数。在实现过程中 , 根据影响效用值的因素选择相应的决策方法 , 主要包括基本 效用理论、多属性效用理论和随机效用模型 3 类。 3. 2. 3 规划模型建模技术
规划是制定具体行动的方案或计划 , 主要有产生式规则或决策表方法、 组合 式搜索或遗传算法、 规划模板或基于范例的推理以及基于仿真的规划方法 4 种模 型实现技术。 产生式规则或决策表方法是规划模型采用最多的技术 , 其中的规则和决策 表都是建立在作战条例基础之上的。 其不足之处是 : 仅能处理规则库或决策表存 在的情况 , 对于其中不存在的情况无法处理。 组合式搜索或遗传算法一般用作规划决策模型的辅助手段 , 能够产生完整 的规划方案 , 在遇到新的情况时 , 可以规划出新方案。 其主要缺点是在进行复杂 的规划时计算代价太大 , 无法用于实时的行为建模。 规划模板或范例与作战规则保持一致时 , 作战任务可规划成更为详细的行 动计划。规划模板或基于范例的推理采用的都是经验知识 , 符合人的行为特点 , 但其灵活性和适应性较差。 基于仿真的规划方法并不产生规划结果 , 主要依靠对可供选择的规划方案 进行快速仿真 , 以实现对这些规划方案的快速评估、修改、细化及优化等。 3. 2. 4 学习模型建模技术 学习模型的建立不仅是 U CV 的自主行为建模 ,也是整个人工智能领域研究 的难 点和发展方向之一。 常见的实现技术有基于规则的学习模型、 基于范例的学 习模型和神经网络学习模型等。 基于规则的学习模型系指当一个新的情况或者某一冲突出现时 , 若现有的 规则无法解决 , 则启动一问题求解过程来进行求解。同时 , 这一新的情况和问 题求解的结果又构成一条新的规则 , 并将其添加到规则库中 , 即完成了学习过 程。由于该方法在启动一条规则时 , 需要对触发状态进行精确匹配。 因此 , 存在 噪声影响时 , 其灵活性较差。 基于范例的学习模型工作原理系指存储对过去求解 问题的经验 ( 即范例 ) 。当出现新问题时 , 利用其与已知范例的相似性进行求解、 更新及存储等。 神经网络学习模型是一种基于人脑工作机制的模型。 该学习模型 由一些相同的单元及单元间带权值的连接线组成 , 其中每个单元具有一个状态。 进行习时 , 先根据问题的需要确定网络的结构和单元的响应函数 , 再按照一定 的数学规则 , 利用输入样本后的输出来调整网络间的连接权值。
4 结束语
本文对U CV指控工作原理和涉及的多项关键技术进行了讨论。 UCV自主行 为决策控制问题涉及人工智能决策建模多项技术的综合应用 , 重点对其中的态 势评估模型建模、决策制定模型建模和规划模型建模等技术进行了讨论 , 同时对 各项技术具体实现的应用范围作了说明。