当前位置:文档之家› 人工智能在车辆自动驾驶中的应用

人工智能在车辆自动驾驶中的应用

人工智能在车辆自动驾驶中的应用王洪升,曾连荪,田蔚风(上海交通大学电信学院导航与控制研究所,上海200030)摘要:本文提出了一种新的基于人工智能的感知/计划/动作agent结构实现智能车辆自动驾驶的方案。

首先通过描述该结构的原理说明该结构可以解决自动驾驶中存在的一些问题,接着通过建立自动驾驶知识库阐述如何具体实现自动驾驶,最后通过仿真实验验证了该方法能够为智能车辆实现自动或辅助驾驶提供一种非常有效的机制。

关键词:智能交通系统;人工智能;智能车辆;自动驾驶;知识库中图分类号:TP18文献标识码:A文章编号:1003-7241(2004)06-0005-04Application of Artificial Intelligence inAutom atic Drive for Intelligent VehiclesWANG Hong-sheng,ZENG Lian-sun,TIA N Wei-feng(Institute of Navigation and Control,Shanghai Jiaotong University,Shanghai200030,China)Abstract:This paper presents an innovative method for implementing automatic drive for i ntelligen t vehicles using Artificial Intelli gence based on the sense/plan/act agent architecture.Theory of the archi tecture is described which explains that some problems in automatic driving can be solved efficiently.The i mplementation of the automatic dri ving using knowledge database based on this archi tecture is discussed.Simulation studies have been conducted to verify that the proposed method can be efficien tly utilized in automatic driving for intelligent vehicles. Key words:Intelligent transportation systems;Artificial i ntelligence;Intelligent vehicles;Automatic driving;Knowledge database1引言20世纪80年代后,日益拥挤的交通给人们带来交通堵塞、事故频发、环境污染和危害人类生命财产等一系列的困扰。

为了排除这些困扰,集通讯、信息和管理于一体的智能交通系统(ITS)应运而生。

ITS一般由两部分组成,即智能道路及交通控制系统和智能车辆。

目前智能道路系统的构建还处于起步阶段,相应的基础设施建设周期长且投资大,所以发展智能车辆及车辆自动驾驶系统,通过提高车辆自身的智能的方案是目前实现安全、高效的自动驾驶的最佳选择,同时它还可以为将来开发完备的自动高速交通网络环境中运行的智能车辆奠定基础。

收稿日期:2003-11-11车辆自动驾驶系统主要由车辆自动驾驶控制系统和车辆自动路径导引系统组成。

其中车辆自动驾驶控制系统对车辆进行横向和纵向的控制,而车辆自动路径导引系统为车辆动态规划最优的路径。

近年来,车辆自动驾驶的研究取得了很大的进展,特别是图论法、神经网络法和遗传算法等[1][2][3][4]的应用。

其中以Dijkstra算法为代表的图搜索法[2]在各种优化问题中得到了较为广泛的应用,并且这种算法的解是全局最优的。

但是这种算法需要建立邻接矩阵,会耗费巨大的存储量,且其计算量与网络结点数目为立方关系。

而智能车辆自动驾驶的路径导引要在结点数非常大的数字地图数据库中进行搜索,所以该方法存在计算量大和对计算机存储要求高的缺点。

本文提出将人工智能的基于感知P计划/动作agent结构[5]应用于车辆自动驾驶中,从感知、思维和行为三个层次模拟人为5u es of Aut oma tio n&Ap p licat io ns|驾驶行为。

该结构使动作偶尔产生了不能预料的结果,或agen t 有时不能决定处于哪一种环境状态下,但通过保证agent 从它的执行环境中得到连续的反馈,这些问题可以被充分地解决,通过仿真实验验证了该方法在智能车辆自动驾驶中的可行性。

2 问题的提出在智能车辆自动驾驶中通常存在如下一些不理想的情况:(1)车辆传感器不可能完全提供环境状态的必要信息(由于噪声或对重要的特征不敏感)。

当两种不同的环境状态引起输入时,就产生了所谓的感知混淆。

(2)车辆自动驾驶并不总有其模型效果(由于模型不够精确,或者受动器系统在执行动作时偶尔会产生错误)。

(3)在环境中有其他的物理过程或其他的车辆可能会改变环境以至于干扰车辆的驾驶。

(4)外部作用的存在会引起其他的问题:在构造一个路径规划期间,环境可能变得与原来的规划不相干。

这种困难使得花费太多的时间为车辆自动驾驶进行的规划变得毫无意义。

3 感知/计划/动作的agent 结构为了解决上述问题人工智能提出了一个叫感知/计划/动作的agent 结构,该结构的基本原理是即使动作偶尔产生了不能预料的结果,或agent 有时不能决定处于哪一种环境状态下,但通过保证agent 从它的执行环境中得到连续的反馈,这些困难可以被充分地解决。

为确保连续反馈的一个方法是计划一个动作序列,只执行这个序列中的第一个动作,感知结果环境状态,重新计算开始结点,然后重复上述过程。

这种方式,选择动作的agent 被叫做感知/计划/动作agen t 。

然而为了使这个方法有效,计算一个计划的时间必须比每个动作执行时间少。

图1显示了一个感知/计划/动作agent 的结构。

在良性环境中(容忍几个错误步骤),感知和动作中的错误在感知/计划/动作循环序列中/达到平均数0。

在感知/计划/动作循环中的环境反馈允许解决感知、环境和受动器的一些不确定性。

然而,为使反馈有效,必须保证感知和动作一般来说是精确的。

在很多应用中,这种假设是现实的。

毕竟,提供感知、思维和受动器特征适合于任务要求是agent 设计人员的任务。

通常,agent 通过比较此刻的感知数据和未展开状态的存储模型能够提高扩展感知精确度。

图1 一个感知/计划/动作agent 的结构4 自动驾驶策略4.1 自动驾驶知识库的建立连续的环境反馈是减少不确定性和弥补一个agent 缺乏对自己动作结果知识了解的一种方法。

另外有用的信息也能从环境的搜索经验和动作经验中抽取出来,从而以知识的形式予以保留下来。

为了自动驾驶提供全面的知识,除了抽取出来的局部环境信息外还应该融合更多的全局环境信息,其中包括地理信息系统提供的电子地图利交通信息中心提供的交通法规等。

将所有这些以知识形式表述的环境信息进行融合,最终形成为自动驾驶的决策提供依据的知识库。

知识库依赖于各种不同方式的知识表达和积累,同时应该具有类比和联想的功能,知识库的质量影响知识推理的快速和准确。

知识表示有状态空间、谓词逻辑和语义网络等方法。

自动驾驶知识库的建立过程如图2所示。

图2 自动驾驶知识库的建立过程4.2 知识的推理车辆动态环境下的行驶路径可以通过知识推理得到。

启发6|Techniq ue s o f Au to mat io n式搜索是基于知识的搜索策略,即从初始状态到目标状态搜索时具有与步骤数或费用相关的信息。

路径规划采用最流行的启发式搜索算法)))A*算法,它是一种最佳优先搜索算法。

启发式搜索算法的思想是在选择下一个被检查的结点时引入已知的全局信息,并对当前结点距终点的距离做出估计,作为评价该结点处于最优路线上的可能性的量度,这样就可以首先搜索可能性较大的结点,从而提高了搜索过程的效率。

算法所选择的启发信息称为估价函数。

在A *算法中启发式估价函数使算法首先搜索最有希望的结点。

若将一个结点n 的估价函数f(n)定义为f(n)=d(n)+h (n),其中d(n)是从原结点到当前结点的实际费用,h(n)是从当前结点到目标结点的最小费用路径的估计。

若估计费用函数h (n)=0,A*算法退化为改进的Dijkstra 算法。

如上所述,估价函数的费用可选择不同的量,如可选择最短行驶时间或最短距离等。

在ITS 系统中启发式函数的选择并不是由简单的一个量就可以决定的,还应考虑路面状况,道路收费情况和交通规则等。

在这种环境下,启发函数由各种因素的加权和组成:f (n )=w 1p 1(n )+w 2p 2(n )+,+w i -1p i -1(n )+w i p i (n )=E iw i p i (n )权值w i 学习方法采用每一个结点的扩展来调整f (n i )。

在扩展结点n i 产生后续集合i (n i )后,调整权值使得:f (n i )z f (n i )+B {min n j I F (n i)[f (n i )+c (n i ,n j )-f (n i )]}或重新整理为:f (n i z (1-B )f (n i )+B min n j I F (n i)[f (n i )+c (n i ,n j )]其中,c (n i ,n j )为从n i 到n j 的代价。

0<B <1是学习率参数,它控制着f (n i )向min n j I F (n i)[f (n i +c (n i ,n j )]逼近的快慢程度。

当B =0时,没有任何变化;当B =1时,f (n i )=min n j I F (n i)[f (n i )+c(n i ,n j )]。

B 值越小,学习速率越慢。

5 仿真研究我们采用5个安装在不同方位的雷达组成外界环境传感器,具体的情况如图3所示。

应该综合考虑这5雷达,有的探测距离较远,有的探测距离较近。

这样得到排斥力合力F _(t )为:F _(t )=E5i =1k i(Q i -Q 0)2-k i (Q mi -Q 0)2[cos (H i )-j sin (H i )]其中k i 为比例系数;Q i 为第i 个雷达的探测距离:Q 0为安全距离;Q mi ,为雷达的最大探测距离;H i 为雷达i 与环境坐标系的夹角。

F _(t )体现了车辆距离障碍物的综合相对位置关系。

F _(t )较大则表明车辆总体上离障碍物较近,反之则较远,相邻时刻的受力之差为$F (t )=|F (t +1)_|-|F (t )_|表明车辆行驶的趋势,$F (t )<0表明车辆远离障碍物,$F (t )>0表示车辆往障碍物方向行驶。

相关主题