●专家论谈 智能控制理论及应用的发展现状杭州浙江大学工业控制技术研究所 (310027) 许晓鸣 孙优贤上海交通大学自动化系 (200030) 熊 刚 在控制工程实践中,人们常常涉及到传感器、执行器、通信系统、计算机以及控制策略和具体算法。
它们构成的控制系统可以比拟成一个人,如图1。
传感器用来采集反映被控对象特性的信息,它就象人的五官;执行器用来把控制决策命令施加于被控对象,它好比人的四肢;通信技术把传感器采集到的信息及时送到控制器,就象人们的神经系统;计算机是控制器的硬件环境,就象人的脑袋。
这四部分在控制系统设计中占去人们大部分精力,但是控制策略和具体算法就好象人的大脑一样,是控制系统的“指挥中心”。
设计尽量“聪明”和适用的控制算法是控制理论发展的动力和内容。
图1 控制系统的构成框图1 智能控制的兴起111 自动控制的发展与挫折本世纪40~50年代,以频率法为代表的单变量系统控制理论逐步发展起来,并且成功地用在雷达及火力控制系统上,形成了今天所说的“古典控制理论”。
60~70年代,数学家们在控制理论发展中占了主导地位,形成了以状态空间法为代表的“现代控制理论”。
他们引入了能控、能观、满秩等概念,使得控制理论建立在严密精确的数学模型之上,从而造成了理论与实践之间的巨大分歧。
70年代后,又出现了“大系统理论”。
但是,由于这种理论解决实际问题的能力更弱,它很快被人们放到了一边。
112 人工智能的发展斯坦福大学人工智能研究中心的N ilsson 教授认为:“人工智能是关于知识的科学——怎样表示知识以及怎样获得知识并使用知识的科学”。
M IT 的W in ston 教授指出:“人工智能就是研究如何使计算机去做过去只有人才做的智能性工作”。
1956年以前是人工智能的萌芽期。
英国数学家图灵(A 1M 1T u ring 1912~1954)为现代人工智能作了大量开拓性的贡献;1956年~1961年是人工智能的发展期,人们重点研究了诸如用机器解决数学定义,通用问题求解程序等。
1961年以后人工智能进入了飞跃期,主要内容涉及知识工程、自然语言理解等。
人们研究人工智能方法也分为结构模拟派和功能模拟派,分别从脑的结构和脑的功能入手进行研究。
113 智能控制的兴起建立于严密的数学理论上的控制理论发展受到挫折,而模拟人类智能的人工智能却迅速发展起来。
控制理论从人工智能中吸取营养求发展成为必然。
工业系统往往呈现高维、非线性、分布参数、时变、不确定性等复杂特征。
特别是非线性对控制结果的影响复杂,控制工程人员很难深入理解,更谈不上设计出合适的控制算法。
不确定性是最难以解决的问题,也是导致大系统理论失败的根本原因。
但是,对这些问题用工程控制专家经验来解决则往往是成功的。
人是最聪明的控制器,模仿人是一种途径。
萨里迪斯(Saridis )于1977年提出了智能控制的三元结构定义,即把智能控制看作为人工智能、自动控制和运筹学的交点。
在智能控制发展初期,美国普渡大学的傅京孙(K 1S 1Fu )教授首先提出了学习控制的概念,引入了人工智能的直觉推理。
后来在人工智能的概念模拟基础上,发展了许多智能控制方法,如自整定、参数调整P I D 等。
再后来则以发展实用的智能控制算法为主,尤以专家系统和神经元网络最为突出。
2 智能控制的发展框架图2 智能控制的发展框架 现在有关智能控制方面的论文很多,我们可以把它们归纳为如图2所示的三维图形。
基于知识表示轴线主要涉及产生式规则、模糊逻辑、定性描述、时序逻辑等方法;其于问题求解主要涉及学习、推理、自适应、自组织等方面。
任何一种智能控制算法都是这个三维空间中的一个小区间。
下面我们分别就这三根轴线作一大致的介绍。
3 基于知识表达的智能控制311 专家控制(1)产生式控制系统(P roducti on Con tro l System )产生式规则IF (…)TH EN (…)EL SE (…)表达。
它是人推理中最基础的部分,是人工智能的基础。
产生式控制系统由三大部分组成,它们是综合数据库(GlobedD atabase )、产生式规则集合库(Sets of R u les )和控制系统(Con tro l System s )。
可见,产生式控制是一种较简单的专家控制。
(2)专家控制系统专家系统是一种能以人类专家水平完成专门和固定专业任务的计算机系统。
专家控制系统则是工程控制论与专家系统结合的产物。
其低级形式是专家控制器,它是在原有控制器基础上加入几条专家经验形成,因而结构简单、代价低、性能令人满意、应用广泛,如自整定、自学习P I D 控制器。
其高级形式为正规的专家控制系统,它的结构复杂,研制代价高,加之现有计算机计算水平不够,它的应用还很少。
312 模糊控制(Fuzzy Con tro l )1965年,美国控制论专家扎德(L 1A 1Zadeh )创立了模糊集合论,为描述研究和处理模糊性现象提供了新的数学工具。
1974年,英国的马丹尼(E 1H 1M am dan i )把模糊语言逻辑用于控制并获得成功,这标志着模糊控制的诞生。
现在,模糊控制已广泛地被用于工业实践中。
图3 模糊控制系统框图 模糊控制是以模糊集合论,模糊语言变量以及模糊逻辑推理为基础的一种计算机数字控制。
模糊控制系统的组成如图3。
313 定性控制与状态空间描述相对应,智能控制系统的定性模型可定义为: x i(k )2ni=1a il(k )[x l (k )]+2Ll=1b il (k )[u l (k )] [y j (k )]=2rj=1c ji (k )[x j (k )]+2Ll-1d jl (k )[u l (k )] k =1,…,m i =1,…,n j =1,…,r l =1,…,Lm 是最终时刻,n 是状态数,r 是输出值,l 是输入值。
式中:a il (k ),b il (k ),c jl (k ),d jl (k )∈{-,0,+}定性模型的行为可通过定性状态图来分析。
现在有人已初步给出了定性能控、定性能观的定义,但这些定义离实际应用还很远。
314 时序逻辑控制用IF (…)TH EN (…)EL SE (…)表达的是有关人们对于控制系统认识经验方面的浅层知识。
用x ・=f (x ,u ,t )y=y (x ,o ,t )表达的则是有关控制系统的深层知识。
过去控制理论只研究深层知识,智能控制引入浅层知识又不能解决诸如时变等问题。
这样人们便希望能表达出折衷的中层知识,时序逻辑控制在此背景下产生了。
时序逻辑分为时间域,特性(P roperty )和过程(P rocess )、函数、谓词、连接符与量词五大部分。
现在有人给出了该模型下能控、能观、稳定的定义,但还仅停留在理论分析阶段,离实用还差得较远。
4 基于问题求解策略的智能控制411 基于分布式问题求解策略的控制算法所谓分布式问题求解是通过分散化的、松驰联系的、分布在不同地点的处理器上的知识源(如过程,规则集等)之间的相互协调进行问题求解。
在分布式问题求解中,主要解决如何分解并且分配问题及其知识,确定节点之间的通讯内容,而不是通讯的方式,解决由于控制分散,数据分散所带来的控制不确定性,数据不确定性等问题。
分布式问题求解过程大致分为问题的求解、子问题的求解、答案的综合三个阶段。
分布式问题求解的意义如下:・可提高控制系统的实时性・可降低对节点存储容量的要求・可以提高系统的可靠性・适应于解决由于信息分散、控制分散带来的问题其于分布式问题求解在人工智能中还未解决,在智能控制中一样有待解决,但这种思想对我们解决实际问题很有帮助,递阶控制思想便产生于此。
412 基于启发式问题求解策略的控制算法启发式是树搜索中的一个基本概念。
启发式搜索是人们凭经验进行的搜索,即非盲目搜索由非固定搜索。
对于问题:x (k +1)=f (x (k ),u (k )),x (0)=x 0J =12{‖x (k f )-c (k f )‖2Q+2k fi=0[‖x (i )-C (i )‖2Q +‖u (i )‖2R ]}求使J …>M in 的{u (i ),i =0,…,k f -1}就可以用启发式控制算法。
不过只是对于f 函数在线性情况下的最优控制算法已经成熟,对非线性f 函数的最优控制算法还有待研究。
5 基于智能模拟的控制方法511 利用神经元网络进行动态系统的辨识与控制神经网络模型用于模拟人脑神经活动的过程,其中包括信息的加工处理、存储和搜索等过程。
神经网络是以对信息的分布式存储和并行处理为基础,它具有自组织、自学习的功能,在许多方面更接近人对信息的处理方法,它具有模拟人的形象思维的能力,反映了人脑功能的若干特性。
神经网络的研究经历了三十余年的曲折发展历史。
80年代以来,神经网络的研究取得了异常迅速的发展,提出了许多神经网络理论及其模型。
例如:多层感知器模型、回归模型(Hopfo id 模型)、概率型神经网络模型等。
其中多层感知器模型多用于系统建模;回归模型则可做成电路完成优化任务,它的速度快;概率型神经网络的动态辨识与热力学方程有对应关系。
尽管它的学习过程时间较长,但它可使系统收敛到全局能量最小值而非局部最优点。
辨识曾经很热门,但只能对线性定常、集中系统进行辨识。
由于神经元网络本身为非线性,用它辨识任何系统便成为可能。
图4便是利用神经元网络进行非线性系统辨识的原理图,其中的学习算法用单样本或多样本的过程学习算法。
一旦知道了被控对象的数学模型,我们便可以用预测控制,自适应控制等高级控制算法。
图4 神经元网络非线性辨识原理图 利用神经元网络进行直接控制的原理如图5。
利用神经元网络进行间接控制的原理图如图6。
它首先得求出N i ,得到非线性对象的详细信息,然后再做直接控制。
512 自适应控制自适应控制可保证在被控对象结构参数和初始条件发生变化或目标函数(评价函数)的极值点发生漂移时,能够自动地解得最优工作状态。
其原理框图如图7。
自适应控制系统必须完成测量性能函数,辨识对象的动态模型,决定控制器如何修改以及如何改变控制器的可调参数等功能。
图5 神经元网络直接控制原理图图6 神经元网络间接控制原理图图7 自适应控制系统构成原理图513 自组织控制自组织系统是一个有序度随时间推移而增加的系统。
自组织控制引入了信息论中度量有序度的概念熵(H )。
因为系统有序度升高则其熵值减少,自组织控制就是最小熵控制。
美国著名教授Saridis 已证明了最小能量控制与最小熵控制本质是一样的。
514 自学习控制K 1S 1Fu 认为,智能控制的初级阶段是学习一些先进模型。
由于计算机水平有限,现在谈完全自学习控制不现实。
在学习理论中,最重要的原形之一是再励(R einfo rcem en t )的规律,这是对于作为系统的主体行为上的变动效果是否达到目的而确定奖惩作用。