当前位置:文档之家› 大纯滞后在对象控制方法应用研究

大纯滞后在对象控制方法应用研究

大纯滞后在对象控制方法应用研究摘要:针对一般工业过程中存在的大纯滞后问题,提出了一种克服大纯滞后的预测控制方法。

利用递推最小二乘法进行参数估计,获得对象的一阶简化模型,提出了一种Smith预估神经元控制器设计方法,再用构建的神经网络预测模型预测出未来相应时刻的系统输出,然后用该输出来调整当前时刻的控制量,从而达到预期的控制目的,仿真结果验证了该方法的有效性。

关键词:神经网络;预测控制;大纯滞后0 前言一般工业过程中都具有非线性大纯滞后的特点,特别是滞后较大(即额定滞后S/T>0.5)的系统,常规控制往往无能为力。

采用Smith控制是解决对象大纯滞后问题的有效方法,但它需要建立对象的精确的数学模型,而且鲁棒性和抗干扰能力较差,面向对象的神经元模型及其学习算法具有算法简单、适应性好等优点,但是对于大纯滞后过程,由于被控量的偏差不能及时反映控制量的变化影响了神经元的控制效果。

预测控制是上世纪70年代兴起的一种新控制算法,在工业上已被广泛应用,其主要思想是:在当前时刻,基于过程的动态模型预测未来一定时域内每个采样周期(或按一定间隔)的过程输出,即可以根据当前的输入预测未来多个时刻的输出,从而根据控制要求调整下一时刻的控制量,有利于对纯滞后系统的控制,将预测函数控制应用于大纯滞后温度控制系统,减少了稳态静差,但超调量偏大,要有一种具有自补偿功能的非线性预测反馈校正法,提高了系统的鲁棒性,但该方法限于纯滞后时间已知的情况下,对于纯滞后参数未知或者改变的情况未加讨论。

根据上述情况提出一种用神经网络辨识系统的滞后时间参数,用预测控制算法实现对大纯滞后对象的控制方法。

其中预测模型是用神经网络逼近被控的动态对象而建立的,从而无需知道系统的精确数学模型。

1 神经元模型及控制系统1.1神经元模型针对将神经网络直观套用于自动控制中存在的局限性,提出了一种面向控制的神经元模型它的输出u(t)可以表示为u(t)=K∑wi(t) xi(t) (1)式中:K>0,为神经元的比例系数;xi(t)为神经元的n个输入状态;wi(t)为相应于xi(t)的加权值;wi(t)由某种学习算法确定。

采用这种神经元模型构成的控制系统如图1所示,图中转换器的输入为反映受控对象及受控指标等的状态量,如设定值r(t)!输出y(t)等"转换器的输出为神经元学习控制所需要的状态,如设定值r(t),误差e(t),误差的变化率等,控制信号u(t)由神经元通过关联搜索产生。

一般认为神经元通过修改其自身的突触加权值进行自组织,根据D.O.Hebb提出的著名假设,可以得到如下学习规则wi(t+1)=wi(t)+ηpi(t) (2)式中:η>0,是学习速率,pi(t)是学习策略。

为适应控制的要求提出了下面的联想式学习策略:pi(t)=z(t)*u(t)*xi(t) (3)式中:z(t)为教师信号,表示自适应神经元采用Hebbian学习[pi(t)=u(t)*xi(t)]和监督学习[pi(t)=(t)*xi(t)]相结合的方式,通过关联搜索进行对未知外界作出反应和作用,并隐含着对元的评价。

根据上述神经元模型及联想式学习策略,提出了如下的规范化的神经元控制算法:u(t)=K∑wi(t)xi(t)/ ︳ ∑wi(t) ︳wi(t+1)=wi(t)+η[r(t)-y(t)]u(t)xi(t) (4)式中:u(t)为神经元产生的控制信号;r(t)为设定值;y(t)为输出测量值;神经元输入状态xi(t)的选择可根据控制系统设计要求确定,可以选取为:x1(t)=r(t),x2(t)=e(t),x3(t)=△e(t) (5)这种新颖的智能控制方法对于具有不确定性的一般的纯滞后对象具有很好的控制品质。

1.2神经元控制系统对于大纯滞后对象,如果直接使用式(4)和式(5)的神经元算法时,控制量的控制效果不能及时反馈,使控制品质变差。

为此,将Smith预估方法与神经元控制相结合,过递推最小二乘法进行参数估计获得对象的一阶简化模型,构成Smith预估器,提出了如下的一种新型控制器的设计方法,制系统结构图如图2所示:研究表明,经元控制器的增益与对象的开环增益有着密切的关系,对象开环增益发生变化时,经元增益也应做出相应的调整才能使系统获得好的控制效果,因采用了神经元增益应在线调整的方法,整定算式为K(t)=K0/Kp式中:K0为神经元增益系数。

另外,为加快神经元控制器对控制系统变化反应速度,同时增强控制器消除余差的能力,本文将偏差项和积分项直接加到控制器的输出中。

2 滞后时间参数的辨识对于一般纯滞后系统,其特性均可以用模型来描述y(k)=f(y(k-1),………..y(k-n),u(k-d)…….,u(k-m-d)) (1)对非线性系统滞后时间参数进行辨识时,主要是利用不同的输入采样区间样本集对网络的训练结果有很大的影响的特性,即:在用采集的样本对神经网络进行训练时,期望输出与网络输出误差平方和(即网络训练结果)会在不包含第一个延迟输入量h=d+1到包含第一个延迟输入量h=d的输入采样区间产生突变,由此可以用来辨识出系统的纯滞后时间。

训练时采集的输入输出数据包括(1) 输入u(k-h),u(k-h-1),…….,u(k-h-na)(2) 输出y(k-1),y(k-2),…….,y(k-na)对于最后一个输入中u(k-h-na) 中 na<m经训练的网络的误差d≤na时可产生一次上跳突变,而d>na时产生上跳突变和下跳突变上跳突变对应的点为系统的纯滞后时间值,下跳突变对应的则是d-na处也就是说能反映纯滞后时间只有上跳突变,在进行纯滞后时间辨识时不能仅仅根据训练误差是否突变来判断纯滞后时间点,而应该更具体的判断出是上跳突变后才能得到准确的参数信息。

区别上跳突变和下跳突变的最好方法就是其梯度信息,所以采用网络训练误差的梯度来判断如何来选取正确的突变点,以便获取正确的纯滞后参数。

3 克服大纯滞后的预测控制3.1 预测控制系统的总体结构控制系统总体结构如图1所示,在神经网络对被控系统的纯滞后时间参数d辨识后,在k时刻通过神经网络预测模型预测出系统在k+d时刻的输出yC(k+d),将其与系统参考轨迹yr(k+d)进行比较,从而求取下一时刻的控制率u(k),这样就可消除纯滞后对系统的影响。

并用k时刻预测模型输出延迟d步与系统实际输出y(k)间的误差e(k)来在线校正预测模型。

3.2 预测模型的建立对于一般的动态系统,其特性都可由式(1)来描述,则可以用一个神经网络来逼近y(k)=fnn(y(k-1),……,y(k-n),….,u(k-d),......,u(k-d-m)) (2)式中fnn为一个神经网络,y(k)表示网络的输出值"通过训练使得y(k)逼近于y(k)然而对于纯滞后参数为d的大纯滞后系统,k时刻的控制量u(k)必须经过d拍后输出,通过yC(k+d)来调节下一时刻控制量,所以纯滞后系统可描述为y(k+d)=fnn(y(k),y(k-1),……,y(k-n+1),u(k),……,u(k+m-1)) (3)在式(3)中,u(k)必须经由y(k)求得,可y(k)是基于u(k)得到的,出现u(k)和y(k)求解互锁现象。

因此用y(k)的预测值yC(k)来代替y(k),将上述模型修正为:y(k+d)=fnn(y(k),y(k-1),…..,y(k-n+1),u(k),……..,u(k+m-1)同时为了避免采用多步预测中产生辨识误差累加的缺点,选用一个多输入多输出神经网络模型来预测被控系统的未来多步输出,其结构如图2所示。

图2中xc(k)表示结构层输出,xl(k)表示隐层输出,A为自反馈增益。

这样结构层单元输出为xc(k)=Axc(k-1)+xl(k-1) (5)式中xc(k-1)与xl(k-1)分别为k-1时刻结构层单元和隐层单元的输出,由(2)式可得x(k)=x(k-1)+Ax(k-1)+Ax(k-2)+ (6)在式(6)中,A越接近1,则网络就可以考虑更远的时间,因此,引入自反馈可以很容易地模拟高阶系统。

改进神经网络具有动态特性,能记忆历史信息。

在辨识动态系统滞后时间参数及建立预测模型时,只需引入前一时刻系统状态y(k)=f(y(k-1),u(k-d))建立预测模型时,将神经网络与动态系统并联,以系统与网络输出的误差e(k)作为网络的训练信号来在线辨识网络。

而在线辨识时网络是一个逐步建立的过程,在辨识初期不能充分体现出被辨识系统的特性,会影响控制效果,考虑到被控动态系统为大纯滞后系统,较一般系统更难于控制。

为此,采取先离线!再在线校正的训练方式来训练神经网络预测模型。

由于改进Elman神经网络的学习率对网络收敛速度及稳定性影响很大,学习率太大,易导致收敛过程振荡,甚至不稳定,学习率太小,则收敛很慢。

因此在对改进神经网络离线训练时采用带动量项的BP算法。

于是X(k+1)=X(k)+G(k)W(k)+ɑ△X(k);△X(k)=X(k)-X(k-1)=G(k-1)W(k-1)其中EA为误差函数,当训练时的误差性能指标达到要求时则停止对神经网络的训练,此时的神经网络模型已经能反映出系统的动态特性,可作为预测模型。

然而实际的系统为动态系统,在控制过程中会发生变化,为了使预测模型能真正反映被控系统的特性,就有必要在线校正模型。

在线校正神经网络模型时要求调整简单、快捷,在此采用计算量小速度快的带遗忘因子的最小二乘法X(k)=X(k-1)+K(k)[y(k) -ФT(k)X(k-1)]P(k-1)- Ф(k)K(k)= ———————— P(k)= [1-ζ(k)]P(k-1)]/λK(k)ΘK+(T(k)P(k-1)P(k)这里 P(k)=(y(k-1), ....,y(k-n),...,u(k-d),...,u(k-d-m)),X是权值向量,K为遗忘因子。

3.3反馈校正神经网路虽然能逼近动态系统,但始终不能等同于动态系统,这会导致预测值于实际值间仍存在偏差;系统参数摄动干扰等因素也会影响预测值的准确性,必须对预测值进行误差补偿∧(k)e(k)=y(k)-y∧(k+d),应对它在大纯滞后系统中,用于下一时刻控制量调整的为y进行误差补偿∧(k+d)+ec(k) ; ec(k)=βec(k-1)+(1-Y ′(k+d)=Yβ)e(k)式中 Y ′(k+d)表示补偿后k+d时刻的预测输出,ec(k)表示用于补偿的误差, β为常数且0<β<1.3.4 滚动优化预测控制系统的滚动优化控制策略是:寻找一组控制量,使得未来时刻的预测误差最小或满足系统的性能指标要求为了使系统实际输出准确跟踪设定值,定义如下性能指标J={∑E2(k+i)+ λ∑△u(K+j-1) 2}/2其中 E(k+i)=Y′(k+i)-Y(k+i),而且Y(k+i)=pY(k+i-1)+(1-p)C,i=1,2...C为系统给定值,Q为柔化因子,且Q∈(0,1),Y(k+i)是k+i时刻参考轨迹值,由系统给定值C经一阶滤波器柔化后得,K是控制加权序列,Nu是控制时域,而在纯滞后系统中k时刻的控制量需用Y′(k+d)求取,故上式调整为:J={∑E2(k+i+d)+ λ∑△u 2 (K+j+d-1) 2}/2令:ðJ/ðU=0,可得U(k)=U(k-1)-[E(k+d) ðE(k+d) /ðU(k)]/ λ由于y(k+d)中包含有U(k)项,令每时刻初始值u(k)=u(k-1),采用迭代算法求取最优u(k),以减少动态响应时间。

相关主题