当前位置:文档之家› 基于神经网络参数优化的迭代学习控制算法

基于神经网络参数优化的迭代学习控制算法

29卷第

6期

2008年 

12月河南科技大学学报

:自然科学版JournalofHenanUniversityofScienceandTechnology:NaturalScienceVol.29No.6

Dec.2008

基金项目

:辽宁省教育厅科学研究计划项目(

2002D031)

作者简介

:王丹凤(

1983-)

,女

,辽宁辽阳人

,硕士生

;李书臣(

1960-)

,男

,辽宁桓仁人

,教授

,主要研究领域为预测控制、智能控制、

迭代学习控制算法及应用

.

收稿日期

:2008-05-15文章编号

:1672-6871(

2008)

06-0042-03

基于神经网络参数优化的迭代学习控制算法

王丹凤

,李书臣

,翟春艳

,邢宜春

(辽宁石油化工大学信息与控制工程学院

,辽宁抚顺

113001)

摘要

:针对迭代学习控制用于轨迹跟踪时存在收敛速度慢的问题

,提出用

RBF网络优化迭代控制器参数的算

法。在每一次迭代学习过程之后利用

RBF网络对当次输出的数据进行优化计算

,拟合出最优的学习增益

,使

迭代学习算法具有较快的收敛速度

,在单关节机器人中进行仿真验证了方法的有效性。

关键词

:迭代学习控制

;RBF网络

;单关节机器人

中图分类号

:TP389.1文献标识码

:A

0 前言

机器人是一类高度非线性、强耦合和时变性的动力学系统

,设计其控制器存在的一个严重问题是我

们并不知道准确的数学模型

,如果忽略各种不确定因素

,设计出的控制器可能会导致系统性能变坏甚至

引起不稳定[1]

。迭代学习控制(

ILC)[2-3]

是一种新型控制算法

,它能以非常简单的方式处理不确定度

相当高的动态系统

,且仅需要较少的先验知识和计算量

,适应性强

,易于实现

;更主要的是它不依赖于动

态系统的精确数学模型。从“迭代”二字可以看出

,这是要求动态过程是可以重复的一种行为

,它的研

究对诸如机器人等对运动控制有着高速、高精度要求的对象有着重要的意义。但现有的迭代学习控制

只能用于某种特定的轨迹跟踪问题

,且学习速度慢

,迭代的次数多

,本文将离线的神经网络与在线的迭

代学习相结合的控制方案

,在控制器中加入神经网络的优化作用

,把在线的学习

,在线的控制与控制系

统性能改善的功能有效的综合在一个算法里[3]

。此方法原理简单

,实现的

PD型迭代学习控制器结构

简单

,保证了系统的实际输出在最少的迭代次数

,以最快的收敛速度逼近期望输出。

1 迭代学习神经网络控制结构

基于神经网络的迭代学习控制系统结构图主要分为两大部分

:迭代学习控制器和神经网络

,结构图

如图

1所示。

1 基于神经网络的迭代学习控制结构图本文采用

PD型学习律[4]

的迭代学习控制器直接对

被控对象进行控制

,控制器中的可调参数

k

p,k

d通过离线

的神经网络进行调整。

PD型学习律公式为

u

k+1(

t)

=u

k(

t)

+k

pe

k(

t)

+k

dd

e

k(

t)

d

t(

1)

e

k=y

d(

t)

-y

k(

t)(

2)

其中 

k表示迭代的次数

;u

k(

t)为第

k次控制输入

;k

p,k

d

分别为迭代学习控制器的学习增益。

随着神经网络的发展尤其是在出现多层前馈网络和

反馈性网络后获得了突破性进展[5]

。多层神经网络逼近

任意非线性映射能力

,以及固有的学习特点

,已得到各个

领域的极端重视

,将极具潜力的神经网络模型运用到学习控制系统的研究

,已陆续得到某些结果。第

6期王丹凤等

:基于神经网络参数优化的迭代学习控制算法

利用神经网络的数学逼近映射的功能来实现对迭代学习控制参数的优化

,BP网络是神经网络中最常用的一种结构

,但这里采用的是逼近能力和学习能力均优于

BP网络的另一种网络

RBF网络(

Radial

BasisFunction)。

2 迭代学习神经网络的参数优化

RBF网络是一种三层前向网络

,由输入到输出的映射是非线性的

,而隐含层空间到输出空间的映

射是线性的

,从而大大的加快了学习速度并避免了局部极小问题[6]

,图

2为

RBF网络结构。

2 

RBF网络结构在

RBF网络结构中

x=

[x

1,x

2,…

,x

i,…

,x

n]T

为网络的输入

向量

,设

RBF网络的径向基向量

H=

[h

1,h

2,…

h

j,…

,h

m]T

,其中

h

j为高斯基函数

h

j=exp(

-X-C

j2

2

b2

j)

,j=1

,2

,…

,m(

3)

网络的第

j个结点的中心矢量为

C

j=[c

j1,c

j2,…

,c

ji,…

,c

jn]T

,

其中

,i=1

,2

,…

,n

设网络的基宽向量为

B=

[b

1,b

2,…

,

b

m]T

,b

j为节点

j的基宽

参数

,且为大于零的数。网络的权矩阵为

W=

[w

lj]T

,l=1

,2。

依据平方差判断算法的优越性

,故取性能指标函数为

J=1

2(

e

k(

t)

-e

k-1(

t))2

(

4)

根据梯度下降法

,输出权、节点中心及节点基宽参数的迭代算法如下

w

jl(

k)

=w

jl(

k-1)

e(

k)

h

j+α

(

w

jl(

k-1)

-w

jl(k-2))(

5)

Δ

b

j=(

y

d-y

k)

w

ljh

jX-C

j2

b3

j(

6)

b

j(

k)

=b

j(

k-1)

+ηΔ

b

j+α

(

b

j(

k-1)

-b

j(

k-2))(

7)

Δ

c

jl=(

y

d-y

k)

w

ljx

j-c

ji

b2

j(

8)

c

ji(

k)

=c

ji(

k-1)

+ηΔ

c

ji+α

(

c

ji(

k-1)

-cji(

k-1)))(

9)

9

y

u=ρm

j=1w

ljh

jc

ji-x

1

b2

j(

10)式中 η

为学习速率

为动量因子。

k

p,k

d的调整采用梯度下降法

Δ

k

p=-η9

E

9

kp=η

e

k9

y

9Δu(

e

k-e

k-1)(

11)

Δ

k

d=-η9

E

9

k

d=η

e

k9

y

u(

e

k-2

e

k-1+e

k-2)(

12)

基于神经网络的迭代学习控制器的学习过程

:在第

k次运行过程中

,输入信号

u

k(

t)加入被控对象

,产生输出信号

y

k(

t)。在此过程中

,u

k(

t)

,y

k(

t)被存储在相应的存储器中

,当第

k次运行结束后

,系

统将对它们离线处理

,按照迭代学习算法

,将

e

k(

t)和

u

k(

t)进行神经网络优化[7-8]

拟合运算后

,输出控

制器的参数值

k

p和

k

d。系统在时间内

t∈

[0

,T],随着迭代次数的增加

,在相同的学习律下不断的学

,对控制器参数不断的进行修正

,直至误差满足要求

,实际输出逼近期望轨迹为止。

3 仿真实例

将基于神经网络的迭代学习控制应用于单关节机器人系统

,其动态系统模型为

J

mq..

(

t)

+sgsin(

q(

t))

=f(

t)(

13)・

34・

相关主题