当前位置:文档之家› 机器人鲁棒神经网络控制与仿真

机器人鲁棒神经网络控制与仿真


函数,则对任意的 ε N > 0 ,存在有限个隐层神经元和理想
的连接权重 W 使得
f (x) = W Tφ( p) + ε
(3)
成立。其中 || ε ||≤ ε N , ε N 称为误差界。
2 控制器设计与稳定性分析
为了实现关节角轨迹跟踪的目的,我们引入变量
r = e + Λe, e = q − qd
近年来神经网络(NN)控制技术的发展为解决复杂系统的 控制特别是机器人系统的控制提供了一种有效的方法。由于 NN 方法具有模糊性、容错性、自适应和自学习的特点,比以 往依靠推导数学模型、参数寻优的控制方法具有明显的优越 性。因而研究者们开发了多种不同的神经网络控制方法 [4,5,6]。
受 Bayard(1988)和 Sun(2001)工作的启发,对于不确定性 机器人,本文提出一种新的神经网络控制策略。我们用一个 FLNN 神经网络去学习一个已知的一致有界函数,这从神经 网络万有逼近的性质上看是非常重要的。同时,为了解决因 神经网络隐层神经元输出持续激励(PE)性质的丢失而可能造 成的参数飘移问题,与大量在文献中使用的神经网络权重调
其中 qd 为给定的期望轨迹,一般可选取为二阶光滑且有界的
曲线,既存在常数 qB > 0 使得
|| (qT , qT , qT ) ||≤ qB
且 e 与 r 的范数有下面的关系
|| e ||≤ || r || Λ min
其中 Λmin 为 Λ 的最小特征值。这样系统(1)化为
M(q)r = −C(q,q)r −[M(qd )qd +C(qd ,qd )qd +G(qd ) + Fdqd ]−τd +u + M(q)Λe +C(q,q)Λe+[M(qd ) −M(q)]qd +[C(qd ,qd ) −C(q,q)]qd +[G(qd ) −G(q)] +[FVqd − FVq]
(8)
下面对Wˆ = Wˆ (t) 分情况讨论: (1) || Wˆ ||< ω 时。由于
rTW Tφ( y) = φT ( y)Wˆr = tr{W Tφ(r)rT }
和文献[3]定理 4.2 即
rT
f
(q, q,
qdBiblioteka , qd)≤||
r
||2
(a
+
qB a2
+
2 3
qB2 a1
+
FV
)+
||
值得注意的是,虽然满足(5)式的权重矩阵W0 是未知的。
然而其变化范围是可以确定的,既存在正常数 ωB > 0 ,使
得 || W0 ||≤ ωB 。
注:在机器人控制器设计中,用期望轨迹来代替实际轨
迹是一项重要的技术[3]。这从神经网络万有逼近性来看是非
常重要的,因为变量 y 一致有界。正因如此我们选择逼近
||
r(0)
||
+
||
W (0)
||≤
Kmin

μ2Λmin

cqB
−(a3 2c
+
qBa2
+
2 3
qB2a1)

c

l1,||Wˆ (0)
||≤
ω
时( a1, a2 , a3 在证明中定义),虑化误差 r(t) (因而跟踪误 差 e(t) )将渐近趋向于 0,同时保持神经网络权重矩阵误差 W (t) 有界。
有下列的基本性质[7]:
性 质 1 : M (q) 对 q 是 一 致 正 定 的 , 即 存 在 常 数
μ1, μ2 > 0 ,使得对 ∀q ∈ Rn , μ1In ≤ M (q) ≤ μ2In ; 存 在 c, g > 0 , 使 得 对 任 意 的 q, q , 有 || C(q, q) ||≤ c,|| G(q) ||≤ g ;
关键词 机器人;神经网络;鲁棒控制;仿真
工业机器人控制对象是一个多关节机械手。在实际工程 应用中,机器人系统通常不可避免地存在参数误差、未建模 动态和外界干扰等不确定的因素,因而如何实现机器人大范 围、高速度、高精度的轨迹跟踪控制,一直是机器人动力学 控制的重要问题。然而,它的数学模型相当复杂,是一个运 动学和动力学密切相关的、强耦合、非线性的多变量时变系 统。传统的机器人控制是在求得机器人的数学模型之后采用 经典的或现代控制方法进行控制。然而机器人模型的不确定 性和大量复杂严格的数学计算使得这种传统的方法在实际中 很难实现。
性质 2:对 ∀q ∈ Rn ,矩阵 M (q) − 2C(q, q) 是反对
称阵;
性质 3:扰动力矩τ d 有界,即存在常数 dB > 0 ,使得 ||τ d ||≤ dB 。
1.2 函数连接神经网络(FLNN 神经网路)
FLNN 网络是一种两层的前馈网络[7]。其网络输出的数
学表达式为
y = W Tφ( p)
其中W = Wˆ − W0 ,且
f (q,q,qd,qd) =[M(qd)−M(q)]qd +[C(qd,qd)−C(q,q)]qd +[G(qd)−G(q)]+[FVqd −FVq] 为了得到系统稳定性,我们需要下面的引理[3]。
引理 设对 t ≥ 0 ,U (t) 是为变量 t 的一致连续实函数,
t→∞ 0
t→∞
lim || r ||= 0 。并且由经网络的调节规则可得对任意的 t ≥ 0 ,
t →∞
有||W (t) ||≤ ω 。
3 数值实验
为了验证设计的控制算法的有效性,本文给出一个两关
节机械手的仿真。该机械手的动力学模型和参数的取值参看
文献[7]。
设期望轨迹为 qd = [0.1sin(π t) 0.2 cos(π t)]T ,初始状态 为 q(0) = [0.5 − 0.5]T , q(0) = [0.1 0.1]T 。 网 络 输 入 为 y = [1, qdT , qdT , qdT ]T , φ( y) = (1/1+ exp(⋅),",1/1+ exp(⋅))T7×1 , 为
∫ 并且积分, lim tU (τ )dτ < ∞ ,则 limU (t) = 0 。
t→∞ 0
t→∞
定理:若控制 u 输入选取为(6),对某个 ω > 0 ,神经网
络权重调解法则为

=
⎪⎧−Fφ( y)r(t)T ⎨
⎪⎩ 0
||Wˆ ||< ω ||Wˆ ||≥ ω
其中,F 为对角正定阵。鲁棒项 ρ 选取为
经验与交流
计算机与信息技术
·77·
机器人鲁棒神经网络控制与仿真
倪元华
(曲阜师范大学 数学科学学院 山东省 曲阜市 273165)
摘 要 对于具有外界扰动和参数不确定性的机器人关节角轨迹跟踪问题,本文给出一个新的鲁棒神经网络控制算法。
受 Bayard(1988)和 Sun(2001)工作的启发,用一个 FLNN 神经网络去学习一个已知的函数,同时,为了解决因神经网络隐层神
经元输出持续激励(PE)性质的丢失而可能造成的参数飘移问题,与大量在文献中使用的神经网络权重调节法则 σ -修正方法
不同,本文给出了一个新的调节法则。基于此权重调节法则的鲁棒神经网络控制器既可保证网络权重有界从而克服了参数飘 移问题,又能得到系统跟踪误差渐近收敛到零。数值试验表明,所提算法可行有效。
ρ
=
⎧−(ε ⎪⎪⎨−[ε
N N
+ dB + dB
+ +
2cqB2 )r 2cqB2 +
/
|| r || n (ωB
+ ω)]r
/
||
r
||
⎪ ⎪⎩
0
r ≠ 0,||Wˆ ||< ω r ≠ 0,|| Wˆ ||≥ ω r=0
其中,n 为隐层神经元的个数,那么当初值满足
经验与交流
计算机与信息技术
·79·
那么当
||
r(0)
||
+
||
WV(0≤) |−|≤l1l1||,
|| Wˆ r ||2
(0)
||≤
ω
,有
令 U (t) = l1 || r ||2 , 因 U 有 界 , 故 U (t) 一 致 连 续 , 并 且
∫ lim tU (τ )dτ < ∞ , 由 引 理 可 得 limU (t) = 0 , 从 而
节法则 σ -修正方法不同,本文给出了一个新的调节法则。
稳定性分析得到虑化误差 r(t) (因而跟踪误差 e(t) )渐近趋向
于 0,同时保持神经网络权重矩阵Wˆ (t) 有界。数值仿真表明 所提算法可行有效。 1 预备知识 1.1 机器人模型
图 1 PUMA-560 机器人 上图为在实验室中大量存在的 PUMA-560 两关节机器
基函数向量,隐层神经元数为 7,输出层神经元数为 2,权重
初始化为零,且调节法则中的学习参数 F = 5I7 。扰动力矩
选取为τ d = [q1q1 cos(10q2 ) + q2 q2q2 cos(10q1) + q1] 。选取反
馈增益矩阵 K = 100,ω = 50 。则我们可以得到下面的数
和 逼 近 误 差 界 εN > 0 , 可 选 取 基 函 数 φ ( y) = (1/1 + exp(⋅),",1/1 + exp(⋅))Tn×1 和权重矩阵 W0
满足
M(qd )qd +C(qd ,qd )qd +G(qd ) + Fdqd =W0Tφ(y) +ε(y),∀y∈S
相关主题