当前位置:文档之家› 迭代学习控制

迭代学习控制


基本原理
输入变量(控 制量)
输出变量 期望轨迹
误差
通过对被控系统进行控制尝试,以输出信号与给定目标的偏差修正不理想的控制信号, 使得系统的跟踪性能得以提高。新的控制量存入存储器,刷新旧控制量;在施加控制时,需从 存储器中取出控制量。可以看到迭代学习控制算法可利用的信息要多余常规的反馈控制算法。
目标
迭代学习神经网络对非线性系统的控制可 使未知的非线性特性能被线性参数化渐近 仿真模型描述出来。对照早期的全球网络 或本地网络,例如 RBF 神经网络在规定空 间内分布的神经元,给出了一个独立的神 经网络在时间轴上的轨迹。因而,通过迭 代学习控制,轨迹上的每一点的跟踪性能 通过多次跟踪相同轨迹能得到改善。且在 设计中,每一个本地神经系统网络的学习 是独立的。这种结构,使部分学习变成可 能。在很多情况中部分学习是非常有用的。
谢谢大家
应用效果
选取系统参数 m 10kg , l 2.5m, J m
4 1 ml 2 , s ml 。取系统输出为 y (t) x2 (2 sint) ,设理想输 3 5
PD 型 迭 代 学 习 控 制 律
出 为 yd (t) t t 2 , 取 x1 (0) 0, x 2 (0) 0, u1 (t) 1 , 选 取 开 闭 环
强化优势
针对粉碎机生产过程,分析了磨机生产工况变化造成的负荷特 性的非线性,提出将模糊控制与迭代学习控制相结合用于这一 生产过程的控制方法,它克服了常规PID控制中难以适应负荷 特性的非线性,不能及时克服系统扰动等缺陷。实验表明,系 统的稳态精度和动态性能都得到了改善。
在注塑机控 制中的应用
最优迭代学习控制应用于注塑机这样存在干扰和具有不确定初 始设定值的场合,可以使系统达到较好的鲁棒性,并且保证系 统的收敛性,从而使系统取得较好的效果。
Part 3
在生产机械中的 应用
在生产机械中的应用
在机械压力 机滑块位置 控制中的应 用: 强化优势
压力机气动系统具有很强的非线性和时滞性,且很难建立精确 的数学模型,而压力机滑块位置的调整具有反复性,因此适合 采用迭代学习法进行控制,采用适当的迭代算法控制滑块停止 位置,可以减少调整次数,提高定位精度。
(t) 角度 (t) 与角速度
控制 u (t)
Part 2
在机器人中的应 用
由于机器人是高度的非线性、强耦合的动力学系统,而且在许多情况 下系统的动力学模型是未知的,或者不是完全己知的,因此利用传统 的控制理论很难实现对机器人的高精度跟踪控制。近年来,迭代学习 控制理论由于在不精确已知受控对象动力学特性的情形下具有综合结 构简单、在线计算量小等特点,因此受到了控制界的广泛关注,人们 针对各种机器人系统的跟踪控制提出了相应的有效算法。
状态空间方程
考虑单关节机器人系统,其动态系统模型为
(t) sgsin(q(t))= f(t) J mq
其中 f (t) 为作用于节点的力矩, g 为重力加速度,q(t) 为力臂旋转角度,令
x2 , u(t) f(t) q x1 , q
则系统可描述为
1 0 x2 x 1 u 1 x2 J m sg sin x1 J m
Part 4
与其他先进控制 技术的结合
加快迭代学习的学习速度一直是人们追寻 的目标,为了使收敛速率最高,人们运用 最优方法寻找最优学习律,将最优控制与 迭代学习控制相结合,具有加快学习速度, 提高鲁棒性等优点。 迭代学习控制主要问题之一是鲁棒 性问题,即实际动态过程中存在着各种 不确定的扰动、偏差。 由于被控过程的非线性、高阶次、 时变性以及随机干扰等因素,造成模糊 控制规则或者粗糙或者不完善,而且模 糊控制规则是基于人为经验,更决定其 存在不完善的地方,这些都会不同程度 地影响控制结果。 将迭代学习控制及模糊控制相结合 以弥补相结合,既提高了鲁棒性又保证 了精度。
管理指导
与最优 化原则 相结合
与模糊控 制相结合
变结构控制可以保证控制系统在时间轴方向的收敛性,对系统参数和外部扰动的不变性 是其突出的优点,而它的一个明显的缺点是系统存在颤抖。这一明显缺点是由于采用不 连续切换控制规律,系统状态会产生高频颤动,颤动的出现是变结构控制应用中的突出 障碍,它将影响控制的精确性,因此系统的精度不高。因此.考虑把迭代学习和滑模变 结构控制方法二者结合起来,设计出一种新的控制方法,使二者充分发挥各自的优点, 抑制缺点,使系统控制既保持较高的精度,又具有较强的鲁棒性。 管理指导
在倒立摆控制 上的应用
闭环D型迭代学习控制
01
取闭环 D 型学习控制算法:
k 1 (t) uk (t) x k 1 (t) uk 1 (t) u k (t) e
闭环D型 迭代学习 控制
倒立摆示意图
03 04
状态空间方程
其对应的微分方程为:
1 x2 x mwl 1 2 g sin x1 sin x1 cos(x1x 2 ) u cos x1 mw m p mw m p x2 mwl 3 l cos 2 x1 4 mw m p
实现有限区间上的完全跟踪任务,希望实现被控系统的输出零误差地完 全跟踪期望轨迹
具有重复运动特征的被控系统,具有较强的非线性耦合、较高的位置重复精 度、难以建模和高精度轨迹跟踪控制要求的动力学系统
使用范围
勤奋务实
在倒立摆控制 上的应用
在机器人 中的应用
在生产机械 中的应用
与其他先进控制 技术的结合
Part 1
迭代学习控制(ILC)的应用
某某某
目录
01
应用
简单介绍
02
03
总结
提出
人们在研究高速运动的工业机械手的控制问题时,提出了这样一个思想:不断重复一个同样轨
迹的控制尝试,并以此修正控制律,可能可以得到非常好的控制效果。Arimoto等人于1984年
正式提出了迭代学习控制(iterative learning control,简称ILC)方法。
数学描述
考虑重复运行的动力系统如下表示:
k (t) f(x k (t), u k (t), t) x yk (t) g(x k (t), u k (t), t)
其中: xk 为系统的第 k 次运行的状态; yk 为输出变量; uk 为输入变量(控制量) 输出误差: ek (t) yd (t) yk (t) 学习律: uk 1 (t) L(u k (t), ek (t)) ( yd (t) 为期望轨迹)
与滑模变 结构控制 相结合
与神经网 络控制相 结合
总结
迭代学习的优点: 可以保证控制系统在重复运行方向的收敛性,算法非常简单,精度很高,可以达到以任意精度跟踪给 定。 迭代学习的缺点:
主要问题之一是鲁棒性问题,虽然已从理论上严格地证明了稳定的充分性条件,但条件与动态过程参
数有关,且实际动态过程中 存在着各种不确定的扰动、偏差。
x1 x2
其中
应用效果
0 ,设初始状态为 倒立摆控制的任务是施加控制 u ,在一时间区间上倒摆杆稳定直立,即 0,
x1 (0)=0.5, mw 3kg , m p 2kg , l 0.6m x (0)=5.0, 2
初始控制为 u0 (0)=0, t 0, 20 取 5,8 ,经过 3 次学习后,倒立摆在 t 0, 20 s 内保持稳定,其状态角 与控制 u 见图:
u ff ,k 1 (t) u k (t) h ff 1 (ek (t))
反馈控制器为
u fb,k (t)= h fb (ek (t))
开闭环 PD 型迭代学习控制律为
uk 1 (t) u ff ,k 1 (t) u fb , k (t) k (t) L d (t) e k 1 (t) u k (t) L p (t) e k (t) L p (t) e k 1 (t) L d (t) e
针对单自由度机器人这样一类非线性时变系统讨论一种同时利用比例 和微分作用的开闭环PD型迭代学习律。
开闭环PD型迭代学习控制
由于开环迭代学习控制只利用了系统前次运行的信息, 而忽略了系统当前的信息, 使得系统对被
控制对象无镇定作用, 闭环迭代学习控制往往又需要高增益反馈从而影响了系统迭代收敛速度。 同时 利用开闭环的 PD 型迭代学习控制律,使其在单自由度机器人系统中取得良好的应用效果。 前馈控制器采用开环学习律
Ld 100, Lp 50
开闭环PD型迭代学习误差曲线
应用效果
采用开闭环PD型学习律的的输出曲线
采用开闭环P型学习律的输出曲线
运用开闭环 P 型理论,系统在迭代至少 17 次后才逐渐实现跟踪期望输出的目的,因而开闭环 PD 型迭代学习控制在运行速度、有效性等方面更具有一定的优越性和可行性。
自我补课 在丝杆运动 误差控制中 的应用:
迭代学习控制策略结构与算法简单,參数便于确定,容易实现, 不需要对误差进行显式建模,通过学习既能对丝杠运动误差进 行预报,又能获取丝杠运动误差特性缓慢变化的信息,从而始 终超细 粉碎机生产 过程中的应 用
相关主题