倒立摆控制Johnny Lam 摘要: 倒立摆沿着水平轨道车移动时的平衡问题是控制领域中的经典问题。
本文将介绍两种方法,使系在小车上的倒立摆从初始向下位置摆到直立位置,并保持该状态。
通过非线性启发式控制器和能量控制器,可以使倒立摆摆向直立位置。
倒立摆摆动起来后,通过线性二次型调节器的状态反馈最优控制器维持其平衡状态。
在合适的时间,启发式控制器输出一个重复信号,然后通过微调使摆锤到达最合适的位置。
通过能量控制器增加合适的能量到倒立摆系统,来达到所期望的能量状态。
最优状态反馈控制器是基于各地的直立位置线性模型一个稳定的控制器,它在车摆系统接近平衡状态时能产生效果。
这两种方法都在倒立摆摆在向下位置时记录实验结果。
1.简介倒立摆系统是在控制系统领域中的一个标准问题。
在证明线性控制的思想上它经常常是很有效的,例如使不稳定的系统的稳定化等。
由于该系统本质上是非线性的,它也一直在说明一些结论在非线性控制方面也是有效的。
在这个系统中,倒立摆附着到配备有马达驱动的沿水平轨道行驶的小车上。
用户能够通过电机来控制小车的位置和速度还能通过轨道来控制小车在水平方向上运动。
传感器被连接到小车和小车的中心上来测量小车的位置和钟摆关节的角度。
测量采用连接到MultiQ - 3通用数据采集和控制电路板上的正交编码器。
Matlab / Simulink用于实现控制和分析数据。
倒立摆系统本身有两个平衡点,其中之一是稳定的,而另一个是不稳定的。
稳定平衡对应于一个状态,其中摆锤向下。
在没有任何外力的情况下,该系统会自然返回到这个状态。
稳定平衡不需控制输入来实现,因此,从控制的角度来看是没有意义的。
不稳定的平衡对应于另一个状态,其中摆点完全向上,因此,需要控制输入力的大小,来保持在这个位置。
倒立摆系统的基本控制目标是使倒立摆在不稳定平衡位置上平衡。
该项目的控制目标将侧重于从稳定的平衡位置(摆朝下)起,摆动到它的不稳定的平衡位置(直立摆),并保持在这种状态。
2.建模倒立摆的示意图如图1所示:图1.倒立摆安装小车上的电机使得小车沿水平方向运动,而小车的位置p和关节角θ测量是通过一个正交编码器拍摄的。
运用动力学规律对倒立摆系统建立如下运动方程:其中Mc是小车的质量,Mp是摆锤的质量,I是转动惯量,l是摆锤的一半长度,R是电动机的电枢电阻,r是电动机小齿轮的半径,Km为电机的转矩常数, KG是齿轮箱传动比。
另外,为了简单起见,并注意,对电机来说,力F和电压V间的关系是:让所述状态向量被定义为:最后,我们使有关不稳定平衡(0 0 0 0)T的系统线性化。
在垂直位置的车摆系统的线性化方程是:而:最后,通过代入相对应本实验装置的参数值:该系统使我们能够设计一个能通过控制器使各线性化点平衡的倒立摆。
3.稳定控制器的设计在这个项目中,该控制器的设计可以分为两个部分。
其中第一部分是线性模型中的最优状态反馈控制器的设计,它可以使倒立摆稳定在直立位置。
第二部分是控制器的设计,它可以使倒立摆动到不稳定平衡的位置。
当摆锤接近线性化点时,控制器将切换到稳定控制器,使倒立摆在直立位置平衡。
负责倒立摆在直立位置平衡的状态反馈控制器是基于通过线性化系统设计的线性二次型调节器(LQR)来设计的。
在LQR设计中,遵循线性状态反馈控制律u=-Kx的增益矩阵K是可以找到的最小化形式的二次价值函数。
其中Q和R是在某些状态或控制输入时要去除的加权参数。
在最优状态反馈控制器的设计中,选择的加权参数为:根据这个设计,控制器增益矩阵线性化系统为:通过使用K并且遵循控制律u=-Kx,该系统在线性化点(摆锤直立)上是稳定的。
由于该控制律是基于线性化系统时,当摆接近直立位置,状态反馈最优控制器是唯一有效的。
4.状态估计对于倒立摆实验装置,并非所有的状态变量都可用于测量。
事实上,只有小车位置p和摆锤角度θ可以用于直接测量。
这意味着在刚刚超越任何稳定控制的方案中,小车速度和摆角速度都不可立即使用。
因此,观察者需要在所有车摆的位置的状态提供准确的估计。
基于前面得到的线性系统,可以使用线性全状态观测器。
在这种设计中,观察器只需提供在所有状态中的线性化点的准确估计。
观察器通过重复实施线性系统动力学规律,并在修正项中加入估计上的错误收益。
该观测器增益矩阵是由LQR设计决定的,类似于用于确定最佳状态的增益反馈状态控制器。
在这种情况下,加权参数选择为:基于这种设计,观测器增益矩阵是:由于线性全状态观测器是基于线性化系统,当车摆系统接近直立位置,估计状态变量时,它是唯一有效的。
因此,当系统不接近不稳定的平衡位置时,低通滤波后的参数是用来估计两个不可测状态小车速度和摆锤角速度的。
此方法近似于车速度和摆角速度通过使用有限差,然后通过低通滤波器传递给它。
下面的过滤器是选择了这种估计方法:用这样的方法存在的问题是,它引入了一些延迟而且具有比1稍小的增益。
但是,从过滤后的参数获得的状态估计对于本文实现的摆起控制器是相当准确的。
5.摆起控制器设计要使倒立摆从向下位置摆动到垂直位置,可以通过两种不同的控制方案来实现。
第一是一种启发式控制器,它在适当方向上提供恒定电压来驱动小车沿轨道来回反复。
它会重持续个命令,直到摆锤足够接近直立位置,使稳定控制器可以使其保持这种平衡的状态。
第二个方案是一种调节摆锤能量的控制器。
控制器持续输入能量到车摆系统,直到它达到对应于在垂直位置摆的能量状态。
类似于启发式控制方法,当倒立摆接近垂直位置时,能量控制方法也将切换到稳定控制器。
当摆锤与垂直位置夹角小于5°或者角速度大于每秒 2.5弧度时,稳定控制器的开关将被激活。
启发式控制器启发式控制器是基于逻辑的控制设计,根据系统的状态来确定推车移动的方向和时刻。
基于反复试验的结果,一个特定的电压增益应用到小车电机。
每当摆锤穿过向下的位置,该控制器将驱动倒立摆向前或向后摆动。
这个以逻辑为基础的控制设计是完全依赖于摆角的。
当摆锤穿过向下位置时,该控制器将改变车的运动方向。
由于这种控制的设计是基于摆角这个唯一参数,要通过在适当的方向移动小车来增加能量到摆锤,那么向下的位置是最佳的时刻。
摆锤穿过向下位置后,车移动的方向立即变为与摆角相反的方向。
当小车运动的方向是确定的,在小车马达上施加同一方向上的恒定的电压增益,直至摆锤返回到向下的位置。
这种控制方案将有效地控制小车沿轨道来回反复,直到摆锤摆动足够接近直立位置。
要注意,该控制方案的本质是不管摆锤是否高于或低于该水平轴施加(自摆角的符号保持不变),小车都要有相同的运动。
然而车摆系统的本质是一旦摆锤低于水平增加能量到车摆时,实际上相同的车运动会从摆锤中带走能量。
最终,钟摆会达到一个无法吸收更多能量的点,但它尚未积累足够的能量到达垂直位置。
为了避免这种现象,当车摆与向下位置夹角为135°,需增加一个开关来使输入到小车马达电压为0。
因此,当车摆超过135度时,小车不会需要从车摆系统吸收能量来移动。
这将能使车摆返回到向下位置,而不会失去能量。
当摆锤再次穿过向下位置时,基于逻辑的控制器将能够把更多的能量加到摆锤,使它能够最终接近垂直位置。
这种控制方案的电压增益是由反复实验确定。
车摆需要摆动至其直立位置和电压增益的幅度之间有直接的关系。
增益太高可能使摆接近垂直位置有太高的速度导致稳定控制器无法平衡摆。
另一方面,增益太低可能无法提供足够的能量使摆到达垂直位置。
另外,控制器在执行任务的可靠性会因为所选择的增益而变化。
因此,需要反复实验来微调增益,使钟摆到达直立位置时具有适当的速度并且以较高成功率和合理的时间到达。
能量控制器通过控制系统中的能量也可使摆锤从向下位置摆动起来。
通过使用反馈控制,车摆系统中的能量可以被控制到所希望的值。
通过添加对应于直立位置时的能量,摆锤能够摆动到它的不稳定平衡的位置。
当摆锤接近直立位置,前面设计的稳定控制器可以驱动车摆并且使它在不稳定平衡的位置上平衡。
该系统的能量E在直立位置上是零。
摆锤的能量可以写成:并且:Mp是摆的质量,l为摆的半长,g是重力加速度,而I是转动惯量。
因此,该摆锤的能量是基于摆角和摆角速度的函数。
还要注意的是,钟摆对应于向下的位置的能量是 - 2mpgl。
该控制方案的目标是补充能量进入系统,直到该值等于摆在直立位置时的能量。
满足以下方程来达到所需的能量其中,k是一个设计参数,E0是所需的能量。
该控制输出a是枢转的加速度,可以通过使用等式(4)来转换为一个输入到小车中电动机电压,方程为:在该控制方案中,satV函数被定义为提供给小车的饱和电压值。
在任何时候,该控制器基本上采用摆角和摆角速度来确定车应该移动的方向。
仍需要一个随着需要达到能量状态的能量来缩放比例控制器来决定施加于电动机车的电压。
在satV参数中V的值决定了可用控制信号的最大值并因此增加了摆系统能量的最大值。
k的值决定了为达到所需的能量状态的最大控制输入端。
对摆锤的能量增加至所需值来说,这种控制是有效的。
当被用作一个摆起控制方法时,其期望的值对应于摆锤在其直立位置的能量。
此时开关将被触发,从而使稳定控制器可以用来驱动摆并且使它在不稳定平衡点平衡。
6.实验结果结果是从两个摆起控制方法的实验中收集的。
数据是从实验的每个控制方案中钟摆在最初向下位置,垂直位置和各不稳定平衡点平衡各处中收集的。
通过提供3.26V电压来微调启发式控制器使车摆摆动。
通过恒定电压增益反复试验表明,稳定控制器在车摆摆到直立位置使其保持平衡状态在约75 %的时间方面是成功的。
实验运行的启发式控制器在控制器输出的情况如图2所示:图2.控制启发式控制器输出的情况要注意的是,摆起控制器需要约12.5秒到达直立位置。
该稳定控制器清晰地捕捉到摆在直立位置的点。
此外,输出到小车马达上的电压在3.26 V和-3.26V之间,并且通过摆角来确定。
在不到7秒时间内,摆角从向下位置超出135°,控制输出也开始输出从0 V逐渐增大。
因此,钟摆需要大约另外 5.5s,超越向下位置135°(在5 °的垂直位置之内)。
图3为摆角对应的标绘图。
略微增加摆动的摆角直到摆锤接近它的不稳定的平衡。
该控制器需要大约13次改变使摆足够接近的直立位置从而稳定控制器可以驱动它。
其中稳定的控制器被激活是很明显的一点。
另外,一旦被激活,摆角仍然在平衡位置上相当稳定。
图3. 启发式控制器的摆锤角度的情况能量控制器的所述设计参数中k选择为6.5。
另外,比如在摆锤系统的摩擦和在方程(18)作出近似的结果,所需的能量弥补到一个比0略高的值。
可以通过实验来确定适当的偏移量。
在这些实验中,偏移被提升到E0 =0.70。
反复试验表明,该控制器在至少90%的时间内是可靠的。
实验运行中使用该能量控制器中的控制器输出标绘图如图4:图4. 能量控制器的控制输出的情况值得注意的是,能量控制需要大约10秒到达竖直位置。