单级倒立摆系统的分析与设计小组成员:武锦张东瀛杨姣李邦志胡友辉一.倒立摆系统简介倒立摆系统是一个典型的高阶次、多变量、不稳定和强耦合的非线性系统。
由于它的行为与火箭飞行以及两足机器人行走有很大的相似性,因而对其研究具有重大的理论和实践意义。
由于倒立摆系统本身所具有的上述特点,使它成为人们深入学习、研究和证实各种控制理论有效性的实验系统。
单级倒立摆系统(Simple Inverted Pendulum System)是一种广泛应用的物理模型,其结构和飞机着陆、火箭飞行及机器人的关节运动等有很多相似之处,因而对倒立摆系统平衡的控制方法在航空及机器人等领域有着广泛的用途,倒立摆控制理论产生的方法和技术将在半导体及精密仪器加工、机器入技术、导弹拦截控制系统、航空器对接控制技术等方面具有广阔的开发利用前景。
倒立摆仿真或实物控制实验是控制领域中用来检验某种控制理论或方法的典型方案。
最初研究开始于二十世纪50年代,单级倒立摆可以看作是一个火箭模型,相比之下二阶倒立摆就复杂得多。
1972年,Sturgen等采用线性模拟电路实现了对二级倒立摆的控制。
目前,一级倒立摆控制的仿真或实物系统已广泛用于教学。
二.系统建模1.单级倒立摆系统的物理模型图1:单级倒立摆系统的物理模型单级倒立摆系统是如下的物理模型:在惯性参考系下的光滑水平平面上,放置一个可以在平行于纸面方向左右自由移动的小车(cart ),一根刚性的摆杆(pendulum leg )通过其末端的一个不计摩擦的固定连接点(flex Joint )与小车相连构成一个倒立摆。
倒立摆和小车共同构成了单级倒立摆系统。
倒立摆可以在平行于纸面180°的范围内自由摆动。
倒立摆控制系统的目的是使倒立摆在外力的摄动下摆杆仍然保持竖直向上状态。
在小车静止的状态下,由于受到重力的作用,倒立摆的稳定性在摆杆受到微小的摄动时就会发生不可逆转的破坏而使倒立摆无法复位,这时必须使小车在平行于纸面的方向通过位移产生相应的加速度。
依照惯性参考系下的牛顿力学原理,作用力与物体位移对时间的二阶导数存在线性关系,单级倒立摆系统是一个非线性系统。
各个参数的物理意义为:M — 小车的质量 m — 倒立摆的质量F — 作用到小车上的水平驱动力L — 倒立摆的长度 x — 小车的位置 θ— 某一时刻摆角整个倒立摆系统就受到重力、驱动力和摩擦阻力的三个外力的共同作用。
这里,驱动力F 是由连接小车的传动装置提供,控制倒立摆的稳定实际上就是依靠控制驱动力F 使小车在水平面上做与倒立摆运动相关的特定运动。
为了简化模型以利于仿真,假设小车与导轨以及摆杆与小车铰链之间的摩擦均为0。
2.单级倒立摆系统的数学模型令小车的水平位移为x ,运动速度为v ,加速度a 。
小车的动能为212kc E Mx =,选择特定的参考平面使得小车的势能为0。
摆杆的长度为L ,某时刻摆角为θ,在摆杆上与固定连接点距离为q (0<q<l )的位置处取一质量为△m 的质元,则有sin cos m m x x q y q θθ=+⎧⎨=⎩ 该质元的动能为:2222211()(2cos )22km m m E m x y m x q x q θθθ=+=++ 势能为:cos p m E m g q θ=⋅⋅ , 其中 m dq ρ=⋅,ρ是摆杆的线密度 则系统的总动能可以通过对和从0到L 积分获得:2220111()cos 226lk kc k m E E E dq M m x ml x ml θθθ=+=+++⎰ 01cos 2l p p m E E dq mgl θ==⎰ 其中小车的动能和势能为: 212kc E Mx = , 0pc E = 系统的拉格朗日方程可写为:2221111()cos cos 2262k p L E E M m x ml x ml mgl θθθθ=-=+++- 由欧拉—拉格朗日方程: d L L F dt x x ∂∂-=∂∂ , 0d L L dt θθ∂∂-=∂∂ 可以确定摆杆的运动方程: 211222111232()cos sin cos sin 0m M x ml ml F ml x ml mgl θθθθθθθ⎧++⋅-⋅=⎪⎨+-=⎪⎩为避免复杂的求解微分方程的运算,考虑摆角在θ=0附近的微小变化,倒立摆在垂直位置可以近似为:cos θ≈1,sin θ≈0,运动方程可简化为:1221132()()()0m M x ml F t ml ml x g θθθ⎧++=⎪⇒⎨+-=⎪⎩ 令所有作用力、位移与角度参数为时间t 的函数,则2()[()()]t F t m M x mlθ=-+ 2[()()]()032l ml F t m M x x g θ-++-= ∴ 43()()44mg x F t t m M m M θ=-++ 22()43()[()()]44m M mg F t F t t ml ml m M m M θθ+=--++ 66()()()(4)(4)g m M F t t l m M l m M θ+=-+++ 将转换后的线性系统用两个2阶微分方程描述,系统的状态矢量为:令(,,,),()T x x x f F t θθ== ,则状态方程描述为: x Ax Bf y Cx=+⎧⎨=⎩ 将相关参数带入,得到010006()6000(4)(4)()000103400044g m M l m M l m M f t x x mgm M m M ⎡⎤⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥+⎢⎥⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥++⎢⎥⎢⎥⎢⎥⎢⎥=+⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎢⎥⎢⎥++⎣⎦⎣⎦01006()000(4)000130004g m M l m M A mgm M ⎡⎤⎢⎥+⎢⎥+⎢⎥=⎢⎥⎢⎥⎢⎥-⎢⎥+⎣⎦ 06(4)044l m M B m M ⎡⎤⎢⎥⎢⎥-+⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥+⎣⎦10000010C ⎡⎤=⎢⎥⎣⎦三. 控制对象的初步分析倒立摆系统的基本数据:M ——小车质量2Kgm ——摆杆质量0.5KgL ——摆杆长度 0.5m得到系统的状态方程如下:100034.5882000 1.4118000101.72940000.4706u x x x x θ⎡⎤θ⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥θ-θ⎢⎥⎢⎥⎢⎥⎢⎥=+⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥-⎢⎥⎣⎦⎣⎦⎣⎦⎣⎦10000010y x x x θθθ⎡⎤⎢⎥⎡⎤⎡⎤⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎢⎥⎣⎦由状态方程可知,系统的开环特征值为:开环系统有极点在右半平面,因此原系统为不稳定系统。
由能控性的定义,根据状态方程x Ax Bu =+^2^3S=[B AB A B A B],rank(S)=4,满秩,所以系统完全能控;由能观性的定义,^2^3T P=[C CA CA CA ],rank(P)=4,满秩,所以系统完全能观。
四.控制器的设计1.控制方案的选取经典控制理论主要采用频域分析方法,能够很好地解决单输入单输出问题。
单级倒立摆系统的控制对象是一个单输入(力)两输出(角度和位移)的非最小相位系统。
根据对系统的力学分析,应用牛顿第二定律,建立小车在水平方向运动和摆杆旋转运动的方程,并进行线性化,拉氏变换,得出传递函数,从而得到零、极点分布情况。
为使闭环系统能稳定工作,需引入适当的反馈,使闭环系统特征方程的根都位于左平面上。
用经典控制理论的频域分析法设计非最小相位系统的控制器不需要十分精确的对象数学模型。
因为只要控制器使系统具有充分大的相位裕量,就能获得系统参数很宽范围内的稳定性。
与经典控制理论相比,现代控制理论有较强的系统性,从分析到设计、综合都有比较完整的理论和方法。
以单级倒立摆为例,这是一个多变量系统,应用最优状态调节器理论和状态观测器理论的控制思想,控制器采用线性定常状态反馈和观测器的结构。
控制对象(小车、摆杆)分别由传感器检测出两个位置量,然后由观测器重构系统状态,通过状态反馈,组成一个闭环系统,使不稳定系统变为稳定系统,系统的瞬态和静态性能良好。
此外,很多文献介绍了基于输出反馈的PID控制系统,但其控制效果不理想,主要原因是系统的高阶次和多变量。
以及基于模糊神经网络的倒立摆控制系统,该方法由于模糊神经网络系统的自适应能力,有效地克服了系统存在的非线性和不确定性,但该方法过分依赖人直接控制被控对象的经验。
这里我们结合《最优控制》课程的学习,选用基于状态空间设计法的LQR 最优调节器,较好地兼顾了系统的稳定性和快速性,应用实例说明了该方法的有效性。
对倒立摆系统进行控制的目的是:(1)通过状态反馈变不稳定系统为稳定系统;(2)使系统的瞬态和静态性能良好,系统的调节过程迅速,振荡不要太大。
由前面的分析可知,单级倒立摆系统是不稳定的,但系统的状态是完全可控和可观的。
根据线性系统控制理论,倒立摆经过适当的状态反馈后,所得到的闭环系统是可以稳定的,并且反馈所需的全部状态可以用状态观测器重构。
具体选择控制器方案时要考虑:在保证达到上述控制目标的前提下,控制器的设计和结构尽可能简单,容易实现。
控制器设计方案如下:(1) 应用确定性系统的控制理论,该系统为确定性系统;(2) 控制规律采用线性定常状态反馈,反馈增益由LQR 调节器理论算出;(3) 采用状态观测器重构系统状态。
2.最优调节器设计线性定常系统的状态反馈增益可由闭环系统的极点配置来确定,也可由最优控制理论计算获得,这里采用后一种方法。
单级倒立摆控制对象模型是一个单输入、双输出系统,它的状态方程为: x Ax Bu =+设状态反馈调节器的形式为u(k)=-K x(k),1T K R B P -=通过使性能指标函数T T 0J=x (k)Qx(k)+u (k)Ru(k)∞⎰ 为最小,其中,(1) Q 为4*4对称半正定矩阵,R 是标量,R>0(2) 矩阵P 是Riccati 代数方程10T T PA A P PBR B P Q -+-+=的唯一正定解。
图2:最优调节器设计3.状态观测器的设计采用状态反馈可以更好地改善系统的动态性能指标,然而在实际的控制系统中,并不是所有的状态变量都能够方便测量。
龙伯格状态观测器利用控制对象杜输入变量u 和输出变量y 对系统的状态变量x 进行估计,从而解决某些状态变量不能直接测量的问题,为实现状态反馈提供了可能性。
龙伯格状态观测器的状态方程为:(*)x A G C x Bu Gy =-++式中,u ,y 是系统可测量的输入与输出x 是待观测杜状态变量的估计值可见,观测器的实现,关键是确定未知矩阵G已验证系统是完全能观的,故先化为能观标准型,再进行设计。
按照状态观测理论,求得矩阵G =0033.58820001.72941⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦图3:观测器结构子图4.二次型性能指标中加权矩阵Q,R 的选择考虑简单情形,把对状态偏差的加权矩阵Q 选为对角矩阵,1234i Q=diag(q ,q ,q ,q ),q 0≥i q 表示对状态i x 平方的加权,i q 越大表示i x 的偏差在性能指标中占的比重越大,为使倒立摆稳定,认为摆杆的偏差比小车的偏差影响要小,加权系数取小些。