题目最优控制方法在直线二级倒立摆中的应用目录摘要 (1)前言 (3)1倒立摆的研究 (3)1.1 倒立摆的研究背景 (4)1.2倒立摆的控制方法 (3)2 二级倒立摆系统控制机理 (6)2.1系统描述 (6)2.2 二级倒立摆系统强迫运动的描述 (8)2.3 二级倒立摆系统的控制规律 (8)3直线二级倒立摆的建模 (9)3.1 建模条件 (10)3.2 利用力学建模 (11)3.3利用拉格朗日方程建模 (14)4 最优控制器的设计与调节 (18)4.1 最优控制理论概述 (18)4.2 应用软件MATLAB的简介 (21)4.3LQR控制器的设计与调节 (22)4.3.1 LQR控制器的设计 (22)4.3.2 加入增益的LQR控制器的调节 (27)4.4连续系统的离散化仿真设计 (28)5 最优控制法与极点配置法的比较 (31)5.1 极点配置法的基本原理 (31)5.2 配置极点并与最优控制法比较 (33)6总结 (38)致谢 (39)参考文献 (40)附录 (41)最优控制方法在直线二级倒立摆中的应用摘要:倒立摆系统以其自身的不稳定性而难以控制, 也因此成为自动控制实验中验证控制策略优劣的极好的实验装置。
本文介绍了直线二级倒立摆的控制机理,详细的分析了直线二级倒立摆的建模过程。
并且对最优控制理论和MATLAB做了简单的介绍,针对系统设计了最优控制器,并与极点配置法进行了比较。
结果表明最优控制器对于二级倒立摆系统有着很好的控制能力。
关键词:二级倒立摆;LQR;极点配置;MATLABThe application of Optimal Control onDouble Inverted PendulumStudent:QIN Kai-yangSupervisor:Y AN Juan-juan(College of Electrical Engineering &InformationTechnology, China Three Gorges University)Abstract:Inverted pendulum system is difficult to control because of its instability. It becomes the wonderful experiment device to verify how about the control strategy in automatic control experiment. The text introduced the mechanism of the double inverted pendulum. It simply introduced optimal control theory and the software of Matlab. The double inverted pendulum is modeled and the controller is designed by using optimal control theory. The simulating results show that quadratic optimal control has the ability to control the representative nonlinear instability system.Key words:Double Inverted Pendulum;LQR;MATLAB;Pole ConfigurationMethod前言倒立摆系统是一个典型的非线性、不稳定的被控对象,它作为现代控制理论或教学的实验装置是非常典型的。
倒立摆系统的控制问题被公认为控制理论中的一个典型问题,许多新的实时控制理论都通过倒立摆控制实验来加以验证。
对于倒立摆的控制有很多方法,如果把倒立摆的非线性模型线性化处理,设计系统的线性控制器,就是线性理论的控制方法,,但这类方法仅能实现对低级的倒立摆系统的控制,当摆数达三级甚至四级时误差就很大,无法实现控制,此时人们又发展到非线性的多变量控制。
这种控制方法包括预测控制和变结构控制法。
此外还有智能控制方法,它包括:神经网络控制,模糊控制,拟人智能控制,仿人智能控制,云模型控制,鲁棒控制方法。
在如此多的控制方法中,本文将就最优控制方法在直线二级倒立摆中的应用进行探讨。
最优控制理论是现代控制理论中的重要内容,近几十年的研究与应用使最优控制理论成为现代控制论中的一大分支。
由于计算机的发展已使过去认为不能实现的计算成为很容易的事,所以最优控制的思想和方法已在工程技术实践中得到越来越广泛的应用。
应用最优控制理论和方法可以在严密的数学基础上找出满足一定性能优化要求的系统最优控制律,这种控制律可以是时间t的显式函数,也可以是系统状态反馈或系统输出反馈的反馈律。
常用的最优化求解方法有变分法、最大值原理以及动态规划法等。
本文主要采用线性二次型最优设计方法设计直线二级倒立摆的LQR控制器。
LQR控制器性能指标易于分析、处理和计算,而且通过线性二次型最优设计方法得到的倒立摆系统具有较好的动态特性以及能够获得线性反馈结构等优点,因而在实际的倒立摆控制系统设计中得到了广泛的应用。
但是在使用该方法时,最优控制的效果取决于确定的加权矩阵Q 和R,另外为了满足实际需要还应对系统进行进一步调节。
通过直线二级倒立摆LQR 最优控制系统设计与研究,并从实际控制效果出发,确定加权矩阵Q 和R,并加入增益反馈矩阵进行调节,这就是该文的基本观点。
1 倒立摆的研究在控制理论发展的过程中,某一理论的正确性及实际应用中的可行性需要一个按其理论设计的控制器去控制一个典型对象来验证。
倒立摆就是这样一个被控制对象倒立摆系统是一个多变量、快速、非线性和自然不稳定系统,在控制过程中能有效地反映控制中的许多关键问题,如非线性问题、系统的鲁棒性问题、随动问题镇定问题及跟踪问题等。
倒立摆系统作为一个实验装置,形象直观,结构简单构件组成参数和形状易于改变,成本低廉。
倒立摆系统的控制效果可以通过其稳定性直观地体现,也可以通过摆杆角度、小车位移和稳定时间直接度量。
其实验效果直观、显著。
当新的控制理论与方法出现后,可以用倒立摆对其正确性和实用性加以物理验证,并对各种方法进行快捷、有效、生动的比较。
早在60 年代人们就开始了对倒立摆系统的研究,1966 年Schaefer Cannon 应用Bang-Bang控制理论,将一个曲轴稳定于倒置位置。
在60 年代后期,作为一个典型的不稳定、严重非线性证例提出了倒立摆的概念,并用其检验控制方法对不稳定、非线性和快速性系统的控制能力受到世界各国许多科学家的重视,从而用不同的控制方法控制不同类型的倒立摆成为具有挑战性的课题之一。
倒立摆的种类很多,有悬挂式倒立摆平行倒立摆环形倒立摆;平面倒立摆的级数可以是一级、二级、三级、四级乃至多级;倒立摆的运动轨道可以是水平的,还可以是倾斜的(这对实际机器人的步行稳定控制研究更有意义);控制电机可以是单电机也可以是多级电机。
1.1 倒立摆研究的背景倒立摆的研究具有重要的工程背景:(1) 机器人的站立与行走类似双倒立摆系统,尽管第一台机器人在美国问世至今已有三十年的历史,机器人的关键技术——机器人的行走控制至今仍未能很好解决。
(2) 在火箭等飞行器的飞行过程中,为了保持其正确的姿态,要不断进行实时控制。
(3) 通信卫星在预先计算好的轨道和确定的位置上运行的同时,要保持其稳定的姿态使卫星天线一直指向地球,使它的太阳能电池板一直指向太阳。
(4) 侦察卫星中摄像机的轻微抖动会对摄像的图像质量产生很大的影响,为了提高摄像的质量,必须能自动地保持伺服云台的稳定消除震动。
(5) 为防止单级火箭在拐弯时断裂而诞生的柔性火箭(多级火箭),其飞行姿态的控制也可以用多级倒立摆系统进行研究。
由于倒立摆系统与双足机器人、火箭飞行控制和各类伺服云台稳定有很大相似性,因此对倒立摆控制机理的研究具有重要的理论和实践意义。
1.2 倒立摆系统的控制方法对倒立摆这样的一个典型被控对象进行研究,无论在理论上和方法上都具有重要意义。
不仅由于其级数增加而产生的控制难度是对人类控制能力的有力挑战,更重要的是实现其控制稳定的过程中不断发现新的控制方法、探索新的控制理论,并进而将新的控制方法应用到更广泛的受控对象中。
各种控制理论和方法都可以在这里得以充分实践,并且可以促成相互间的有机结合。
当前倒立摆的控制方法可分为以下几类:(1) 线性理论控制方法将倒立摆系统的非线性模型进行近似线性化处理,获得系统在平衡点附近的线性化模型,然后再利用各种线性系统控制器设计方法,得到期望的控制器。
PID 控制、状态反馈控制、LQ 控制算法是其典型代表。
这类方法对一二级的倒立摆(线性化后误差较小模型较简单)控制时,可以解决常规倒立摆的稳定控制问题。
但对于像非线性较强、模型较复杂的多变量系统(三四级以及多级倒立摆)线性系统设计方法的局限性就十分明显,这就要求采用更有效的方法来进行合理的设计。
(2) 预测控制和变结构控制方法由于线性控制理论与倒立摆系统多变量、非线性之间的矛盾使人们意识到针对多变量非线性对象,采用具有非线性特性的多变量控制解决多变量、非线性系统的必由之路。
人们先后开展了预测控制、变结构控制和自适应控制的研究。
预测控制是一种优化控制方法,强调的实模型的功能而不是结构。
变结构控制是一种非连续控制,可将控制对象从任意位置控制到滑动曲面上仍然保持系统的稳定性和鲁棒性,但是系统存在颤抖。
预测控制、变结构控制和自适应控制在理论上有较好的控制效果,但由于控制方法复杂成本也高不易在快速变化的系统上实时实现。
(3) 智能控制方法在倒立摆系统中用到的智能控制方法主要有神经网络控制模糊控制仿人智能控制拟人智能控制和云模型控制等。
1)神经网络控制神经网络能够任意充分地逼近复杂的非线性关系,NN 能够学习与适应严重不确定性系统的动态特性,所有定量或定性的信息都等势分布贮存于网络内的各种神经元,故有很强的鲁棒性和容错性;也可将Q 学习算法和BP神经网络有效结合,实现状态未离散化的倒立摆的无模型学习控制,但是神经网络控制方法存在的主要问题是缺乏一种专门适合于控制问题的动态神经网络,而且多层网络的层数、隐层神经元的数量、激发函数类型的选择缺乏指导性原则等。
2)模糊控制经典的模糊控制器利用模糊集合理论将专家知识或操作人员经验形成的语言规则直接转化为自动控制策略(通常是专家模糊规则查询标),其设计不依靠对象精确的数学模型,而是利用其语言知识模型进行设计和修正控制算法。
常规的模糊控制器的设计方法有很大的局限性,首先难以建立一组比较完善的多维模糊控制规则,即使能凑成这样一组不完整的粗糙的模糊控制规则,其控制效果也是难以保证的。