[工学]现代控制理论论文.doc

资源描述

《[工学]现代控制理论论文.doc》由会员分享，可在线阅读，更多相关《[工学]现代控制理论论文.doc（38页珍藏版）》请在三一办公上搜索。

1、最优控制方法及其应用最优控制方法及其应用摘要：主要阐述了关于最优控制问题的基本概念，最优控制是最优化方法的一个应用。最优化一般可以分为最优设计、最优计划、最优管理和最优控制四个方面。而最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科，解决最优控制问题的主要方法有变分法、极大值原理和动态规划。常使用到的主要有时间最短控制问题和线性二次型最优控制问题等。通过以上知识的了解和应用可以使初学者能够快速掌握最优控制的问题。关键字：最优化最优控制极值时间最优控制线性二次型目录第一章最优控制的基础41.1 最优控制理论41.2 最优控制问题的一般形式51.3 最优控制方法6第

2、二章变分法72.1 变分法基础72.2 变分法应用7第三章极大值原理103.1 极大值原理的提出和形式10 3.2 极大值原理的应用11第四章动态规划方法13 4.1 动态规划概念及意义134.2 动态规划算法的基本思想和结构134.3 动态规划算法的运用14第五章时间最优控制问题16第六章线性二次型最优控制问题206.1 线性二次型最优控制问题的提出206.2 应用MATLAB求解二次型最优控制问题（实验部分）22第七章关于倒立摆的最优控制34结束语39参考文献39第一章最优控制的基础 1.1 最优控制理论最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科。它

3、是现代控制理论的重要组成部分。最优控制是最优化方法的一个应用，如果想了解最优控制必须知道什么是最优化方法。所谓最优化方法为了达到最优化目的所提出的各种求解方法。从数学意义上说，最优化方法是一种求极值的方法，即在一组约束为等式或不等式的条件下，使系统的目标函数达到极值，即最大值或最小值。从经济意义上说，是在一定的人力、物力和财力资源条件下，使经济效果达到最大（如产值、利润），或者在完成规定的生产或经济任务下，使投入的人力、物力和财力等资源为最少。最优控制是现代控制理论的核心，它研究的主要问题是：在满足一定约束条件下，寻求最优控制策略，使得性能指标取极大值或极小值。这方面的开创性工作主要是由贝尔曼

4、（R.E.Bellman）提出的动态规划和庞特里亚金等人提出的最大值原理。从数学上看，确定最优控制问题可以表述为：在运动方程和允许控制范围的约束下，对以控制函数和运动状态为变量的性能指标函数（称为泛函）求取极值（极大值或极小值）。解决最优控制问题的主要方法有古典变分法（对泛函求极值的一种数学方法）、极大值原理和动态规划。最优控制已被应用于综合和设计最速控制系统、最省燃料控制系统、最小能耗控制系统、线性调节器等。Pontryagin 的最大值原理、Bellman 的动态规划方法和Kalman 的最优线性调节器的理论被公认为现代控制理论的三大里程碑，这些奠基性的成果标志着最优控制理论的正

5、式诞生。1 最优控制理论是经典变分学在现代的新发展，其研究基础涉及函数论、拓扑学、泛函分析、微分方程、变分学等多个数学分支的知识。时而至今，最优控制理论的研究无论在深度和广度上都有了很大的发展，例如对分布参数系统，随即系统，大系统的最优控制理论的研究等等。 1.2 最优控制问题的一般形式假设一个控制系统的状态方程、控制域U、控制函数类以及某些约束条件均已给定，且相应的容许控制类Uad.记全体容许对所成的集合为Aad. 任一映射 JAad；R 称为该控制系统的一个指标泛函。对于含有时滞的系统，在选取或设计指标泛函J时，有时也需要根据问题的实际意义将时滞因素考虑在内。最优控制问题就是：对于给定

6、的指标泛函J，寻求适当的 y,u Aad ,使得 Jy,u=Jinf Jy,u|y,uAad. （1.2.1）如果这样的容许对 y,u 存在，则称该最优控制问题有解；称满足（1.2.1）的任一个容许对y,u 为最优控制问题的一个最优对，其中的u 称为该最优控制问题的一个解或最优控制，y 称为该最优控制问题的一条最优轨线。1控制问题就是针对给定的控制系统和约束条件研究控制函数的不同选择对于系统某些方面的影响，例如系统是否稳定、是否能控、能观或能稳、是否存在某类反馈控制、在某种标准下是否能达到最优等，而且指出了明确的研究目的，才能说给定了一个控制问题。一般说来，在研究控制系统时，我们还需要将一些其

7、他的附加因素考虑在内，这些因素往往是由具体问题的实际背景或理论研究的必要前提确定的。最优控制应用举例：火车快速运行问题。设有一列火车从甲地出发，要求算出容许的控制使其到达乙地的时间最短。火车的运动方程 mx=ut (1.2.2) 式中，m 是火车的质量，x是火车的加速度。为使旅客舒适，其值有限制。ut是产生加速度的控制作用，其值也应有限制，设 |ut|M (1.2.3)初始条件 xt0=x0 xt0=0 (1.2.4) 中断条件 xtf=xf xtf=0 （1.2.5）性能指标 Ju=t0tfdt=tf-t0 (1.2.6)选择ut使得 Ju为最小。 1.3 最优控制方法解决最优控制问题的主

8、要方法有古典变分法（对泛函求极值的一种数学方法）、极大值原理和动态规划。研究最优控制问题有力的数学工具是变分理论，而经典变分理论只能够解决控制无约束的问题，但是工程实践中的问题大多是控制有约束的问题，因此出现了现代变分理论。现代变分理论中最常用的有两种方法。一种是动态规划法，另一种是极小值原理。它们都能够很好的解决控制有闭集约束的变分问题。值得指出的是，动态规划法和极小值原理实质上都属于解析法。此外，变分法、线性二次型控制法也属于解决最优控制问题的解析法。最优控制问题的研究方法除了解析法外，还包括数值计算法和梯度型法。第二章变分法 2.1 变分法基础变分法（calculus of vari

9、ations）是处理函数的函数的数学领域，和处理数的函数的普通微积分相对。譬如，这样的泛函可以通过未知函数的积分和它的导数来构造。变分法最终寻求的是极值函数：它们使得泛函取得极大或极小值。有些曲线上的经典问题采用这种形式表达：一个例子是最速降线，在重力作用下一个粒子沿着该路径可以在最短时间从点A到达不直接在它底下的一点B。在所有从A到B的曲线中必须极小化代表下降时间的表达式。变分法的关键定理是欧拉拉格朗日方程。它对应于泛函的临界点。在寻找函数的极大和极小值时，在一个解附近的微小变化的分析给出一阶的一个近似。它不能分辨是找到了最大值或者最小值（或者都不是）。变分法在理论物理中非常重要：在拉格

10、朗日力学中，以及在最小作用原理在量子力学的应用中。变分法提供了有限元方法的数学基础，它是求解边界值问题的强有力工具。它们也在材料学中研究材料平衡中大量使用。而在纯数学中的例子有，黎曼在调和函数中使用狄利克雷原理。同样的材料可以出现在不同的标题中，例如希尔伯特空间技术，莫尔斯理论，或者辛几何。变分一词用于所有极值泛函问题。微分几何中的测地线的研究是很显然的变分性质的领域。极小曲面（肥皂泡）上也有很多研究工，称为Plateau问题。最优控制的理论是变分法的一个推广。 2.2 变分法应用如果变量J 对于某一函数类中的每一个函数xt,都有一个确定的值与之对应，那么就称变量J 为依赖于函数xt的泛函

11、，记为：J=Jxt。 (2.2.1)xt Rn, JR 函数 xt tx泛函 Jxt xtJ；xt又称为泛函的宗量，也可以理解为“函数的函数”说明：泛函是映射，是从函数空间到数域的映射。泛函的自变量是函数，泛函的自变量称为泛函的宗量。容许函数空间是满足泛函的规定条件的宗量的全体所构成的函数空间。求函数的极值时，微分或导数起着重要的作用。求泛函的极值时，变分起着类似的作用。我们将求泛函的极值问题称为变分问题，其相应的方法称为变分法。特别是对无约束的最优控制，通常用变分法求解。2泛函的变分（相当于函数的微分） (2.2.2) (2.2.3) (2.2.4)由于泛函J所依赖的函数总要受到受控系统状态

12、方程的约束，应用拉格朗日乘子法，将有约束泛函极值问题转化为无约束的泛函极值问题。这是引入哈密顿函数的拉格朗日型最优控制问题。 (2.2.7) (2.2.8) (2.2.9) (2.2.10)2、求解最优控制的步骤第三章极大值原理 3.1 极大值原理的提出和形式为了解决古典变分法在求解最优控制问题中所暴露出来的一些无法避免的问题，许多学者进行了各种探索，其中以苏联学者 Pontryagin 的最大值原理于美国学者贝尔曼的动态规划较为成功，应用也比较广泛，现已经成为求解最优控制问题的强有力的工具。极大值原理的基本形式对于定常系统的最优控制问题的极大值原理可表述如下：如果最优控制问题的数学模型为

13、：受控系统 Xt=fXt,Ut,t (3.1.1)其初态 xt0=x0， tt0,tf (3.1.2)目标集 g1xtf=0 , g2xtf0 (3.1.3)容许控制 uU性能指标反映和评价系统性能优劣的指标。性能指标的形式由实际问题来决定,通常有两种类型:表示系统在末时刻状态的性能指标称为末值型性能指标，记为 Sxtf,tf。在这里，设性能指标为 JXt= Sxtf JXt 为控制函数的泛函 (3.1.4)末时刻 tf自由则U*(t)为最优控制, X*(t)为最优轨线和 tf为最优的末时刻的必要条件有五项。3 X*t 满足方程 X*=fx*,u*, x*t0=x0, tt0,tf* (3

14、.1.5) t 满足方程 =-Hx*,u*,x (3.1.6)式中 Hx*,u*,=Ttfx,u 称为给定问题的哈密顿函数，Tt为t的转置。t称为状态xt的伴随状态，而其方程称为伴随方程。tf满足方程 tf= -0Sx*tfx-g1x*tfx-g2x*tfx (3.1.7)式中00为标量,和为向量，它们是不全为零的待定量，且有 g2x*tf=0，通常称此条件为横截条件。 u*(t) 满足条件 Hx*,u*,=umaxHx*,u*, (3.1.8) 确定tf 的方程为 Hx*t,u*t,*t=Hx*tf,u*tf,*tf=0 (3.1.9) 3.2 极大值原理的应用极大值原理是对古典变分法的

15、发展。它不仅可以用来求解函数Ut不受约束或只受开集性约束的最优控制问题，而且也可以用来求解控制函数Ut受到闭集性约束条件的最优控制问题。这就意味着极大值原理放宽了对控制问题Ut的要求。极大值原理没有提出哈密顿函数H对控制函数Ut的可微性的要求，因此，其应用条件进一步也放宽了。由极大值原理求得的最优控制Ut使得哈密顿函数H达到全局、绝对最大值，而古典变分法的极值条件HU=0所得的解是H的局部、相对最大值或驻值。因此，极大值原理将古典变分法求解最优控制问题的极值条件作为一个特例概括在自己之中。极大值原理是最优控制问题的必要条件，并非充分条件。也就是说，由极大值原理所求的的解能否使性能泛函J达到

16、极小值，还需要进一步分析与判定。但是，如果根据物理意义已经能够断定给定所讨论的最优控制问题的解是存在的，而极大值原理所得到的解只有一个，那么，该解就是最优解。实际上，我们遇到的问题往往就是属于这种情况。1利用极大值原理和古典变分法求解最优控制问题时，出来控制方程的形式不同之外，其余条件是相同的。一般来说，根据极大值原理确定最优控制U*(t)和最优轨线X*(t)仍然需要求解两点边界值问题。极大值原理一般由对偶方程、非平凡性条件、横截条件和最大值条件几部分构成。对于不同类型的最优控制问题，其对偶方程、横截条件等形式也将不同，从而其极大值原理的表述形式也将不同。其中有：半线性发展系统的最大值原理、拟

17、线性时滞抛物系统的最大值原理以及约束最大值原理等。2一般型最优控制问题的极大值原理分为终端时刻固定，终端状态自由和受限两种。在此就不一一举例进行运用说明。第四章动态规划方法 4.1 动态规划概念及意义动态规划(dynamic programming)是运筹学的一个分支，是求解决策过程(decision process)最优化的数学方法。20世纪50年代初美国数学家R.E.Bellman等人在研究多阶段决策过程(multistep decision process)的优化问题时，提出了著名的最优化原理(principle of optimality)，把多阶段过程转化为一系列单阶段问题，利用各

18、阶段之间的关系，逐个求解，创立了解决这类过程优化问题的新方法动态规划。1957年出版了他的名著Dynamic Programming，这是该领域的第一本著作。动态规划问世以来，在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题，用动态规划方法比用其它方法求解更为方便。虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题，但是一些与时间无关的静态规划(如线性规划、非线性规划)，只要人为地引进时间因素，把它视为多阶段决策过程，也可以用动态规划方法方便地求解。 4.2 动态规划算法的基本思想和结构动态规划算法通常用于求解

19、具有某种最优性质的问题。在这类问题中，可能会有许多可行解。每一个解都对应于一个值，我们希望找到具有最优值的解。动态规划算法与分治法类似，其基本思想也是将待求解问题分解成若干个子问题，先求解子问题，然后从这些子问题的解得到原问题的解。与分治法不同的是，适合于用动态规划求解的问题，经分解得到子问题往往不是互相独立的。若用分治法来解这类问题，则分解得到的子问题数目太多，有些子问题被重复计算了很多次。如果我们能够保存已解决的子问题的答案，而在需要时再找出已求得的答案，这样就可以避免大量的重复计算，节省时间。我们可以用一个表来记录所有已解的子问题的答案。不管该子问题以后是否被用到，只要它被计算过，就将其

20、结果填入表中。这就是动态规划法的基本思路。具体的动态规划算法多种多样，但它们具有相同的填表格式。动态规划程序设计是对解最优化问题的一种途径、一种方法，而不是一种特殊算法。不像前面所述的那些搜索或数值计算那样，具有一个标准的数学表达式和明确清晰的解题方法。动态规划程序设计往往是针对一种最优化问题，由于各种问题的性质不同，确定最优解的条件也互不相同，因而动态规划的设计方法对不同的问题，有各具特色的解题方法，而不存在一种万能的动态规划，可以解决各类最优化问题。因此在学习时，除了要对基本概念和方法正确理解外，必须具体问题具体分析处理，以丰富的想象力去建立模型，用创造性的技巧去求解。根据上例分析和动态规

21、划的基本概念，可以得到动态规划的基本模型如下： (1)确定问题的决策对象。 (2)对决策过程划分阶段。 (3)对各阶段确定状态变量。 (4)根据状态变量确定费用函数和目标函数。 (5)建立各阶段状态变量的转移过程，确定状态转移方程。 4 4.3 动态规划算法的运用任何思想方法都有一定的局限性，超出了特定条件，它就失去了作用。同样，动态规划也并不是万能的。适用动态规划的问题必须满足最优化原理和无后效性。 1.最优化原理（最优子结构性质）最优化原理可这样阐述：一个最优化策略具有这样的性质，不论过去状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略。简而言之，一个最优化策略

22、的子策略总是最优的。一个问题满足最优化原理又称其具有最优子结构性质。 2.无后向性将各阶段按照一定的次序排列好之后，对于某个给定的阶段状态，它以前各阶段的状态无法直接影响它未来的决策，而只能通过当前的这个状态。换句话说，每个状态都是过去历史的一个完整总结。这就是无后向性，又称为无后效性。 3.子问题的重叠性动态规划将原来具有指数级复杂度的搜索算法改进成了具有多项式时间的算法。其中的关键在于解决冗余，这是动态规划算法的根本目的。动态规划实质上是一种以空间换时间的技术，它在实现的过程中，不得不存储产生过程中的各种状态，所以它的空间复杂度要大于其它的算法。 2在编程中，动态规划常用解决最长公共

23、子序列问题、矩阵连乘问题、凸多边形最优三角剖分问题、电路布线等问题。给你一个数字三角形, 形式如下:12 34 5 67 8 9 10找出从第一层到最后一层的一条路,使得所经过的权值之和最小或者最大.无论对与新手还是老手，这都是再熟悉不过的题了，很容易地，我们写出状态转移方程：f(i, j)=ai, j + minf(i+1, j)，f(i+1, j + 1) 对于动态规划算法解决这个问题，我们根据状态转移方程和状态转移方向，比较容易地写出动态规划的循环表示方法。但是，当状态和转移非常复杂的时候，也许写出循环式的动态规划就不是那么简单了。解决方法：我们尝试从正面的思路去分析问题，如上例，不难

24、得出一个非常简单的递归过程 : F1:=fi-1,j+1; f2:=fi-1,j;if f1f2 then f:=f1+ai,j else f:=f2+ai,j;显而易见，这个算法就是最简单的搜索算法。时间复杂度为2n，明显是会超时的。分析一下搜索的过程，实际上，很多调用都是不必要的，也就是把产生过的最优状态，又产生了一次。为了避免浪费，很显然，我们存放一个opt数组：Opti, j 每产生一个f(i, j)，将f(i, j) 的值放入opt中，以后再次调用到f(i, j) 的时候，直接从opti, j 来取就可以了。于是动态规划的状态转移方程被直观地表示出来了，这样节省了思维的难度，减少了编

25、程的技巧，而运行时间只是相差常数的复杂度，避免了动态规划状态转移先后的问题，而且在相当多的情况下，递归算法能更好地避免浪费，在比赛中是非常实用的.第五章时间最优控制问题最大值原理也叫做快速时间最优控制原理，它是研究满足约束条件下获得允许控制的方法。用最大值原理可以设计出控制变量只在|ut|1范围内取值的时间最优控制系统。而在工程上，设|ut|1都只取1两个值，而且依照一定法则加以切换，使系统从一个初始状态转到另一个状态所经历的过渡过程时间最短，这种类型的最优切换系统，称为开关控制（Bang-Bang控制或砰砰控制）系统。在这类控制形式中，根据系统的运动状况，最优控制的各个控制变量在整个过程中

26、分段地取为容许控制范围的正最大值或负最大值。砰砰控制的原理是把最优控制问题归结为：将状态空间划分为两个区域，一个区域对应于控制变量取正最大值，另一个区域对应于控制变量取负最大值。这两个区域的分界面称为开关面，而决定砰砰控制的具体形式的关键就是决定开关面。砰砰控制形式的最优控制常用于最速控制系统和最省燃料控制系统。在正常情况下，砰砰控制的控制变量由正最大值跃变到负最大值的次数是有限的，只有在跃变瞬时控制变量可取值于限制范围的任何值（可以参考本学期中所学的开关次数定理）。但对于某些问题，砰砰控制中至少存在一个时间区间，其中控制变量可取为限制范围的任意值，这类问题称为奇异最优控制问题。对于奇异最优控

27、制问题，仅由极大值原理的条件还不足以确定奇异时间区间内的最优控制与最优轨线间的关系即综合控制的形式。在工业控制应用中，最有发展前途的是Bang-Bang控制与反馈控制相结合的系统，这种控制方式在给定值升降时特别有效，具体形式为|ek|=|rk-yk|, Bang-Bang控制， PID控制时间最优位置随动系统，从理论上讲应采用Bang-Bang控制。但Bang-Bang控制很难保证足够高的定位精度，因此对于高精度的快速伺服系统，宜采用Bang-Bang控制和线性控制相结合是方式，在定位线性控制段采用数字PID控制就是可选的方案之一。5假设 tt0U MtRt;t0,y0 （5.1）上式表示系

28、统是从t0,y0到目标M*能控的。定义Ju*Ju*;t0,y0=inftt0| yt;t0,y0,u*Mt .即Ju*;t0,y0 是轨线 yt;t0,y0,u* 首次遇到目标M* 的时间。我们约定inf=+.显然，不同的u*可能会有不同的首次击中时间J t0,y0;u*。我们的问题是：对于给定的t0,y00，+ Rn,假设能控性条件（5.1）成立。寻找u*Ut0，+ 使得 Ju*;t0,y0= u*Ut0，+ inf Ju*;t0,y0 （5.2）上述问题称为时间最优控制问题。而 t= u*Ut0，+ inf Ju*;t0,y0 (5.3)称为最优时间。任何满足等式（6.2）的控制u*Ut

29、0，+ 称为时间最优控制。2在这学期中，我们已经比较简略的学习了四种时间最优控制问题：线性时不变系统的时间最优控制问题，双积分模型时间最优控制，简谐振荡型受控系统的时间最优控制以及时间-燃料最优控制问题。对于线性系统的时间最优控制，我们考虑起来要相对方便一些。相关原理证明主要有关于最优控制的存在性和唯一性以及系统的平凡或奇异判据。其中，Bang-Bang控制原理在解决这一类基本问题，特别是线性时不变系统的时间最优控制时起着重要作用，也是我们学习的重点。对于高于二阶的系统来说，开关控制的开关函数是难以求得的。所以，一般情况下，我们只需要讨论双积分模型的时间最优控制问题。这样，就可以在状态平面上得

30、到开关函数和切换曲线，从而实现状态反馈的闭环最优控制。对于各类问题的证明过程，在此就不再一一重复讲述。仅以一简单例子来反映时间最优控制问题的解决。之后还有对于倒立摆的控制问题也得要灵活运用到时间最优控制方法。例：设H0，讨论把系统 d2xdt2=ut, | ut|1 (5.3)从状态-H，0最快地转移到状态0，0的时间最优控制。我们用最大值原理来分析这一问题，记y=dxdt,我们有 x y =0100 x y + 0 1 ut (5.4)(6.4)的共轭方程是 =-0010 (5.5)解得 t=C1 , t=C2-C1t其中C1 , C2为常数。设u*为所求的时间最优控制。由最大值原理，存在不

31、全为零的常数C1 , C2使得 max-1u1C2-C1tu=C2-C1tut (5.6)从而 ut=sgnC2-C1t (5.7) 由于C2-C1t至多只有一个零点，因此，在几乎处处意义下，最有控制u*只取值为1和-1，而且它至多改变一次符号。如果最优控制线在轨线到达(0,0)前的一段取值为1，状态的相轨线为 L1：y+-2x ,x0 (5.8)且走向是y增加的方向。如果最优控制在轨线到达(0,0)前的一段取值为-1，则状态的相轨线为 L2：y=-2x ,x0 (5.9)且走向是y减少的方向。因此，最优轨线的相轨线必定与L1或L2相交。假如u*在开始时取值为-1，则状态在这一段的相轨线为 L

32、3：y=-2x+H (5.10)的一段。注意到L3不可能与L1或L2相交，最优控制必然在开始时取值为1，此时， L4：y=2x+H (5.11)当L4或L2相交时，u*的值改变为-1，由此可以求出： ut=1 , 当0tH-1 , 当Ht2H (5.12)这里，我们假设初始时刻为0，而最优时间是 t= 2H (5.13) 一般的，令 x,y=1 , 当x,y在L1，L2的下方或L1上-1 , 当x,y在L1，L2的上方或L1上 (5.14)则系统 x y =y x,y 的轨线都是系统（5.3）最快到达（0，0）的最优轨线。这里需要注意的是，尽管在数学上，（5.12）与（5.14）得到的同样都是

33、最优控制。但是（5.14）具有状态反馈形式，在实际应用中将更为有用。特别，利用（5.14）计算最优控制会更具有抗干扰性。在这个例题中，我们利用对开环问题（最优控制问题）的研究结果得到了闭环问题（反馈最优控制问题）的解，也是非常有意义的。6第六章线性二次型最优控制问题 6.1 线性二次型最优控制问题的提出在实际控制系统设计中，为了达到同一个控制目的，往往有多种控制方案，如多输入系统的极点配置状态反馈控制器是不唯一的，而在这些能达到同样设计目的的控制方案中，具有较小控制能量的控制方案更具有实际意义。这种控制能量最小化的要求可以用一个适当的二次型性能指标的最小化来反映。因此，系统性能和控制能量的要

34、求常常可以用一下的二次型性能指标来描述： J=0xTQx+uTRudt （6.1.1）其中的矩阵Q和R是加权矩阵，反映了设计者对状态x和控制u中各分量的重要性的关注程度。3对一个由线性时不变状态空间模型描述的系统和一个给定的二次型性能指标，设计一个控制器，使得闭环系统渐近稳定，且使得二次型性能指标J最小化的问题称为线性二次型最优控制问题。它呈现以下重要特性：性能指标具有鲜明的物理意义。最优解可以写成统一的解析表达式。所得到的最优控制规律是状态变量的反馈形式，便于计算和工程实现。可以兼顾系统性能指标的多方面因素。例如快速性、能量消耗、终端准确性、灵敏度和稳定性等。在理论上，线性二次型最优控制问

35、题是其它许多控制问题的基础，有许多控制问题都可作为线性二次型最优控制问题来处理。线性二次型最优控制问题，在实践上得到了广泛而成功的应用。可以说，线性二次型最优控制问题是现代控制理论及其应用领域中最富有成果的一部分给定线性时变系统的状态方程和输出方程 Xt=AtXt+BtUtYt=CtXt （6.1.2）其中，Xt是n维状态变量，Ut是m维控制变量，Yt是l维输出变量，At是nn时变矩阵，Bt是nm时变矩阵。假设1lmn，Ut不受约束。若Yr(t)表示预期输出变量，它是l维向量，则有 et= Yr(t)Y(t) 称为误差向量。现在的问题是，选择最优控制U*(t)使下列二次型性能指标 J=12eT

36、tfSetf+12t0tfeTtQtet+UTtRtUtdt （6.1.3）为最小，这就是线性二次型最优控制问题。其中S是ll半正定对称常数矩阵，Q(t)是ll半正定对称时变矩阵，R(t)是mm正定对称时变矩阵，终端时间tf是固定的，终端状态X(tf)自由。性能指标（7.1.3）的物理意义：式（7.1.3）中的第一部分 12eTtfSetf称作终端代价，用它来限制终端误差e(tf) ，以保证终端状态X(tf)具有适当的准确性。式（7.1.3）中的第二部分 12t0tfeTtQtet称作过程代价，用它来限制控制过程的误差e(t)，以保证系统响应具有适当的快速性。式（7.1.3）中的第三部分 12

37、t0tfUTtRtUt称作控制代价，用它来限制控制U(t)的幅值及平滑性，以保证系统安全运行。同时，它对限制控制过程的能源消耗也能起到重要的作用，从而保证系统具有适当的节能性。二次型性能指标是一种综合型性能指标。它可以兼顾终端状态的准确性、系统响应的快速性、系统运行的安全性及节能性各方面因素。线性二次型最优控制问题（7.1.2）、（7.1.3）的实质是：用不大的控制能量，来保持较小的输出误差，以达到控制能量和误差综合最优的目的。性能指标由三项组成，若各项出现不同符号，将发生相互抵消的现象。这样，尽管各项单独的数值较大，但J的数值可能很小，性能指标就无法反映各项指标的优劣。为防止出现这种情况，应

38、保证在各种实际运行情况下，无论容许控制如何选择，性能指标中各项的数值始终具有相同的符号。又因是以极小值作为最优标准，结合问题的物理性质，各项符号均取正值。线性二次型最优控制问题的几种特殊情况：a) 状态调节器问题：用不大的控制能量，使系统状态X(t)保持在零值附近b) 输出调节器问题: 用不大的控制能量，使系统输出Y(t)保持在零值附近c) 跟踪问题：用不大的控制量，使系统输出Y(t)紧紧跟随Yr(t)的变化 6.2 应用MATLAB求解二次型最优控制问题实验部分：实验一有限时间状态调节器问题的最优控制MATLAB仿真1、实验知识准备1) 连续系统线性二次型最优控制原理假设线性连续定常系

39、统的状态方程为 : (6.2.1)要寻求控制向量使得二次型目标函数州为最小。式中 ,Q 为半正定实对称常数矩阵 ,R 为正定实对称常数矩阵 ,Q 、 R 分别为和的加权矩阵。根据极值原理 ,我们可以导出最优控制律 :,式中 K 为最优反馈增益矩阵； P 为常值正定矩阵 , 必须满足黎卡提 (Riccati) 代数方程。因此 , 系统设计归结于求解黎卡提 (Riccati) 方程的问题 ,并求出反馈增益矩阵K 。2) 连续系统二次型最优控制的 MATLAB 函数在 MATLAB 工具箱中 , 提供了求解连续系统二次型最优控制的函数 :lqr() 、lqr2() 与lqry() 。其调用格

40、式为 :K,S,E=lqr(A,B,Q,R,N) K,Sl=lqr2(A,B,Q,R,N) K,S,E=lqy(sys,Q,R,N)其中 ,A 为系统的状态矩阵；B 为系统的输出矩阵 :Q 为给定的半正定实对称常数矩阵；R 为给定的正定实对称常数矩阵；N 代表更一般化性能指标中交叉乘积项的加权矩阵；K 为最优反馈增益矩阵;S 为对应 Riccati 方程的惟一正定解 P( 若矩阵 A-BK 是稳定矩阵,则总有正定解P存在 );E 为矩阵 A-BK 的特征值。其中，lqry()函数用于求解二次型状态调节器的特例，是用输出反馈代替状态反馈，即其性能指标为：。这种二次型输出反馈控制叫做次优控制。此外，上述问题要求有解，必须满足三个条件：（1）是稳定的；（2）

展开阅读全文