极小值原理及其应用（17）ppt课件.ppt

资源描述

《极小值原理及其应用（17）ppt课件.ppt》由会员分享，可在线阅读，更多相关《极小值原理及其应用（17）ppt课件.ppt（119页珍藏版）》请在三一办公上搜索。

1、第四章极小值原理及其应用,4.1 经典变分法的局限性,4.2 连续系统的极小值原理,4.3 最短时间控制问题,4.4 最少燃料控制问题,4.5 离散系统的极小值原理,4.6 小结,4.1 经典变分法的局限性,上面我们用经典变分法解最优控制问题时，得出了最优性的必要条件,在得出这个条件时，作了下面的假定：是任意的，即不受限制，它遍及整个向量空间，是一个开集；是存在的。,在实际工程问题中，控制作用常常是有界的。如飞机舵面的偏角有限制，火箭的推力有限制，生产过程中的生产能力有限制等等。一般，我们可用下面的不等式来表示,这时属于一个有界的闭集，写成，为闭集。更一般的情况可用下面的不等式约束

2、来表示。,当属于有界闭集，在边界上取值时，就不是任意的了，因为无法向边界外取值，这时就不一定是最优解的必要条件。考察由图4-1所表示的几种情况，图中横轴上每一点都表示一个标量控制函数，其容许取值范围为。,图4-1有界闭集内函数的几种形状,对于图4-1（a）仍对应最优解。对于图4-1(b) 所对应的解不是最优解，最优解在边界上。对于图4-1（c）常数，由这个方程解不出最优控制来（这种情况称为奇异情况），最优解在边界上。另外，也不一定是存在的。例如状态方程的右端对U的一阶偏导数可能不连续，或由于有些指标函数，如燃料最优控制问题中，具有下面的形式,这时对U的一阶偏导数

3、不连续。,经典变分法无法处理上面的情况，必须另辟新的途径。极小值原理就是解决这类问题的有力工具。用极小值原理求解控制无约束的最优控制问题和古典变分法是完全一样的。1956年前苏联学者庞特里雅金提出这个原理时，把它称为极大值原理，目前较多地采用极小值原理这个名字。,4.2 连续系统的极小值原理,由于可以利用扩充变量的方法将各类最优控制问题化为定常系统，末值型性能指标情况下的标准形式。我们这里只就定常系统、末值型性能指标、固定、末端受约束情况下给出极小值原理的简单证明。,设系统的状态方程为,（4-1）,初始条件为,（4-2）,在本节中，假设函数，，，存在且连续，并假定容许控制是在控制域

4、内取值的任何分段连续函数。这时如果选定了某一容许控制，则容易证明在任意的初始条件下，方程（4-1）唯一的确定了系统状态的变化规律，且是连续的和分段可微的。在这些条件下，我们就定常系统、末值型性能指标、固定、末端受约束情况下给出极小值原理的简单证明。,证明：,采用扰动法，即给最优控制一个变分，它将引起最优轨线的变分，并使性能指标有一增量，当为极小时，必有，由此即可导出最优控制所应满足的必要条件。在变分法中，是微量，即将最优控制和邻近的容许控制相比较，因而最多只能建立哈密顿函数的相对极小值性质。,庞特里亚金极大值原理却将最优控制与控制域内所有可能的值进行比较，因而得出结论，

5、在整个控制域内最优控制使哈密顿函数成为绝对极小值。正是这个性质使得庞特里亚金极大值原理成为寻找最优控制的有力工具。但是这样，的改变量必须看成有限量，而不再是微量。如果让改变的时间很短，则由此引起的最优轨线的改变仍是微量，性能指标的增量也是微量，因而对各关系式的数学处理仍是比较容易的。,设为最优控制，任选一时刻及一微量，在时间间隔中给一有限大小的改变量，且使得。现在研究由引起的最优轨线的变化。分为三段考虑：,2,系统的状态方程（4-1）可在初始条件下直接积分。,当时，当时，,两式相减可得这一段的（4-6）可以对的大小作估计,由于是微量，所以也是微量，因而在

6、精确到一阶微量的情况下，下式成立（4-7）,将式（4-7）代入（4-6），并注意到微量在微小时间间隔上的积分是高阶微量，即得,在第二段时间间隔得终点，则有或（4-8）其中表示二阶以上的微量。,3,这时又有，系统的状态方程为而状态变量的变分满足方程（4-9）,引入变量及哈密顿函数（4-10）（4-11）（4-12）,显然，方程（4-9）和（4-11）为共轭方程，立即求得积分或（4-13）,即最终求得了由于的有限改变而引起的最优轨线的变化，特别是末值状态的变化。,下面研究由引起的最优性能指标的改变量。由于故有（4-14）,综合（4-8）、（4-12）、（4-

7、13）和（4-14）等式，可以建立与有限改变量之间的关系,已知中的任意时刻，并以表示，当时，上式变为，，,或用哈密顿函数的表达式（4-10）表示可得（4-15）或,于是定常系统、末值型性能指标、固定、末端受约束情况下极小值原理得以证明。,庞特里雅金极小值原理写为如下形式：,定理（极小值原理）：,4.2 连续系统的极小值原理,控制向量，并受下面的约束,终端约束,（4-3）,（4-4）,（4-5）,指标函数,要求选择最优控制，使取极小值。取极小值的必要条件是、、和满足下面的一组方程,（协态方程）（4-16）,（状态方程）（4-17）,2 边界条件（4-1

8、8）,3 横截条件（4-19）,4 最优终端时刻条件（4-20）,在最优轨线和最优控制上哈密顿函数取极小值（4-21）,将上面的结果与用古典变分法所得的结果对比可见，只是将这个条件用（4-21）代替，其它无变化。,应该指出，当存在，且得出的绝对极小，如图4-1（a）所示时，即为条件（4-21）式。所以极小值原理可以解决变分法所能解决的问题，还能解决变分法不能解决的问题。如何应用条件（4-21）式，这是一个关键，我们将用具体例子来说明。,4.3 最短时间控制问题,节省时间意味着提高生产率或先发制人取得军事行动的胜利。所以人们很早就开始了对最短时间控制的研究，这方面的研究结果

9、很多，这里先就简单的重积分系统的最短时间控制展开讨论。,例4-1 重积分系统的最短时间控制,状态方程（4-22）,初始条件为,（4-23）,控制约束为（4-25）,求出使性能指标（4-26）取极小的最优控制。,解,因为控制作用有限制（属于有界闭集），故要用极小值原理求解。取哈密顿函数,协态方程为（4-28）（4-29）,（4-27）,积分上面两个方程可得（4-30）（4-31）其中，、是积分常数。,由表达式（4-27）可见，若要选择使取极小，只要使越负越好，而，故当，且与反号时，取极小，即最优控制为,（4-27）,由此可见，最优解取边界值+1或-1，是开关函

10、数的形式。什么时候发生开关转换，将取决于的符号。而由（4-31）式可见，是的线性函数，它有四种可能的形状（见图4-2）,（4-31）,图4-2 与的四种形状,（4-31）,由图4-2可见，当为的线性函数时最多改变一次符号。也相应有四种序列,从上面两式消去t，即可得相轨迹方程（4-33）,当时，状态方程的解为（4-32）,下面来求出取不同值时的状态轨迹（也称为相轨迹）。,当时，状态方程的解为（4-34）消去，可得相轨迹方程,图4-3 相轨迹图,在图4-3中用实线表示，不同的C值可给出一簇曲线。由（4-32）第一式知增大时增大，故相轨迹进行方向是自下而上，如图中曲

11、线上箭头所示。,在图4-3中用虚线表示。因增大时，减少，故相轨迹进行方向是自上而下。,两簇曲线中，每一簇中有一条曲线的半支进入原点。在的曲线簇中，通过原点的曲线方程为（4-36）这半支用表示。,在的曲线簇中，通过原点的曲线方程为（4-37）半支用表示。,和这两个半支通过原点的抛物线称为开关线，其方程为（4-38）,图4-4 最优相轨迹与开关线,当初始状态在开关线左侧，如图4-4中D点，从D点转移到原点，并在转移过程中只允许改变一次符号的唯一途径如图所示，即从D点沿的抛物线移到与相遇，在相遇点改变的符号为，再沿到达原点。因此，只要初始状态在开关线左侧，都沿的

12、抛物线转移到，然后改变符号为，并沿到达原点。同样，当初始状态在开关线右侧，如图4-4中的M点，则先沿的抛物线转移到，然后改变符号为，并沿到达原点。,在图4-4中开关曲线（由和组成）把 - 平面划成两个区域。开关线左侧（图中划阴影线部分）区域用表示，中的点满足则（4-39）,开关线右侧区域用表示，中的点满足则（4-40）,于是最优控制规律可表示为状态的函数，即（4-41）（4-42）根据上面的关系，可以通过非线性的状态反馈来构成。,图4-5 重积分系统时间最优控制的框图,图4-5表示了重积分系统时间最优控制的工程实现。由图可见时，，即满足（4-3

13、9）式；时，，即满足（4-40）式。,图中的继电函数早期是用继电器实现的，由于继电器在动作时有砰砰声，故这种最优控制又称为“砰砰”控制。当然，现在可以用无接触的电子开关或微处理机来实现这种控制规律，既方便、可靠，又无砰砰声了。,例42 积分环节和惯性环节串联系统的最短时间控制,其传递函数为（4-43）,其中为大于零的实数。由（4-43）式可得运动方程为（4-44）,令和为状态变量，并有,（1）对于情形，状态方程为其状态轨线相迹为（4-46）,(a) u=1,图4-6 系统的相轨迹,如图4-6(a)所示，箭头为状态运动方向。它有一条渐近线，如图中虚线所示。在这簇曲线中，只有到

14、达平衡位置0。（4-47）,（2）对于的情形，状态方程为其状态轨线相迹为（4-48）,(b) u= -1,图4-6 系统的相轨迹,如图4-6(b)所示，箭头为状态运动方向。它有一条渐近线，如图中虚线所示。在这簇曲线中，只有到达平衡位置0。（4-49）,将和合并成一条曲线，其方程为（4-50）,于是曲线方程可写为（4-53）,图4-7,系统的时间最优相轨迹和开关线,曲线将相平面分成两部分，如图4-7所示。的上半平面包括记为，的下半平面包括记为，那么（4-54）,由于最优控制只取，它们的切换最多一次，根据状态初始位置不同，它们最优控制是不同的，如图中初始状态在A

15、点时，它属于，所以开始。当运动到达时，与交于a点，马上切换为，以后沿运动直到平衡位置0，再除去控制量。当初始状态在B点时，它属于，最优控制应先取，到达交于b点时，马上切换为，以后沿继续运动，直到平衡位置0，切除控制量。,综上所述，最优控制的状态反馈规律为（4-55）,最短时间最优控制的方框图如图4-8所示，图中虚线部分是最短时间最优控制器。,图4-8,系统的时间最优控制框图,4.4 最少燃料控制问题,在人类的经济活动、军事行动以及其它活动中无时无刻不在消耗着形形色色的燃料，减少燃料消耗，节省能源成了当今世界科研的重要课题。特别在宇宙航行中，所消耗的燃料十分昂贵，而且如

16、果需要的燃料多了，会减少运送的有效载荷（如卫星、空间站等），因此在宇宙航行中最早提出了最少燃料消耗的最优控制问题。一般来说，控制物体运动的推力或力矩的大小，是和单位时间内燃料消耗量成正比的，因而在某一过程中所消耗的燃料总量可用下面的积分指标来表示,其中是单位时间内的燃料消耗量。,值得指出的是，在最少燃料控制问题中，终端时间一般应给定，或者是考虑响应时间和最少燃料的综合最优问题。因为若考虑纯粹的最少燃料控制问题，则将导致系统的响应时间过长，理论上要经过无穷长时间，系统才转移到所要求的状态。这是很显然的，因为燃料消耗得少，推力就小，系统的运动加速度和速度就小。另一方面所指定的时间必须大于同一

17、问题的最短时间控制所解出的最短时间，否则最少燃料控制将会无解。我们还是以重积分系统为例来说明最少燃料控制的解法。,例43 重积分系统的最少燃料控制,系统状态方程（4-56）初始条件（4-57）终端条件（4-58）,控制约束（4-59）求出使性能指标（4-60）取极小的最优控制。,解用极小值原理求解，哈密顿函数为,（4-61）,协态方程为（4-62）,积分上面两个方程可得（4-63）,这里哈密顿函数与最短时间控制的不同，考察的表达式可知，无论为何值，使极小等价于求下式的极小,（4-61）,（4-27）,考察上面的表达式，当时，如，则，故应取；当时，则应取，使

18、，于是可得出使极小的最优控制规律为,（4-64）,（4-65）,（4-66）,（4-67）,注意到上面得到的最优控制规律中前两式确定了可取值0、1，而后两式只确定了的符号，未确定的值。但由的表达式可知，只要就随而线性变化并有图4-2所示四种图形，于是只可能在两个孤立的时刻取得值+1和-1。这两个孤立时刻的值对积分指标的贡献为零，因此我们可不加考虑，而认为只能取值0和1。这说明可用带死区的继电函数描述，如图4-9。和最短时间控制一样，时的状态轨迹为,图4-2 与的四种形状,（4-31）,图4-9 带死区的继电函数,图4-10 最少燃料控制的控制量和相轨迹,（4-68

19、）,（4-69）,在图4-10中用实线表示。时的状态轨迹为（4-69）在图4-10中用虚线表示。,最少燃料控制的特点是可取零值。当，由状态方程可求得（4-70）状态轨迹为水平线，在图4-10中用点划线表示。当时，水平线向右移动，时，水平线向左移动。,若初始状态是第一象限内的点A，则从图4-10状态轨迹的运动方向可知，引向原点的轨迹有下面几种（见图4-11）：,图4-11最少燃料控制的相轨迹,1 沿ABO到达原点，对应的控制序列为。这是最少燃料控制，但因为在BO段（即），故到达原点的时间为无穷大，不能满足给定值的要求。,2 沿ADO到达原点，对应的控制序列为。这是最

20、短时间控制的轨迹，到达原点时间将小于给定的，但它不是最少燃料控制。,3 沿ACEO到达原点。其中C点和E点坐标待定，以满足给定的终端时刻。这是满足终端时刻要求的最少燃料控制。,设初始点A的时刻为 ,坐标为；到达C点的时刻为，坐标为，到E点的时刻为，坐标为；到达原点的时刻为。AC段对应，CE段，EO段，由积分状态方程（4-56）可得,（4-56）,（4-56）,（4-73）,（4-74）,（4-56）,由（4-75）、（4-76）两式消去，再考虑（4-73）式可得（4-77）,（4-73）,（4-76）,（4-75）,（4-78）,（4-74）,由（4-71）、（4

21、-72）两式得,：,（4-71）,（4-72）,（4-80）,（4-79）,由（4-78）、（4-79）两式得,将（4-81）代入（4-74）式得,（4-78）,（4-79）,（4-81）,（4-74）,再利用（4-77）和（4-80）式，即得,由上式解出（4-82）,（4-77）,（4-80）,这里必须保证为实数，并在上式中选择正确的加减号。为了使为实数，必须有,这说明，若规定小于最短时间（使上式等于零的值），最少燃料控制是无解的。,为了选择正确的加、减号，应注意有下面的关系,即，由（4-81）式可得,于是从（4-82）式可知，应选择加号，即,（4-83）,（4-81）,（4-8

22、2）,将上式代入（4-78）和（4-79）式可得（4-84）,（4-78）,（4-79）,（4-85）,（4-83）,这样，我们就完全可以确定转换点C和E的坐标。由图4-11可见E点的坐标处在开关线上，可按最短时间控制一样的方式来构成反馈控制。C点坐标由式（4-80）和（4-83）给出，由此二式可见，它们取决于和、。当给定时，还要给定一个初始条件，譬如，才能从此二式消去得到下面的C点轨迹曲线（在图4-12中用来表示）,（4-80）,（4-83）,当、可取各种值时，开关曲线将取决于初始条件，这在工程实现上是不方便的。,最后，我们要强调指出，规定了终端时刻，最少燃料的控

23、制量不仅可取边界值，而且还可取零值，对重积分系统来讲，系统有加速段，减速段和等速运行段。而最短时间控制系统只有加速和减速段。以飞机为例，从一个城市以规定的时间飞到另一城市且使燃料消耗为最少的策略是，作一段加速飞行，作一段等速滑翔飞行，再作一段减速飞行，而且规定的时间要足够大，否则最少燃料问题是无解的。,图4-12 满足终端时刻要求的最少燃料控制的相轨迹,4.5 离散系统的极小值原理,在现实世界中有些系统本身是离散的，要用离散的状态方程来加以描述。有些系统本身虽是连续的，但采用计算机控制，控制量只在离散的时刻算出来，设计这类系统时，连续对象的状态方程要进行离散化。下面就来讨论离散系统的极小

24、值原理。问题的提法如下：,系统的状态方程为（4-86）为维向量，为维向量。上式右端在一般情况下是和的非线性函数。,初始条件为（4-87）终端约束为（4-88）是维向量方程。,性能指标为（4-89）要求确定控制序列，，1，，使最小。下面按控制向量受约束和不受约束两种情况来讨论。,（一）控制向量无约束,这时可用古典变分法求解。作增广性能指标,（4-90）,式中，是协态向量（维），是拉格朗日乘子向量（ q 维）,引入下面的哈密顿函数（4-91）,并令（4-92）,则（4-93）,上式中。由于初始条件给定，故。根据以及，，的任意性，可推导出最

25、优控制序列应满足的必要条件：,正则方程（4-95）（4-96）,横截条件（4-97）控制方程（4-98）初始条件（4-99）,所得结果与连续系统类似，但应注意协态方程（4-95）的右侧无负号。从上面的一组方程可知，我们已知初始条件，又从横截条件可求出，这样得出了离散非线性两点边值问题，求解一般是困难的。,（二）控制向量有约束。,这时一般不成立。根据极小值原理，哈密顿函数在最优控制序列上取极小值，即,例44,系统的状态方程为（4-100）,无约束，指标函数为（4-101）,用离散极小值原理求最优控制，使取极小。,解哈密顿函数为（4-102）协态方程为（4-103

26、）即协态为常数。,横截条件为（4-104）控制方程为（4-105）（4-106）,因协态为常数，故控制也是常数，令（4-107）,现在来解系统的状态方程，由初始条件可得（4-108）（4-109）,因为（4-110）故（4-111）,于是最优控制为（4-112）,代入系统状态方程，可求得最优状态为（4-113）,例4-5,则状态方程为（4-114）,方程右端对是非线性的。这里表示加热器级数，是空间离散变量，但在求解时与时间离散问题一样。,边界条件为（4-115）性能指标是使换热总面积最小，即（4-116）最小。,解这里无约束，可用变分法求解。作哈密顿函数,（

27、4-117）协态方程为即（4-118）,控制方程为即（4-119）,由上式求出比求容易，故解得（4-120）将（4-120）式代入协态方程（4-118），消去，得（4-121）,由状态方程（4-114）可解出（4-122）令，由上式可得（4-123）,将（4-122）、（4-123）代入（4-121），消去，可得（4-124）,（4-124）式是关于的非线性差分方程，若已知和就可递推求出，故从终端向后递推比较方便。已知，但不知，只能先假定一个，由（4-124）算出；再循环用（4-124）可依次递推求得，，。若最后求出的等于或很接近于给定的初始

28、条件，则这组序列就是最优状态轨迹；否则另取再重算，直到，这组序列就是最优状态轨迹。把代入式（4-122）就可求出最优控制序列。,从上面的说明可知，我们要反复试凑以满足的边界条件，这是非线性两点边值问题所引起的。这里因为的初始和终端条件都给定，我们采用的解题技巧是消去协态量，直接解。,4.6 小结,1、极小值原理是对经典变分法的扩展，它可以解决经典变分法无法解决的最优控制问题。也就是当控制有约束（控制变量属于一个有界闭集，可表示为或），哈密顿函数对不可微时，要用极小值原理。,2、极小值原理所得出的最优控制必要条件与变分法所得的条件的差别，仅在于用哈密顿函数在最优控制

29、上取值的条件代替，而后者可作为前者的特殊情况。其它条件如正则方程，横截条件，边界条件等都一样。,参看图4-1可知，极小值原理可解决在边界上取极值的情况，因此比变分法所得的条件大大加强了。总之，极小值原理可解决经典变分法可解决的问题，也可解决经典变分法不能解决的问题。所以有些书上把用经典变分法解决的问题也称为用极小值原理求解。若系统方程是非线性的，则用极小值原理求解（和经典变分法一样）将产生非线性微分方程两点边值问题，求解非常困难。,3、前面我们讨论了极小值原理，但经过简单的转换就可将极大值原理化为极小值原理。设要使性能指标极大，对应的协态变量为，拉格朗日乘子为，则令就化为的极小值

30、问题，并且极小值问题的和与和的关系为，。,4、离散系统的极小值原理与连续系统的极小值原理所得出的最优解的必要条件在形式上是相似的，只是前者的协态方程（4-95）的右端没有负号。若系统方程是非线性差分方程，则离散极小值原理将产生非线性差分方程两点边值问题。从例4-5可见，即使对于一个简单的问题，求解也是很困难的。,5、极小值原理可成功地解决最短时间控制问题。若控制量满足约束条件，则最短时间的控制量只能取约束的边界值+1或-1。于是在系统中必然要有一个二位置继电式元件来生这就是所谓的砰砰控制。对于简单二阶系统重积分系统，在相平面上的相轨迹是抛物线，开关曲线由和两个半支抛物线组成。,6、最少燃料控制的控制量可取边界值+1、-1和0，因此系统中必然要有一个包含死区的三位置继电式元件来产生。重积分系统的相轨迹除抛物线外还有平行于横轴的直线段。另外，终端时刻必须大于同一问题的最短时间控制所需时间，否则最少燃料控制无解。,

展开阅读全文