ppt第三章变分法泛函极值问题.ppt

资源描述

《ppt第三章变分法泛函极值问题.ppt》由会员分享，可在线阅读，更多相关《ppt第三章变分法泛函极值问题.ppt（107页珍藏版）》请在三一办公上搜索。

1、第三章用变分法解最优控制泛函极值问题,本章主要内容,3.1 变分法基础3.2 无约束条件的泛函极值问题 3.3 有约束条件的泛函极值动态系统的最优控制问题3.4 小结,返回主目录,在动态系统最优控制问题中，性能指标是一个泛函，性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面就来列出变分法中的一些主要结果，大部分不加证明，但读者可对照微分学中的结果来理解。,3.1 变分法基础,如果对某一类函数中的每一个函数，有一个实数值与之相对应，则称为依赖于函数的泛函，记为,粗略来说，泛函是以函数为自变量的函数。,1、泛函：,先来给出下面的一些定义。,则称在处是连续

2、的。,2、泛函的连续性：,满足下面条件的泛函称为线性泛函这里是实数，和是函数空间中的函数。,3、线性泛函：,4、自变量函数的变分：,自变量函数的变分是指同属于函数类中两个函数、之差,这里,t 看作为参数。当为一维函数时，可用图3-1来表示。,图3-1自变量函数的变分,这里，是的线性泛函，若时，有，则称是泛函的变分。是的线性主部。,当自变量函数有变分时，泛函的增量为,5、泛函的变分：,6、泛函的极值：,若存在，对满足的一切X，具有同一符号，则称在处有极值。,定理：,在处有极值的必要条件是对于所有容许的增量函数（自变量的变分），泛函在处的变分为零,为了判别

3、是极大还是极小，要计算二阶变分。但在实际问题中根据问题的性质容易判别是极大还是极小，故一般不计算。,3.2 无约束条件的泛函极值问题,3.2.1 泛函的自变量函数为标量函数的情况,为简单起见，先讨论自变量函数为标量函数（一维）的情况。我们要寻求极值曲线，使下面的性能泛函取极值,（3-1）,于是泛函J 的增量可计算如下（以下将*号省去）,上式中是高阶项。,为此，让自变量函数、在极值曲线、附近发生微小变分、，即,根据定义，泛函的变分是的线性主部，即,对上式第二项作分部积分，按公式,J取极值的必要条件是等于零。因是任意的，要使（3-2）中第一项（积分项）为零，必有,（3-3）,上式称为欧

4、拉拉格朗日方程。,（3-2）式中第二项为零的条件要分两种情况来讨论：,1、固定端点的情况,当时，（3-4）式自然为零。,2、自由端点的情况,这时和可以发生化，而且可以独立地变化。于是要使（3-2）中第二项为零，由（3-4）式可得,（3-6）,（3-5）,因为这里讨论是标量函数的情况，和也是标量，且是任意的，故（3-5）、（3-6）可化为,（3-7）、（3-8）称为横截条件。,（3-8）,（3-7）,3.2.2 泛函的自变量函数为向量函数的情况,现在，将上面对是标量函数时所得到的公式推广到是n维向量函数的情况。这时，性能泛函为,(3-9),(3-10),式中,向量欧拉拉格朗日方程为

5、,(3-11),式中,泛函变分由（3-2）式改为,（当和时）,横截条件为（自由端点情况）,例3-1,取极值的轨迹。,求通过点（0，0）及（1，1）且使,解,即,它的通解形式为,式中：,这是固定端点问题，相应的欧拉拉格朗日方程为,由初始条件，可得A=0。,再由终端条件，可得，,因而极值轨迹为,例3-2 求使指标,取极值的轨迹，并要求，但对没有限制。,解,即常数,这是终端自由的情况。欧拉拉格朗日方程为,容易验证时，对应局部极小；时，对应局部极大。,由上式解得或。时的极值轨迹为；时的极值轨迹为。,即,3.3 有约束条件的泛函极值动态系统的最优控制问题,前面讨论泛函极值问题时，对极值轨

6、迹没有附加任何约束条件。但在动态系统最优控制问题中，极值轨迹必须满足系统的状态方程，也就是要受到状态方程的约束。考虑下列系统,（3-13）,这是综合指标。我们要求出最优控制和满足状态方程的极值轨迹，使性能指标取极值。,式中，为维状态向量，为维控制向量（这里假定不受限制.,否则不能用变分法求解，而要用极小值原理或动态规划法求解）是n维连续可微的向量函数。性能指标如下：,在下面的讨论中，假定初始时刻和初始状态是给定的，终端则可能有几种情况。我们将就几种常见的情况来讨论，即给定，自由和自由,属于一个约束集。,3.3.1 终端时刻给定，终端状态自由,（3-16）,（3-15）,与

7、有约束条件的函数极值情况类似，引入待定的n维拉格朗日乘子向量函数,将状态方程（3-13）写成等式约束方程的形式,与以前不同的是，在动态问题中拉格朗日乘子向量是时间函数。,在最优控制中经常将称为伴随变量，协态（协状态向量）或共轭状态。引入后可作出下面的增广泛函,（3-17）,于是有约束条件的泛函的极值问题化为无约束条件的增广泛函的极值问题。,再引入一个标量函数,它称为哈密顿（Hamilton）函数，在最优控制中起着重要的作用,于是可写成,（3-19）,对上式积分号内第二项作分部积分后可得,设、相对于最优值、的变分分别为和,因为自由，故还要考虑变分。,为极小的必要条件是：对任意的、

8、，变分等于零。由（3-18）及（3-20）可得下面的一组关系式,（协态方程）（3-21）,（状态方程）（3-22）,（控制方程）（3-23）,（横截条件）（3-24）,（3-21）与（3-22）一起称为哈密顿正则程。,（3-23）是控制方程，它表示在最优控制处取极值。,注意，这是在为任意时得出的方程，当有界且在边界上取得最优值时，就不能用这方程，这时要用极小值原理求解。,（3-24）是在固定、自由时得出的横截条件。当固定时，就不需要这个横截条件了。横截条件表示协态终端所满足的条件。,在求解（3-21）（3-24）时，我们只知道初值和由横截条件（3-24）求得的协态终端值，这种问题

9、称为两点边值问题，一般情况下它们是很难求解的。,因为不知道，如果假定一个，然后正向积分（3-21）（3-24），则在时的值一般与给定的不同，于是要反复修正的值，直至与给定值的差可忽略不计为止。,非线性系统最优控制两点边值问题的数值求解是一个重要的研究领域。对于线性系统两点边值问题的求解，则可寻找缺少的边界条件并只要进行一次积分，下面的例3-4给出了求解过程。,例3-3,设系统状态方程为的边界条件为。求最优控制，使下列性能指标为最小。,解,这里、均给定，故不需要横截条件（3-24）式。作哈密顿函数,则协态方程和控制方程为,即,故可得正则方程,对正则方程进行拉氏变换，可得,（3-2

10、5）,（3-26）,（3-27）,由（3-25）式可求得,于是，解出为,（3-28）,代入（3-26），即得,（3-29）,反变换可求得,将（3-28）代入（3-26）可得,故,由，从上式可得,把代入（3-29），可得，而最优控制为,设系统的状态方程为,要求确定最优控制，使指标泛函,例3-4,初始条件为,取极小值,这里是自由的，所以要用到横截条件（3-24）式，因终端指标,解:,作哈密顿函数,由（3-21）（3-23）可求得,（3-31）,将代入状态方程，可得,即,边界条件为,（3-37）,（3-36）,（3-35）,（3-34）,（3-33）,（3-39）,（3-38）,（3-40）

11、,（3-41）,可见这是两点边值问题，对正则方程（3-33）（3-36）进行拉氏变换，可得,代入初始条件，可得,故,由（3-38）（3-41）可解出,同样可解得,利用终端条件，由（3-42）、（3-43）可得,（3-43）,（3-42）,由上二式可解出,由（3-42）式可得最优状态轨迹,由（3-43）式可得最优协态,由（3-32）式可得最优控制,同理还可求出,图3-2 最优控制和最优状态轨迹解,注意，这个系统是线性定常系统，这种线性两点边值问题的解可以通过寻找缺少的边界条件，并且进行一次积分而求得其解。,对非线性两点边值问题，则要借助于迭代方法产生一个序列，来多次修正缺少的初始条件的试探值，直

12、到满足两点边值的条件。,图3-2是最优解的轨迹曲线。,3.3.2 终端时刻自由，终端状态受约束,设终端状态满足下面约束方程,（3-46）,（3-45）,（3-44）,性能指标为,其中,引入n维拉格朗日乘子向量函数和维拉格朗日乘子向量，作出增广性能泛函,将代入（3-47），可得,（3-49）,（3-48）,（3-47）,引入哈密顿函数,与固定时的情况不同，现在由、和所引起。这里不再为零，而可计算如下（参见图3-3）：,图3-3 各种变分的表示,（3-52）,令,一是在时函数相对的变化.,另一是因的变化所引起的函数值的变化量后者可用它的线性主部来近似。,注意，这里

13、和不同，故*号不能省去。上式表明由两部分组成：,现在来计算（只计算到一阶小量）。,上式中方括号外的下标*表示、是最优值、。是上式的线性主部，故,对第三项作分部积分，可得,第四项可表示为（忽略二阶小量）,上式最后一个等号用到了（3-52）式。表示的自变量取最优值时的值。,根据上面的结果可得,取极值的必要条件为因、为任意，故得（省去*号）,（协态方程）（3-53）,（状态方程）（3-54）,（控制方程）（3-55）,（横截方程）（3-56）,与固定情况相比，这里多了一个方程，用它可求出最优终端时间。,（3-57）,要求确定最优控制，使最小。,例3-5,设系统状态方程为,边界条件为,

14、自由,性能指标为,解,这是自由问题。终端状态固定，是满足约束集的特殊情况，即,作哈密顿函数,正则方程是,控制方程是,将代入，可得,因边界条件全部给定，故不用横截条件。,确定最优终端时刻的条件（3-57）式为,因为由正则方程，所以，于是最优控制,再由正则方程，可得,由上式求得,由初始条件，求得，故最优轨迹为,以终端条件,代入上式，即求得最优终端时刻,火箭发射最优程序问题。设火箭在垂直平面内运动，加速度与水平面夹角为，是控制作用，见图3-4。令,例3-6,（水平速度）,（垂直速度）,（水平距离）,（垂直高度）,图3-4 火箭发射示意图,忽略重力和空气阻力时，系统的状态方程和初始条件为,(3-

15、58),要求选择最优控制程序，使性能指标,自由,终端状态为,为最小。,因为要求最小，故是自由问题。由给定的终端状态可得三个约束方程为,解,(3-59),作哈密顿函数,协态方程为,（3-60）,横截条件为,即,上式右端矩阵中的自变量已省略。由（3-59）式求出上式中的偏导数，可得协态的终值为,（3-61）,常数,积分协态方程可得,常数,代入协态终值条件后，得,由控制方程，得,（3-63）,即,下面来积分状态方程（3-58），为此将自变量变成。由（3-63）式得,为了确定最优程序，还需确定拉格朗日未定常数、。,将上面关系代入状态方程，即得,积分上面两式得,由初始条件,可求得,(3-64

16、),（3-65）,将上面的和代入状态方程（3-58）的后两式，积分并经较复杂运算得,（3-66）,（3-67）,（注：另一解为，但这时由（3-67）式可得出与给定终端条件不符，故略去的解）,由终端条件和（3-65）式得,故,（3-68）,由（3-63）式得,将终端条件和（3-69）式代入（3-64）式，可得,（3-71）,将终端条件，（3-69）式和（3-71）式代入（3-67）式可得,（3-72）,现在归纳一下所得的结果：由（3-72）式可确定，由（3-71）式确定最短时间，由（3-70）式即可求得最优推力方向角。,由上面的计算可知，对于这样一个比较简单的例子求出解析解也是比较

17、困难的。一般情况下可用数值积分法求解。,3.4 小结,1、,函数的函数叫做泛函。性能指标是控制作用的函数，故称为性能泛函。和微分类似可引入泛函的变分。取极值的必要条件为。,2、,（欧拉拉格朗日方程）,当、自由时，还有横截条件,3、,求解动态系统的最优控制是一个求取有约束条件的泛函极值问题。系统的状态方程就是状态变量要满足的一个约束方程，即,4、,则由变分法可得下面的结果：,其中，称为哈密顿函数。,（1）终端时刻给定时，取极值的必要条件为,（横截条件）,（控制方程）,正则方程有个变量，积分时要个边界条件，初始条件给定时提供了个边界条件，若也完全给定则又提供了个边界条件，这时可不需要横截条件，见例3-3。,当自由或部分分量自由就要靠横截条件来提供缺少的边界条件，见例3-4。,（2）终端条件自由，取极值的必要条件与给定时的不同处，仅在于多一个求最优终端时刻的条件,（3-57）,5、,用经典变分法求解最优控制时，假定不受限制，为任意，故得出控制方程,不满足这种情况时，要用极小值原理或动态规划求解。这些内容在下面的章节中介绍。,

展开阅读全文