第五章 章线性系统二次型指标的最优控制ppt课件.ppt

上传人:牧羊曲112 文档编号:1433994 上传时间:2022-11-24 格式:PPT 页数:108 大小:3.71MB
返回 下载 相关 举报
第五章 章线性系统二次型指标的最优控制ppt课件.ppt_第1页
第1页 / 共108页
第五章 章线性系统二次型指标的最优控制ppt课件.ppt_第2页
第2页 / 共108页
第五章 章线性系统二次型指标的最优控制ppt课件.ppt_第3页
第3页 / 共108页
第五章 章线性系统二次型指标的最优控制ppt课件.ppt_第4页
第4页 / 共108页
第五章 章线性系统二次型指标的最优控制ppt课件.ppt_第5页
第5页 / 共108页
点击查看更多>>
资源描述

《第五章 章线性系统二次型指标的最优控制ppt课件.ppt》由会员分享,可在线阅读,更多相关《第五章 章线性系统二次型指标的最优控制ppt课件.ppt(108页珍藏版)》请在三一办公上搜索。

1、第五章 线性系统二次型指标的最优控制 线性二次型问题,返回主目录,5.1 引言5.2 线性二次型问题的提法5.3 终端时间有限时连续系统的状态调节器问题5.4 稳态时连续系统的状态调节器问题5.5 离散系统的线性二次型问题5.6 伺服跟踪问题5.7 设计线性二次型最优控制的若干问题5.8 小结,5.1 引言,用极小值原理解非线性系统的最优控制将导致非线性两点边值问题,这类问题求解是很困难的。即使系统是线性的,但当指标函数是最短时间、最少燃料这种形式,要求得到最优控制的解析表达式,并构成反馈控制(即把 表示为 的函数)也是非常困难的。,返回子目录,的确定归结为求解一个非线性矩阵黎卡提(Ricca

2、ti)微分方程或代数方程。而黎卡提方程的求解已研究得很透彻,有标准的计算机程序可应用,因此,求解既规范又方便。这种问题简称为线性二次型(Linear Quadratic 简称LQ)问题,目前应用得十分广泛,是现代控制理论最重要的结果之一。,下面我们将看到,若系统是线性的,指标函数是二次型的(指标函数是 和 的二次函数),则可以求得线性最优反馈控制律 。,线性二次型问题的实用意义还在于:,例如,在飞行器的轨迹优化问题中,根据飞行器的状态方程(一般是非线性的)用极小值原理计算出名义的最优控制和最优状态轨迹,设分别 用 和 表示。,把它所得到的最优反馈控制与非线性系统的开环最优控制结合起来,可减小开

3、环控制的误差,达到更精确的控制的目的。,因为状态方程只能是对飞行器实际动力学特性的近似描绘,这里存在着模型误差,把 加到飞行器上去,所产生的实际状态 将不同于 (这里我们还未考虑作用在飞行器上的其它扰动作用)。(这里我们还未考虑作用在飞行器上的其它扰动作用)。,令状态误差为 ,我们要使 愈小愈好,为此,可根据 构成一个最优反馈控制 ,作为校正信号加到 上去,得到的实际控制信号 将使飞行器尽可能沿着 飞行。,由于 、 应该比较小,它们将满足线性的状态方程,所以可用线性二次型问题设计出反馈控制 。我们可用图5-1表示上面的思想。,图5-1 线性二次最优反馈控制的应用,5.2 线性二次型问题的提法,

4、一般情况的线性二次型问题可表示如下:,其中, 为 维状态向量, 为 维控制向量, 为 维输出向量。设 不受约束。,设线性时变系统的方程为,(5-1),(5-2),返回子目录,其中, 为 维理想输出向量。寻找最优控制,使下面的性能指标最小,(5-4),令误差向量 为,(5-3),其中, 是 对称半正定常数阵, 是 对称半正定阵, 是 对称正定阵。 一般将 、 、 取成对角阵。,下面对性能指标 中的每一项作一说明。因 为正定阵,则当 ,就有 。例如,设 , ,则 为正定阵,于是,它与消耗的控制能量成正比,消耗得越多,则性能指标值 越大。故性能指标中这一项表示了对消耗控制能量的惩罚。 、 可看作加权

5、系数,如认为 的重要性大于 ,则可加大 。将 选成时间函数,是为了对不同时刻的 加权不一样。实际上,为了简单起见常选用常数阵 。,为半正定阵,则当 ,就有 , 表示误差平方和积分,故这项表示对系统误差的惩罚。 表示对终端误差的惩罚,当对终端误差要求较严时,可将这项加到性能指标中。,总之,性能指标 最小表示了要用不大的控制量来保持较小的误差,以达到能量和误差的综合最优。,这时 (单位阵),理想输出 ,则 ,这时,问题归结为用不大的控制量使 保持在零值附近。因而称为状态调节器问题。,下面讨论几种特殊情况:,1)调节器问题。,例如电机转速调节系统中,由于外加电压波动使转速偏离要求值,通过施加控制使转

6、速偏差趋于零。,这时 , ,这时要用不大的控制量使 跟踪 ,因而称为跟踪问题。例如,用雷达跟踪飞行器的运动,通过控制使跟踪误差趋于零。,2) 伺服机问题。,5.3 终端时间有限时连续系统的状态调节器问题,要求寻找最优控制 ,使 最小。这里 无约束。 、 为对称半正定阵, 为对称正定阵。终端时间 为有限值。,(5-5),(5-6),考虑下面的系统状态方程和性能指标,返回子目录,5.3.1 用极小值原理求解上面的问题,因 无约束,故等同于用经典变分法求解。取哈密顿函数为,协态方程为,最优解的必要条件如下:,(5-8),因 正定,故 存在,由上式可确定最优控制 。为寻求最优反馈控制律还需把 与状态

7、联系起来。,(5-9),控制方程为,但这里处理的是线性微分方程,可找到更简单的解法。从(5-10)可见,协态 和状态 在终端 时刻成线性关系。,(5-10),横截条件为,然后再来求出 (这种方法称为扫描法)。将(5-11)代入(5-9),再代入(5-5),得,(5-11),(5-12),(5-13),由(5-11)和(5-8)可得,这启发我们假定:,上式对任意 都应成立,故方括号内的项应为零,这就得出,(5-14),将(5-12)代入(5-13)可得,上式是 的非线性矩阵微分方程,称为黎卡提(Riccati)矩阵微分方程。一般来说得不出 的解析表达式,但可用计算机程序算出 的数值解。为了求解

8、,要知道它的边界条件。比较(5-11)和(5-10)可知,因此可从 到 逆时间积分黎卡提微分方程,求出 。由(5-9)和(5-11)就可构成最优反馈控制,又称为最优反馈增益矩阵。最优反馈系统的结构图如图5-2所示。,(5-16),图5-2 最优反馈系统的结构图,注意到 与状态 无关,故可在系统未运行前,将 先计算出来(称为离线计算),把它存储在计算机中。,在系统运行时,将 从计算机存储元件中取出,与同一时刻测量到的 相乘,就可构成最优控制 。,由此可见,系统运行时的计算量(称为在线计算量)只是一个乘法计算,故可用简单的微计算机来完成。,5.3.2 矩阵黎卡提微分方程的求解及的性质,1、,于是可

9、用下面的差分方程来近似黎卡提微分方程,(5-17),矩阵黎卡提微分方程是非线性的,一般不能求得闭合形式的解。在数字机上求解时,可用一阶差分代替微分,2、,求解上式时,以 为初始条件,取 为负的小量,从 到 逆时间递推计算,即可出 。,是对称矩阵,即 , 表示转置。这可证明如下:因为 、 、 都是对称的,将(5-14)式转置一下,可得,因此 和 一样满足同一黎卡提方程,并且边界条件一样,即 。于是,由微分方程解的唯一性可知,利用这个对称性,求 维 的元时,只需积分 个方程即可。,3、,即使系统是定常的,即系统矩阵A,输入矩阵B为常数阵,加权阵 和 也是常数阵,但 仍为时变阵。,例5-1 设系统状

10、态方程为,解,考虑到 是对称阵,设,为简单起见,上式右端省略了自变量 。把上面的 、 、 、 和 代入黎卡提方程(5-14)式,可得,(5-20),(5-21),把状态方程(5-18)和(5-5)式相比较,把性能指标(5-19)和(5-6)式相比较,可得,令上式等号左右端的对应元相等,得,(5-23),(5-22),由 到 逆时间积分上面的非线性微分方程组,即可求得 。于是最优控制为,(5-24),这是一组非线性微分方程。由边界条件,、 、 、 和 随时间变化的曲线可求出,如图5-3(a)、(b)、(c)所示。,图5-3 、 、 、 和 的时间曲线,由图5-3可见,定常系统的反馈系数 、 都是

11、时变的。当 比系统的过渡过程时间大很多时, 、 只在接近 时才有较大的变化,其它时间接近于常数。当 时, 、 和 都趋于零,则黎卡提微分方程变为黎卡提代数方程,解上面的方程组可得 、 、 的稳态值,于是最优控制律可表示为,(5-27),最优控制系统的结构图如图5-4所示。,图5-4 重积分系统最优控制的结构图,5.4 稳态时连续系统的状态调节器问题,对于稳态问题,当系统状态方程和性能指标中的加权阵满足一定条件时,可得出常数的最优反馈增益阵,这样在实现时非常方便,因此有很大的实际意义。,我们不加证明地列出下面的结果,然后再对问题中的条件作一些说明。,现在来研究工程实践中经常碰到的情况:系统是定常

12、的,积分指标的上限为无穷大。这种线性二次型问题称为稳态问题。,返回子目录,为 维, 为 维,系统是可控的或至少是可稳的(可稳指不可控的状态是渐近稳定的)。性能指标为,(5-28),(5-29),线性定常系统,其中 不受约束, 和 为常数对称正定阵。或者可将对 的要求改为对称半正定, 可观测,或至少可检测(可检测指不可观测的状态是渐近稳定的), 是 的矩阵平方根:。,上节我们已经证明了:使 为 极小的最优控制是存在和唯一的,且可表示为:,(5-30),其中 为 维常数阵,称为反馈增益阵, 为 维正定对称阵,满足下面的矩阵黎卡提代数方程,对照有限时间调节器的公式(5-14)可见,令 ,并将时变阵换

13、成常数阵即得到(5-31)式。在5.5中将针对离散型系统求取与(5-30)对应的线性二次型状态调节器的控制规律。,(5-31),可以看到,与有限时间的调节器不同,稳态调节器问题附加了两个条件:系统可控或至少可稳; 为对称正定阵,或 对称半正定并且 可观,至少可检测, 。下面对这些条件作些解释。,也就是受控系统的状态变量必须是渐近稳定的(这时由 产生的反馈控制 也收敛到零)。,因为稳态问题的性能指标积分上限为无穷,为了保证积分值为有限, 和 要收敛到零。,1)系统可控或至少可稳。这个要求是为了保证性能指标的积分为有限值(不趋于无穷)而提出的。,如果系统可控,则通过状态反馈可任意配置闭环系统极点,

14、使系统渐近稳定。可控的条件可减弱为可稳,即不可控的状态是渐进稳定的。对有限时间调节器来讲,因为积分上限 为有限值,即使系统不可控,状态变量不稳定,但积分指标仍可为有限值,故仍旧有最优解。,2) 为正定或 为半正定并且 可观测至少可检测, 。,这个条件是保证最优反馈系统稳定而提出的,因性能指标 取有限值,还不能保证系统稳定。,例如只要不稳定的状态变量在性能指标中不出现(未被指标函数所“观测”到)即可。 为半正定时就可能出现这种情况,所以 必须正定。或者半正定,但还有 可观,至少可检。下面用例子来说明。,例5-2 已知系统方程,要寻找最优控制使 最小。,(5-32),性能指标是,(5-33),解,

15、设 ,即未控系统是不稳的,但系统是可控的。若 , ,即 、 为正定。黎卡提代数方程(5-31)化为,(5-34),(5-35),取正定解,由(5-30)求得最优控制,代入状态方程(5-32),得,闭环特征根变为,即最优反馈系统是稳定的。,(5-37),从 的形式立即可判断出 时 最小。这时无反馈控制作用,系统保持为开环不稳定。从黎卡提方程来看,这时有,有两个解: 和 。只有 可使 ,从而性能指标为最小,但这时系统不稳定。,若 (相当于为半正定),则指标蜕化为,例5-3 考虑下面的不可控系统,要求出最优控制使 为最小。,(5-38),(5-39),(5-40),性能指标为,解,显然,这个系统的

16、是可控的,而 不可控,性能指标中只包含了可控的状态变量 。由状态方程和性能指标求得,显然 为半正定阵。可控性阵为,(5-41),(5-42),由 对构成的可观性阵为,是非奇异阵,故 为可观测对。令,是奇异的,系统不可控。将 阵作下面的分解,(5-43),为保证 正定,根据塞尔维斯特判据, 的各阶主子式应大于零,即,代入矩阵黎卡提代数方程(5-31)可得,由上式可解得,(5-44),(5-45),(5-46),将求得的 、 、 的值代入上面正定性条件,可得,若 ,则上式将导致 ,发生矛盾若 ,则 可成立, 可正定。而由(5-39), 时,不可控的状态 是稳定的,即系统满足可稳的要求,于是存在正定

17、的最优反馈增益阵 。,(5-47),最优控制可计算如下,(5-48),(5-49),最优闭环系统为,当 时,闭环系统也是稳定的,闭环系统矩阵为,它的特征根为,(5-50),(5-51),5.5 离散系统的线性二次型问题,先考虑一般的线性时变离散系统在终端时间有限时的状态调节器问题,再考虑线性定常离散系统在终端时间无限时的稳态状态调节器的问题,返回子目录,5.5.1 终端时间有限的状态调节器问题,设系统状态方程为,二次型性能指标为,(5-53),(5-52),、 为半正定阵, 为正定阵。要求寻找最优控制序列 ,使 最小。,写出哈密顿函数,协态方程,(5-54),(5-55),横截条件为,控制方程

18、为,假设,(5-56),(5-57),(5-58),把上式代入(5-59)并消去等式两端的 ,可得 必须满足下面的黎卡提矩阵差分方程,把(5-58)代入协态方程(5-55)得,由状态方程(5-52)和控制方程(5-57)可得,所以,(5-59),对上式方括号部分应用矩阵求逆引理。,令,可得矩阵黎卡提差分方程的另一形式,(5-61),(5-60),从 开始反向递推计算(5-60)即可决定 。求出 后,下面来决定 。由(5-55)得,黎卡提方程的终端条件为,因而由(5-57)得,(5-62),(5-63),式(5-63)可化为另一形式,将(5-60)代入(5-63)并利用(5-61)得,取 可得,

19、对上式花括号内引用前面的矩阵求逆引理,是最优反馈增益阵。,(5-64),(5-65),例5-4 设系统状态方程为 解,要求寻找最优序列 、 ,使 最小。,从给定的系统方程可见,系统矩阵 ,输入矩阵 。,给定 (5-66),性能指标为,(5-67),从给定的性能指标可知加权阵 , , 。黎卡提方程(5-60)可写成,终端值 。由 反向计算,求出 、 。,(5-68),(5-69),再利用(5-63)式计算 , ,1。,再计算,(5-70),(5-71),(5-72),(5-73),5.5.2 稳态状态调节器问题,为 维状态向量, 为 维输入向量。性能指标为,设系统的状态方程为,(5-74),(5

20、-75),假设( )可控或可稳, 为对称正定的常数阵,为对称正定的常数阵,或 为对称半正定常数阵,但 可观测或可检测, 。要求寻找最优控制使 最小。,可以证明,对于上面的问题,最优控制是存在和唯一的,它可以表示为,(5-76),L为mn维的常数反馈增益阵,参考(5-65),将时变阵换成常数阵,L可表示为,其中K为nn常数阵,是下面的矩阵黎卡提代数方程的唯一的对称正定解。在(5-61)的矩阵黎卡提差分方程中,将时变阵换为常数阵,即可得出矩阵黎卡提代数方程为,(5-77),(5-78),例5-5 系统的状态方程为,它是渐近稳定的,即 的特征值的模小于1。,最优反馈控制系统为,下面用例子来说明上述结

21、果的应用。,性能指标为,(5-80),(5-79),(5-81),解,, , , (5-82),因 非奇异,故系统可控。,当 为半正定,故有下面的分解,寻找最优控制使 最小。,由状态方程(5-80)和性能指标(5-81)可求得下面的矩阵,即,(5-83)非奇异,故 对可观测。于是满足稳态状态调节器问题的条件。由(5-78),令 ,黎卡提方程可写成,由上式可解得,由(5-76)、(5-77)可得,(5-84),最优反馈增益阵,闭环系统的系统矩阵为,闭环特征根为 。,显然,根的模都小于1,闭环系统稳定。由状态方程(5-80)可见,开环系统的根为 ,系统不是渐近稳定的。,当 ,于是 ,闭环系统不是渐

22、近稳定的,这是由于 不满足可观性条件,即(5-83)式为奇异阵,这时稳态状态调节器的最优控制解是不存在的。,此外,当 ,则有 。,5.6 伺服跟踪问题,其中,为 维,为 维,为 维。设理想输出为 ,跟踪误差 为,设系统的状态方程和输出方程为,(5-85),(5-86),(5-87),返回子目录,寻找控制 ( 不受约束)使下列性能指标最小,其中 为正定阵, 、 为半正定阵, 给定。,跟踪问题的哈密顿函数为,(5-88),(5-89),因U无约束,由控制方程,由协态方程得出,(5-91),由上式可见 中有一项与 成线性关系,另一项与理想输出 成线性关系。根据扫描法的思想,令,由横截条件得,(5-9

23、2),(5-93),其中矩阵 和向量时间函数 待定。将(5-93)式对t微分,得,设法从上式中消去 ,为此把(5-90)和(5-93)代入状态方程(5-85),可求出,将(5-95)代入(5-94),即得,(5-94),(5-95),(5-96),另外,(5-93)代入(5-91)可得,(5-97),(5-96)减去(5-97)可得,上式对任意的 、 均应成立,于是可得,(5-98),(5-99),(5-100),上面的微分方程组的边界条件可推导如下:由(5-93)得,而由(5-92)得,比较上面两式,可得,(5-101),(5-102),由上面的 时的边界条件出发,逆时间积分(5-99)和(

24、5-100)即可求出 、 。于是,最优控制可根据(5-90)和(5-93)求得为,中一项与状态 成正比(同状态调节问题),另一项与时间函数 成正比,而 是与理想输 出 有关的,故它表示了跟踪 的驱动作用。,(5-103),值得指出的是:为了求出当时时刻的 ,需要知道全部未来时刻的 , 。这是因为积分(5-100)求 是从 逆时间进行的。于是在实现最优控制时,必须预先知道 在 中的变化规律。,在某些情况下能做到这点,如跟踪卫星时,卫星的运动可事先计算出来。但大部分情况下 的将来值是未知的,如导弹攻击敌机,敌机的运动规律不知道。这时可有两种处理方法:一种是根据 对 的测量,预报它的将来值,另一种是

25、将 看成随机的。用后一种处理方法时,当然只能得到统计平均意义下的最优。,例5-6 已知一阶系统,其中 , , 。寻找最优控制 使 最小。,性能指标为,(5-104),(5-105),解,由(5-104)(5-105)知,由(5-103)得,由(5-99)可得标量函数满足下面的一阶黎卡提方程,(5-106),(5-107),最优轨线 由(5-95)求得:,标量函数 满足微分方程(5-100),即,由(5-101)求得边界条件,边界条件由(5-102)求得为,图5-5 、 、 以 为参数的时间曲线,图5-5 (a)表示了当 , , , ,和理想输出 时,以 为参数的最优 的一组曲线。,由图可见,随

26、着 的减小, 跟踪 的能力增强。此外,在接近 时,跟踪误差又回升,这时因为 , ,使 的缘故。,图5-5 (b)表示了最优控制曲线,随着r的减小, 增大,所以提高跟踪能力是以增大控制量为代价的。,图5-5 (c)是 的变化曲线。由图5-5 (a)可见当 ,也就是 的百分之一时,控制量较大才获得较好的跟踪性能。,5.7 设计线性二次型最优控制的若干问题,1)给出系统的数学模型,通常以 、 的形式给出(本章只讨论了 为单位阵的情况)。,2)给定二次型性能指标中的加权阵 、 、 。通常选用常数对角阵。,线性二次型最优控制的设计步骤可大致归结为:,返回子目录,3)解黎卡提方程。对定常系统,终端时间 无

27、穷的稳态问题可解矩阵黎卡提代数方程,其它情况一般要解矩阵黎卡提微分方程,或矩阵黎卡提差分方程。,对连续系统得到 或 以后,可求得反馈增益阵 或 。,对离散系统则是求得反馈增益矩阵 或 ,若 或 阵各元素的值太大,不易在系统中实现,则要更换 、 、 阵,并返回到步骤2),若 或 阵各元素的值合理,则进行步骤4)。,若满足要求,则停止计算。一般来说,把 中某个加权系数增大,则对应的状态变量会收敛得更快些, 中某个加权系数增大则对应的控制量会小些。,从上面的设计步骤可看出,这是一个试凑的过程。若 、 阵选择得合理,就可以减少试凑次数。若 、 选择不合理,设计出来的系统是不满意的。,因此所谓“最优”控

28、制只是使 取最小值,并不一定保证系统的特性在实用中“最优”。另外,采用合理的计算方法可以使黎卡提方程的求解快速和精确。下面对这两个问题作一些简单的讨论。,(一)加权阵的选择。,若已知各状态变量和控制变量允许的最大值为 , 和 , , ,则作为初始选择,可令,然后,再根据情况进行调整,直至设计结果满意为止。,(二) 对黎卡提矩阵微分方程的求解。,建议采用变步长的四阶龙格库塔法。不推荐用欧拉法,因为它的数值特性不好。龙格库塔法的计算机程序在一般的计算机数学库中都可找到。黎卡提矩阵代数方程的数值求解也不是一件容易的事,它的解法有很多种。这里介绍一种迭代法(称为牛顿方法)。在(5-31)所示的黎卡提代

29、数方程中,加上一项 再减去 可得,(5-109),因为,故(5-109)可写成,迭代格式为,(5-110),上式是关于 的线性方程,当已求得第 步的后,很容易求得下一次迭代值 。一般来说迭代不一定收敛,但已证明,若选择初始估计 使得闭环系统方程 稳定,则迭代将收敛到黎卡提代数方程的唯一正定解。收敛标准可用,其中, 表示矩阵 的第 行第j列元素, 是指定的小数。,(5-111),本节讨论了线性系统二次型指标的最优控制问题,这时可得到线性的最优反馈控制律,即控制量正比于状态变量,可写成 ,或 。把这种线性二次型问题的最优控制与非线性系统的开环控制结合起来,还可减少开环控制的误差。线性二次型问题的最

30、优控制一般可分状态调节器问题和伺服跟踪问题两大类。,5.8 小结,1、,返回子目录,这时最优控制可写成 满足黎卡提矩阵微分方程(5-14),终端条件 。从 到 逆向积分(5-14)即可求得 ,积分方法建议采用变步长四阶龙格库塔法。对离散系统有类似要求,最优控制,对于终端时刻 有限的连续系统状态调节器问题,要求加权阵 、 为对称半正定, 为对称正定,但并不要求系统完全可控。,2、,满足矩阵黎卡提差分方程。,当连续系统是定常的, 为无限时,可得到所谓稳态状态调节器问题。,3、,这时的附加条件是:系统要可控,至少可稳; 要正定,或 半正定,但 可观测,至少可检, 。,设计线性二次型最优控制系统时,关键问题是要选择合理的 、 、 阵,另外,要选择好的数值方法来求解黎卡提方程。,4、5、,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号