《线性最优状态调节器.ppt》由会员分享,可在线阅读,更多相关《线性最优状态调节器.ppt(90页珍藏版)》请在三一办公上搜索。
1、第7章 线性最优状态调节器,如果所研究的系统为线性,所取的性能指标为状态变量与控制变量的二次型函数,则这种动态系统的最优化问题,称为线性二次型问题。,线性二次型最优控制特点:易于实现;具有工程性;线性最优控制的结果可以应用于工作在小信号条件下的非线性系统,其计算和实现非线性控制方法容易;线性最优控制器设计方法可以作为求解非线性最优控制问题的基础;线性最优控制除具有二次型性能指标意义上的最优性外,还具有良好的频响特性。,7.1 线性二次型问题,设线性时变系统的动态方程为,(7-1),式中 为 维状态向量,为 维控制向量,为 维输出向量;为维数适当的时变矩阵,其各元分段连续且有界,在特殊情况下可以
2、是常阵。假定,且 不受约束。,若令 表示 维希望输出向量,则,(7-2),称为误差向量。要求确定最优控制,是下列二次型性能指标极小:,(7-3),式中 为 维对称非负定常阵,为 维对称非负定时变矩阵,为 维对称正定时变矩阵,初始时刻 和末端时刻 固定。,在二次型性能指标(7-3)中,其各项都有明确的物理含义。,(1)末值项,(7-4),不失一般性,取,表示对末态误差要求的各元等加权,则有,此时,末值项表示 时刻的跟踪误差,即末态误差向量 与希望的零向量之间的距离平方和。,当 时,表示对末态跟踪误差的各元有不同的要求。,若取,则式(7-4)可以表示为,此时,末值项表示末态跟踪误差向量 与希望的零
3、向量之间的距离加权平方和。,如果对末态跟踪误差不必限制,则可取。此时性能指标 变为积分型。,(2)第一过程项,(7-5),若取,则有,于是,式(7-5)可以表示为,上式表明,第一过程项表示在系统控制过程中,对动态跟踪误差加权平均和的积分要求,是系统在运动过程中动态跟踪误差的总度量。,(3)第二过程项,(7-6),若取,于是,式(7-6)可以表示为,则有,上式表明,第二过程项表示在系统控制过程中,对加权后的控制能量消耗的总度量。,因此,二次型性能指标(7-3)的物理意义是:是系统在控制过程中的动态误差与能力消耗,以及控制结束时的系统稳态误差综合最优。,二次型性能指标有如下几种重要的特殊情形。,(
4、1)状态调节器的问题,在系统方程(7-1)和误差向量(7-2)中,如果,则有,从而,性能指标(7-3)演变为,(7-7),(7-7),这时,线性二次型问题归结为:当系统受扰偏离原平衡零状态时,要求系统产生一控制向量,使性能指标(7-7)极小,即使得系统状态 始终保持在零平衡状态附近。,(7-8),(2)输出调节器的问题,在误差向量(7-2)中,如果,则有,从而,性能指标(7-3)演变为,(7-8),这时,线性二次型问题归结为:当系统受扰偏离原平衡状态时,要求系统产生一控制向量,使性能指标(7-8)极小,即使得系统输出 始终保持在零平衡状态附近。,(3)跟踪系统问题,如果,式(7-2)成立,性能
5、指标保持式(7-3)的形式不变,则线性二次型问题归结为:当希望输出量 作用于系统时,要求系统产生一控制向量,使性能指标(7-3)极小,即使得系统的实际输出 始终跟随 的变化。,7.2 状态调节器,所谓状态调节器问题,就是要求系统的状态保持在平衡状态附近。,7.2.1 有限时间状态调节器,问题 7.1 设线性时变系统状态方程为,(7-9),式中 无约束;矩阵 与 维数适当,其各元连续且有界。要求确定最优控制,使下列性能指标极小:,(7-10),式中权矩阵 其各元均连续有界;末端时刻 固定且为有限值。,(1)最优解的充分必要条件,定理7-1 对于最优调节器问题7-1,最优控制的充分必要条件,(7-
6、11),最优性能指标为,(7-12),式中 维对称非负矩阵 满足黎卡提矩阵微分方程,(7-13),其边界条件为,而最优轨线,则是下列线性向量微分方程的解:,(7-14),(7-15),证明:,必要性:证(5-14)表示的u*确为最优,取H函数为:,根据最优控制的控制方程:,可得:,设协态方程的解为,解此方程,可得最优轨线:,与(7-19)式,比较可得:,该方程称为黎卡提(Riccati)矩阵微分方程,因此,得最优控制的必要条件为:,必要性得证。,充分性:若上式 u*中P(t)为黎卡提方程满足边界条件的解,我们能证明它满足哈密顿-雅可比方程,则根据连续系统动态规划,充分性成立。,令,哈密顿-雅可
7、比方程为,由于 u(t)无约束,令,解得:,代入哈密顿-雅可比方程,得,而如此表述的,故当上述黎卡提方程的边界条件为:,对照性能指标的终端项,则有,充分性得证。,(2)黎卡提方程解的若干性质,为反馈增益矩阵。由于式(7-17)中矩阵 和 是已知的,因此闭环系统的性质取决于黎卡提方程的解。,证明:由黎卡提方程及边界条件:,考虑到 F、R、Q 均为对称阵,将上式转置:,可见上述两个矩阵微分方程和其边界条件完全相同。,由 P(t)解的惟一性,可知,命题7-2 对于性能指标(7-10),如果对有所的,有,则对于任意的 和相应的,总有,命题7-3 若矩阵 是黎卡提方程(7-13)及其边界条件(7-14)
8、的唯一解,则其在区间 上必为非负矩阵。,(3)最优控制解的存在性与唯一性,定理7-2 对于最优调节器问题7-1,若 有限,则式(7-11)给出的最优控制 存在且唯一。,P170P172 的两个例题给出了如何应用黎卡提方程来解最优控制的例子。,7.2.2 无限时间状态调节器,对既有最优性要求,又有稳定性要求的问题只能用无限时间调节器理论去解决。,(1)无限时间时变状态调节器,性能指标,(7-20),式中向量 及矩阵 的假定同问题7-1,控制 不受约束。要求确定最优控制,使性能指标(5-20)极小。,定理7-3 对于无限时间时变状态调节器问题7-2,若阵对 完全可控,则存在唯一的最优控制,(7-2
9、1),最优性能指标为,(7-22),式中,(7-23),是对称、非负的,而 是如下黎卡提方程:,(7-24),及其边界条件,的唯一解。,(7-25),关于定理7-3,有如下几点标记.,1)对系统提出的完全可控性要求,是为了保证最优解的存在。,例:设系统状态方程及初始条件为,性能指标,试求最优控制 及最优性能指标。,解,状态 不可控。,本例为线性定常系统,其可控性判据,故系统不可控。,不可控状态 不稳定。,系统矩阵,状态转移矩阵,故系统的零输入响应为,显然,不稳定且不可控状态 包含于性能指标之中。无论 取何值 时,性能指标,因而本例不存在使 的最优控制,实际上,本例为线性定常系统,性能指标中的权
10、矩阵亦为常阵。因此,即使对于无限时间定常状态调节器问题,为了保证最优解存在,也必须要求系统完全可控。,3)对于无限时间时变状态调节器,由于黎卡提方程(7-24)在边界调节(7-25)下的稳态解 仍为时变矩阵,因而最优控制律是时变的,不便于工程应用。,2)对于无限时间状态调节器,通常在性能指标中不考虑终点指标,取权阵。其原因有二:一是希望,即要求稳态误差为零,因而性能指标中不必加入体现终点指标的末值项;二是工程上仅考虑在有限时间内系统的响应,因而 时的终点指标将失去工程意义。,(2)无限时间定常状态调节器,性能指标,(7-27),式中 无约束;矩阵 和 是维数适当的常数矩阵。并且,和 分别为非负
11、定和正定对称矩阵。要求确定最优控制,使性能指标(7-27)极小。,定理 7-4 对于系统(7-26)和性能指标(7-27),若对于任意矩阵,有,且 是如下黎卡提矩阵代数方程:,定理 7-5 对于无限时间定常状态调节器问题7-3,若阵对 完全可控,阵对 完全可观,其中,且 任意,则存在唯一的最优控制,(7-29),最优性能指标为,(7-30),式中 为对称正定常阵,是下列黎卡提矩阵代数方程的唯一解,(7-31),7.2.3 最优调节系统的渐进稳定性,按定常调节器问题进行综合,可得最优调节系统,其闭环系统方程为,(7-32),研究该最优调节系统渐进稳定的必要条件。,定理 7-6 设线性定常系统,(
12、7-33),性能指标,(7-34),7-35,为渐进稳定的最优调节系统,为一个李雅普诺夫函数。其中,为对称正定常阵,是黎卡提矩阵代数方程7-31的唯一解。,式中 无约束;矩阵 和 是维数适当的常数矩阵。并且,和 分别为非负定和正定对称矩阵。若阵对 完全可控,阵对 完全可观,其中,而 任意,则闭环系统,命题 7-4 对于系统(7-33)和性能指标(7-34),已知阵对 可控,且系统(7-33)的可控标准形为,式中 为可控对。假定 不可观,其中。,7.3 具有给定稳定度的状态调节器,问题7-4 设线性定常系统状态方程,(7-36),性能指标,(7-37),式中 无约束;矩阵 和 是维数适当的常数矩
13、阵。并且,和 分别为非负定和正定对称矩阵。,为已知值。要求确定最优控制,使性能指标7-37极小,并使最优闭环系统渐进稳定,其特征值实部小于,7.3.1 修正调节器问题的最优解,设在问题7-4 完全可控,完全可观,其中为任一使 的矩阵。可控及可观的要求,对确保无限时间问题有解以及确定对闭环系统的稳定度约束使必需的。,通过变换方法,可将问题7-4 化为无限问题定常调节器问题,定义,(7-38),(7-39),考查,(7-40),(7-41),将式(7-38)和式(7-39)代入上式,得修正调节器性能指标,(7-42),式中 与 仍然分别为非负和正定对称矩阵。,对于系统(7-41)和性能指标(7-4
14、2),如果没有可控性和稳定性的附加约束,则这一最小化问题可能无解。,根据线性系统理论,如下四种提法完全等价,根据定理7-5,修正调节器问题存在唯一的最优控制,(7-43),最优性能指标,(7-46),式中 为正定对称常阵,满足下列黎卡提矩阵代数方程,(7-45),根据定理7-5,最优闭环系统,是渐进稳定的。,(7-44),7.3.2 具有给定稳定度的调节器问题的最优解,将式(7-38)和式(7-39)分别代入式(7-43)、式(7-44)、式(7-46),可得最优控制,(7-47),最优性能指标,(7-48),最优闭环系统,渐进稳定。其中 满足式(7-45)。,(7-49),为了证明关于稳定度
15、的规定,由渐进稳定得式(7-46),有,(7-50),将式(7-38)代入式(7-50),可得,(7-51),当 时,最优闭环系统(7-49)的状态 至少以 的速度趋于零,完全满足给定稳定度 的要求。越大,收于零的速度越快。通常将 称为闭环系统的最小稳定度。,定理7-7 设线性定常系统状态方程,(7-52),性能指标,(7-53),式中 无约束;矩阵 和 是维数适当的常阵。并且,和 分别为非负定和正定对称矩阵。为给定的正常数。,若阵对 完全可控,阵对 完全可观,其中 为任一使 的矩阵,则存在唯一最优控制,(7-54),最优性能指标,7-55,式中 为对称正定常阵,是下列黎卡提矩阵代数方程:,7
16、-56,的唯一解。最优闭环系统,7-57,是渐进稳定的,且稳定度至少为。,7.4 逆最优调节器,逆最优调节器问题,是指已知某个具有未知定常扰动的线性定常系统,在规定稳定度要求下,寻求某个二次型性能指标,使得由规定稳定要求确定的线性状态反馈控制律,对所构造的性能指标来说是最优的。逆最优调节器的实质:最优调节器的极值点配置问题。,7.4.1 逆调节器问题,设完全可控系统状态方程,(7-58),式中 为 维状态向量;为 维控制向量,且无约束;为 维常值未知扰动向量;和 为维数适当的常数矩阵。,假设:,若令,(7-59),(7-60),则逆最优调节器问题为:寻求二次型性能指标,(7-61),使得由 和
17、 确定的控制律,对性能指标(7-61)是最优的。其中,为非负对称常阵,和 为正定对称常阵。,由假设,能够选取一个矩阵,使得,将式(7-62)代入状态方程(7-58),并考虑式(7-59)和式(7-60),可得,(7-62),(7-63),定义,(7-64),(7-65),则系统方程(7-63)和(7-64),以及性能指标(7-61)可以写为,(7-66),(7-67),式中,经上述矩阵增广后,逆最优调节器问题转化为:,对于给定的线性定常系统(7-66)和给定稳定度约束 和,寻求状态反馈阵 和权阵 与,使得 满足 和 约束成为最优控制,并使性能指(7-67)极小。,7.4.2 状态反馈阵的表达式
18、,一个完全可控的 阶连续系统,对其给定稳定度的一种评价规则是所有闭环极点的实部和幅角有要求的上限。若用 表示期望极点区域,易见 为图7-1中的阴影区。,引理7-1 定常齐次动态方程,其零解渐进稳定的充要条件是:对给定的任一正定对称阵,都存在唯一的正定对称阵,使得,引理7-2 对于完全可控的 阶连续系统,如果,必有 即,式中 表示特征值,表示实部。,引理7-3 对于任意给定的 正定对称矩阵,以及任意正数 和,矩阵方程,(7-68),有正定对称解的充分必要条件是,定理7-8 设系统(7-66)完全可控,给定正定对称矩阵。若 为正定对称矩阵,则必存在满足下式的状态反馈阵:,(7-69),使得闭环系统
19、特征值。,7.4.3 状态反馈阵与性能指标的关系,(7-70),的一般解。式中,满足,若 非奇异,则有,(7-71),引理7-4 对于完全可控系统(7-66),若 列满秩,对称非负,渐进稳定,则存在对称正定矩阵 和状态反馈阵,其中 为对称非负矩阵,是如下方程,定理7-9 考虑完全可控(7-66),列满秩,若,则当 正定对称时,必存在非负对称的 和,满足,(7-72),(7-73),式中,推论 在定理7-9中,若取 为单位阵,则必存在非负对称得 和,满足,(7-74),(7-75),7.4.4 逆最优调节器的设计步骤,逆最优调节器的设计,可按如下步骤进行:,给定正定对称矩阵,一般可取,由式(7-
20、69)求出使 为对称正定矩阵 的取值范围,7.5 离散状态调节器,问题 7-5 设线性离散系统状态差分方程,式中.性能指标,要求一最优控制序列,使性能指标最小,问题 7-5是有限时间离散状态调节器问题。可以证明,其最优控制是一种线性状态反馈规律,而且最优性能指标是初始状态的二次型函数。,定理7-10 对于有限时间离散状态调节器问题7-5,存在唯一的线性状态反馈最优控制序列,最优性能指标,式中反馈增益矩阵序列,而 是下列离散黎卡提方程的对称非负定解,边界条件为,离散状态调节器的结构图如图7-5所示,由定理7-10可见,反馈增益矩阵 取决于系统的系数矩阵A(k),以及性能指标中的权矩阵,、和,而与
21、初始状态 无关。因此实现上图 所示闭环最优控制时,可以离线算出,在线只进行 的简单运算,例7-8 已知离散系统,解 本例为离散状态调节器问题。由题意,(A)另,得,(B)另,算得,求出,(C)另,算得,求出,()另,算得,求出,(E)计算最优控制序列,第8章 线性最优输出调节器与跟踪系统,问题 8-1 设线性时变系统动态方程,要求确定最优控制,使下列性能指标极小:,引理 8-1 在问题8-1中,若矩阵对 完全可观测,则下列矩阵:,必为对称非负定矩阵。,定理 8-1 对于有限时间输出调节器问题8-1,若矩阵对 在 时刻完全可观测,则存在唯一的最优控制,最优性能指标,最优轨线 满足下列线性微分方程
22、:,8.1.2 无限时间输出调节器,问题 8-2 设线性定常系统动态方程,要求确定最优控制,使下列性能指标极小,定理8-2 对于无限时间定常输出调节器问题8-2,若矩阵对 完全可控,完全可观,且对于满足 的任何,阵对 完全可观,则最优控制,最优性能指标,式中 为正定对称常数矩阵,满足下列黎卡提代数方程,例8-1 设系统动态方程,解:,(A)检测系统的可控性与可观性。由题意有,因为,所以,可控,可观,可观,可以构造渐进稳定的最优输出调节器。,(B)解黎卡提代数方程。将各有关参数代入式(8-16)求得,易验证闭环系统确是渐进稳定的。,定义8-1 稳定子空间与不稳定子空间。,对于齐次微分方程,其中
23、有各异特征值,则所有由负实部特征值的特征向量所张成的线性子空间,称为稳定子空间;否则称为不稳定子空间。,定义8-5 可稳定性。,在式(8-18)中,为可控对,为系统 的可控特征值,为不可控特征值,式中 渐进稳定。,在式(8-19)中,为可观时,为系统 可观特征值,为不可观特征值,定理8-3 对于无限时间定常输出调节器问题8-2,若给定黎卡提矩阵微分方程,边界条件,最优性能指标,最优控制为,且闭环系统,渐进稳定的充分必要条件是 可稳定,可检测,(D)当 时,的充分必要条件是 可观,8.1.3 输出反馈次优调节器,问题8-3 设完全可控且完全可观的线性定常系统动态方程,试确定输出反馈次优控制律,使
24、下列性能指标极小,式中 和 均为对称正定常数矩阵。并使如下闭环系统渐进稳定。其中,输出反馈系统结构图,如图所示,将(6-48)代 入(6-49)得:,其中,下面采用李雅普诺夫第二法讨论,确定,要求保证闭环系统渐进稳定,并使性能指标极小。,取李雅普诺夫函数,将(8-50)代入上式,得,令,由(8-53)和(8-56),可得,将(8-57)代入(8-51),得,由于闭环系统(8-50)渐进稳定,必有。于是,问题8-3的次优性能指标,次优控制,其中 和 满足,由(8-60)解出用 表示的,即,代入(8-58),得,然后令,可以找到使 极小的 值。从而求得 值,8.2 离散输出调节器,问题8-4 设线
25、性离散系统的状态方程及输出方程为,定理8-4 对于有限时间离散输出调节器问题8-4,若阵对 完全可观,则存在唯一的线性状态反馈最优控制序列,最优性能指标,而 是离散黎卡提方程,问题8-5 已知线性时变系统的动态方程,为极小值,定理8-5 对于有限时间时变跟踪系统问题8-5,若阵对 完全可观,则存在唯一的最优控制,式中 为对称非负定实矩阵,是下列黎卡提矩阵微分方程,及其边界条件,最优跟踪闭环系统,满足初始条件,的解,为最优轨线,8.3.2 无限时间定常跟踪系统,定理 8-6 已知线性定常系统的动态方程为,设 为 维定常希望输出常向量,为误差向量,由下式定义:,性能指标,若阵对 完全可控,阵对 完全可观,则近似最优控制,式中 为对称正定常阵,满足下列黎卡提代数方程,常值伴随向量,引理 8-2 若 为 维实常阵,且有,则当 充分大时,有,证明 不失一般性,设 有各异特征值 必存在非奇异变换矩阵,因为,令,且 充分大,必有,例8-5 设系统动态方程,性能指标,试求近似最优控制。其中(常数),解 由题意,(A)检测系统的可控性与可观测性,故系统完全可控、可观,近似最优控制存在,(B)求 并检验其正定性令 可以求得,(C)求常值伴随向量。由式(8-117),得,(D)求近似最优控制,(E)检验闭环系统稳定性。由式(8-118)得闭环系统方程,求出闭环系统特征值:。闭环系统是渐进稳定的,