《最优化方法课件.ppt》由会员分享,可在线阅读,更多相关《最优化方法课件.ppt(317页珍藏版)》请在三一办公上搜索。
1、最优化方法 信息与传播学院 信息系1402、03、04班,最优化方法 为了使系统达到最优的目标所提出的各种求解方法称为最优化方法。最优化方法最早17世纪提出的极值问题,在第二次世界大战前后,在军事领域中对导弹、雷达控制的研究中逐渐发展起来的。工程技术、管理人员在实际工作中,面临这样一类问题:怎样的分配方案既能满足基本要求,又能获得好的经济效益;生产计划中,怎样的计划方案才能提高产值和利润;确定各种成分比例才能提高质量、降低成本;城建规划中合理安排工厂、学校、医院等布局,方便群众,利于城市各行各业发展等等。,最优化方法解决问题一般步骤:(1)提出需要进行最优化的问题,开始收集有关资料和数据;(2
2、)建立求解最优化问题的有关数学模型,确定变量,列出目标函数和有关约束条件;(3)分析模型,选择合适的最优化方法;(4)求解方程。一般通过编制程序在电子计算机上求得最优解;(5)最优解的验证和实施。随着系统科学的发展和各个领域的需求,最优化方法不断地应用于经济、自然、军事和社会研究的各个领域。,Optimization Process,4,real world problem,algorithm,model,solution technique,computer implementation,analysis,numerical methods,verification(验证),validati
3、on(验证),sensitivity analysis(灵敏度分析),第1章 概论,1.1 经典极值问题 1.例子:设有400W资金,要求4年内使用完,若一年内使用资金x万元,则可得到效益 万元,(效率不能再使用),当年不用的资金可存入银行,年利率为10%。试制订出资金的使用规划,以使4年效益之总和为最大。方案1:第一年资金全用完,效益为20w。方案2:前三年存银行,第四年本息和用完,效益23.07w。而最佳方案可得到效益总和为43.1w。,6,Linear Programming(线性规划),A linear programming model involves the optimizati
4、on of a linear function(线性函数)subject to linear constraints on the variables(变量约束).,Example Suppose that a manufacturer of kitchen cabinets is trying to maximize the weekly revenue of a factory.Various orders have come in that the company could accept.They include bookcases with open shelves(开架书橱),ca
5、binets with doors(带门橱柜),cabinets with drawers(带抽屉橱柜),and custom-designed(定制的)cabinets.The following Table indicates the quantities of materials(原材料)and labor required to assemble the four types of cabinets,as well as the revenue earned.Suppose that 5000 units of wood and 1500 units of labor are avai
6、lable.,2.数学模型(定量优化计算:不增加投入而增加产出的手段)第一,无约束极值问题(例1.3),或,解法:解方程组,第二,仅含等式约束的极值问题(条件极值),或,解法:Lagrange乘子法,1.2 实例 数据拟合问题 原料切割问题 运输问题 营养配餐问题 分配问题,1.3 基本概念 1.最优化问题的向量表示法 设,则,(1),以向量为变量的实值函数 定义向量间的序关系:,等于,小于,,严格小于,。由此,(2),以向量为变量的实向量值函数最优化问题的一般形式,(3),2.最优化问题的分类,试验问题:用于检验、比较最优化方法优劣的一些最优化问题。,3.术语,目标函数,等式约束,不等式约束
7、,容许解(点),容许集,求解问题(3)是指:在容许集,中找一点,目标函数,在该点取极小值,即对于容许集中的任,,总有,意一点,最优点(极小点),最优值,最优解,严格极小点,局部,非严格极小点,严格极小点,非严格极小点,全局,,使得,到目前为止,大多数最优化算法求到的都是局部极小点。为了求得全局极小点,一种解决办法是,先求出所有的局部极小点,然后再从中找出全局极小点。,4.极大值问题与极小值问题的关系,1.4 二维问题图解法,二维极值问题有时可以用图解的方式进行求解,有明显的几何解释。,例 求解,图解法的步骤:,,显然,;,取,并画出相应的曲线(称之为等值线).,确定极值点位置,并用以往所学方法
8、求之。,易知本题的极小值点,。,虽然三维及以上的问题不便于在平面上画图,图解法失效,但仍有相应的等值面的概念,且等值面具有以下性质:,有不同函数值的等值面互不相交(因目标函数是单值函数的缘故);,等值面不会在区域的内部中断,除了极值点所在的等值面以外。这是由于目标函数是连续函数的缘故;,令,等值面稠密的地方,目标函数值变化得比较快;等值 面稀疏的地方,目标函数值变化得比较慢;,在极值点附近,等值面(等值线)一般近似地呈现为同心椭球面族(椭圆线族)。,1.5 梯度和Hesse矩阵,本段讨论都基于对函数,以下及今后的讨论中还经常要用到以下一些向量的知识。,可微的假定。,与,。,记作,。,向量也常用
9、希腊字母,等表示。,向量内积的性质:,),(对称性);,),(线性性);,),当且仅当,时,,(正定性);,向量的内积 设,则,称为向量,的内积,,其实,,向量的长,单位向量,向量的夹角,,向量的正交,(正交性),1.可微,设,.如果存在,维向量,对于可任意小的,维非零向量,,总有,在点,那么称函数,处可微。,若令,便得到(1.9)的等价形式,.(1.10),2.梯度,定理1 若,在点,处可微,则,在该点关于各个变量的一阶偏导数存在,并且,定义1 以函数,的,个偏导数为分量的向量,称为,在点,处的梯度,记为,。,。,梯度也称为函数,关于变量,于是,(1.10)可写为,这个公式与一元函数展开到两
10、项的Taylor公式是相对的。,梯度的性质:,当梯度,连续时,,第一,若,,则,必垂直于,过点,处的等值面;,的一阶偏导数。,第二,梯度方向是函数具有最大变化率的方向。,下面以,为例来解释这个性质。,上图是该函数的等值线图。,今考虑一点,,不妨取坐标为,。设想有,出发沿某个方向移动到了点,,其坐标,,那么目标函数值将产生如下变化量,一动点从,设为,假定,。试问:动点沿哪个方向移动会使,目标函数值有最多的下降或上升?,从图上看,这相当于问:在以点,为圆心、以1为半径,的圆周上,哪一个点具有最大的或最小的目标函数值。,为了一般地描述函数,在点,处沿,情况及变化速度,须引入上升方向和下降方向及方向导
11、数的概念。,方向的变化,函数,在点,处沿,方向的变化反映的是函数,在一条直线上的变化,空间中由一点,和一方向,所确定的直线方程为,上升方向和下降方向 设,是连续函数。,若存在,,对于,都有,,则称,方向是,在点,处的上升方向;若存在,对于,都有,,则称,方向是,在点,处的下降方向。,定义2 设,在点,处可微,,是非,方向上的单位向量。如果极限,零向量,存在,则称其为函数,在点,处沿,方向的方向导数,,。,记作,若,,则,方向是,在点,处的上升方向;,根据极限理论,易见,若,,则,方向是,在点,处的下降方向。,因此,方向导数的正负决定了函数值的升降。,定理1.2 设,在点,处可微,则,,,其中,
12、是非零向量,方向上的单位向量。,定理1.2又表明:只要,,则,方向是,在点,处的上升方向;只要,,则,方向是,在点,处的下降方向。,函数值升降的快慢则是由方向导数绝对值的大小决定的。绝对值越大,升或降的速度就越快;绝对值越小,升或降的速度就越慢。这是因为,据此有,)等号成立当且仅当,与,同方向或与,同方向。且当,与,同方向时,,取到最大值,。,当,与,同方向时,,取到最小值,)若,是锐角,则,;,若,是钝角,则,。,因此,方向导数又可以称为函数,在点,处沿,方向的变化率。,使函数值下降最快的方向称为最速下降方向。,最速下降方向为,几个常用函数的梯度公式,(1)若,,则,,即,(2),(3),;
13、,(4),.,;,;,2.Hesse矩阵,问:函数,关于变量,的二阶导数又是什么?,先来看什么是向量值函数的可微。,定义1.3 设,。,若,的所有分量,在点,都可微,则称向量值函数,在点,处可微。,定义表明,,在点,处可微,则,成立,,其用向量形式可简单地表示为,其中,称为向量值函数,在点,处的导数,,而,称为向量值函数,在点,处的Jacobi矩阵。,设,具有二阶连续偏导数,且,则矩阵,称为函数,关于变量,的二阶导数,简记为,。,也称为多元实值函数,的Hesse矩阵。,几个特殊的向量值函数的导数公式:,(1),;,(2),;,(3),;,(4)设,,其中,。则,利用(4),可得多元函数展开到三
14、项的Taylor公式,(1.29),或,(1.31),这个公式与一元函数展开到三项的Taylor公式是相对应的。,多元函数的Taylor展开式在最优化方法中十分重要,许多方法及其收敛性的证明都是从它出发的。,1.凸集,1.6 凸函数与凸规划,直观上,凸集就是空间中内部无“洞”,边界又不向内凹的一些点的集合,其基本特征是该集合中任意两点间的线段仍然属于这个集合。,非凸集,凸集,空间中两点间的线段是由点的凸组合定义的。,定义1.4 设,是,中的,个已知点。,点,,若存在满足,的非负实数,对于,使得,,则称,是,的一个凸组合。,又若,是满足,的正实数,则称,是,的一个严格凸组合。,两点,的凸组合,恰
15、是连接两点的,的线段。,线段,而严格凸组合是不含端点,定义1.5 设集合,。如果,中任意两点的,,那么集合,称为凸集。,任意凸组合仍然属于,规定:空集是凸集。,常见的凸集有直线,球.,定理1.5 凸集的交集是凸集。,2.凸函数,定义1.6 设,,其中,为凸集。若对于,中的任意互异两点,和任意一对满足,的非负实数,,,总有,则称,是定义在凸集,上的凸函数。又若对于任意,的正实数,,总有,一对满足,则称,是定义在凸集,上的严格凸函数。,若,是凸集,上的(严格)凸函数,则称,是凸集,上的(严格)凹函数。,凸函数有以下重要性质。,定理1.6,(1)若,是定义在凸集,上的凸函数,,是,也是,上的凸函数。
16、,任意的非负实数,则,(2)若,是定义在凸集,上的凸函数,则,也是,上的凸函数。,由定理1.6易见,定义在凸集上的任意有限个凸函数的任意非负组合仍然是凸函数。判断一个函数是否为凸函数,一般说来,是比较困难的。但当函数可微时,有以下判定定理。,定理1.7 设,是可微函数,其中,为,凸集。则,),为凸函数的充要条件是对于,中的任意两点,,都有,),为严格凸函数的充要条件是对于,中的任意,都有,两个互异点,定理1.7有明显直观的几何解释。可微函数为凸函数的充要条件是在其定义域凸集中任一点处的切平面(切线)都不在曲面(曲线)的上方。右图画出了一维的情形。,3.凸规划,设,是定义在非空凸集,上的凸函数,
17、,则形式为,(1.36),的最优化问题称为凸规划问题,简称凸规划。换言之,定义在凸集上的凸函数的极小化问题是凸规划问题。,若,都是,上的凹函数,,都是,上的线性函数,容易验证集合,是凸集。在这种情况下,凸规划(1.36)可以表示成如下形式,(1.37),下面的定理指出了凸规划的一些重要性质。,定理1.8 设,是凸规划(1.36)的局部极小点。则,i),是(1.36)的全局极小点;,ii)当,是严格凸函数时,,是(1.36)的唯一极小点;,iii)(1.36)的全部极小点的集合是凸集。,定理1.9 设,是可微凸函数,,是非空,。,凸集,,则,是凸规划(1.36)的极小点的充要,中任意一点,,总有
18、,。,条件是,对于,定理1.9表明,凸规划(1.36)在最优点处的任何容许方向都不是下降方向。,推论1.10 设,是可微凸函数,,是非空,凸集,,。若,使得,,则,是凸规划(1.36)的全局极小点。,4.二次函数与二次规划,函数,(1.38),称为,元二次函数,其中,是对称矩阵。若,是正定的,则(1.38)称为正定,二次函数。,,,,,注意到,,,于是得知:正定二次,函数是严格凸函数。在最优化算法构造中,正定二次函数起着特殊的作用,在多种模型中均有运用。,形式为,(1.39),的最优化问题称为二次规划问题,简称二次规划。若,是半正定的或正定的,则(1.39)称为二次凸规划。,定理1.11,一个
19、,对称矩阵,为正定矩阵的充,要条件是,的各阶主子式皆大于零。,1.7 极小点的判定条件,函数,在局部极小点满足什么条件?反之,满足,什么条件的点是,的局部极小点?,定理1.12 设,具有一阶连续偏导数,,是,的内点。若,是,的局部极小点,则,(1.40),注意,条件式(1.40)不是充分的,仅仅是必要的。,例如,,在点,处的梯度是,但是点,是这个双曲抛物面的鞍点,而,不是极小点。,根据定理1.12容易得到凸规划问题全局极小点的一个一阶充分且必要条件。,推论1.13 设,是可微凸函数,,是非空凸集,,。则,是(1.36)的全局极小点的,充要条件是,.,定义1.14 设,可微,,若,,则,称为,的
20、驻点。,驻点包括极大值点、极小值点和鞍点。,定理1.14 设,具有二阶连续偏导数,,,且,。若,正定,则,是,的严格局部极小点。,一般来说,这个定理仅具有理论意义。因为对于复杂的目标函数,Hesse矩阵不易求得,其正定性也很难判定。,利用以上定理不难说明下面的论断。,对于正定二次函数,,,是它的唯一极小点。,推证如下:首先求出二次函数的驻点。令,因为,是正定矩阵,所以解出唯一驻点为,(1.41),因此根据推论1.13可以断定,,是唯一的极小点。,1.下降迭代算法,1.8 算法及有关概念,在集合,上的迭代算法是指:开始,选定一个初始点,,置,。然后按某种规则,,把第,次迭代点,映射为新的一点,,
21、记为,,并置,这称为完成了第,次迭代。,这个过程无限地进行下去,,。因此,规则,称为算法。,就会产生一个点列,若点列,收敛于,,则称算法,在,上是收敛的;,否则,称算法,在,上是发散的。特别地,当,问题时,若除满足计算终止准则的迭代点,是最优化,外,对于每个,,都有,,则称,为下降迭代,许多最优化方法都采用将多维问题转化为一维问题的处理方式。下面以无约束问题为例,说明采用这种方式时的下降算法的基本迭代格式。,设第,次迭代点,已求得。若它不满足终止准则,,。对于可微目标函数,即,那么在该点必存在下降方向,是满足,的,。按某种规则选取一个,,例如,,再沿这个方向适当地前进一步,即在直线,上确定一个
22、新点,,使得,这就完成了第,迭代。上式中的,称为搜索方向,,称为步长因子。,不过,计算机只能进行有限次迭代。因此,一般说来,数值计算不能求到精确解,而只能得到近似解。当迭代点满足事先给定的精度要求时,就终止计算,并把这个迭代点当作问题的最优解。,在上数述迭代过程中,有两个规则需要确定:一个是,的选取规则;一个是步长因子,的选取规则。,下降方向,不同的规则对应着不同的最优化方法。,综上所述,无约束问题下降算法的基本迭代格式如下:,选定初始点,,置,。,按某种规则确定下降方向,。,按某种规则确定,,使得,置,。,判定,是否满足终止准则。若满足,,则打印,和,;否则,置,转。,2.直线搜索及其性质,
23、在搜索方向,已经确定的前提下,选取步长因子的,方法有多种。例如,取步长因子为某个常数。但在实际计算中,最常用的方法是直线搜索(又称一维搜索),,即选取,,使得,(1.43),按这种方法确定的步长因子称为最优步长因子。这种选取方法是很自然的。既然下降方向已经确定,就应该沿这个方向找到使目标函数取极小值的点。,求一元函数极小点的迭代法称为直线搜索或一维搜索。许多最优化方法都采用将多维问题转化为一维问题的处理技术。因此可以说,一维搜索是最优化方法的一个重要支柱。这种方法的优点是,它使目标函数值在搜索方向上下降得最多;缺点是,计算量较大。在第3章中将全面介绍直线搜索。,为简便起见,今后用记号,(1.4
24、4),表示从点,出发沿,方向对目标函数,作直线,。在目标函数,确定的条件下,,搜索得到极小点,(1.44)等价于,(1.45),直线搜索的一个重要性质。,定理 1.19 设目标函数,具有一阶连续偏导数。若,,则,证 使用反证法。假设,,则,或,(1.47),(1.48),(1.47)表明,是点,处的下降方向,(1.48)表明,是点,处的下降方向,,这都与,相矛盾。,。,故必有,若,是从点,出发沿,方向对目标函数,搜索得到的极小点,则(1.46)指出,梯度,搜索方向向量,正交。,作直线,必与,又因为,与目标函数过点,的等值面(等直线),正交,所以搜索方向向量,与这个等值面(等直线)在点,处相切。
25、,3.计算终止准则,设某个算法产生的点列,收敛于最优解,。,现在的问题是:在计算机上计算时,计算到哪一个,迭代点才有把握地说它就是所求问题的(近似)最解?,显然,当,小于预先给定的误差限时就可以,就是所求的最优解。,认为,但事实上,是未知的,因而,无法计算,。不过,由极限理论知道,当,与,都很小时,,也必然很小。于是,在,数值计算中,可以用,(1.51),作为计算终止的一个判定条件,其中,是预先给定的计算,终止的界限,今后称为终止限。,但是,用(1.51)作为终止准则是不可靠的,因为,很小并不能保证,很小。,下面图1中画出了一条一元目标函数的曲线及其有关的点。,从图中可以看到,相邻两个迭代点,
26、和,已经很,靠近了,,但它们距极小点,却都很远,而且这两点的,目标函数值,和,还由极限理论知道,当,相差很大。,很小时,,也必然很小。因此,如果加上,(1.52),这个条件,那么可靠性就会加强。上图2指出了只采用(1.52)也是不可靠的。虽然,与,相差很小,可,是相应的两个迭代点,和,却相距很远,它们距极,也很远。,小点,需要注意的是,实际应用中,由于,和,所取的量,纲有时太大,这时如果仍然以(1.51)和(1.52)作为终止准则就太严格了。结果要么是用更多的计算才能使得(1.51)和(1.52)得到满足,而这是不划算的;要么是永远不能满足。解决这个问题的办法是,,先对,和,作无量纲处理,然后
27、再结合(1.51)和(1.52),给出,(1.53),和,(1.54),作为终止准则。,此外,有一类无约束最优化方法在求解过程中利用了梯度。由于,为极小点的必要条件是,。因此,,当,满足,(1.55),时,一般可以认为,就是所要求的最优解。由于条件不是,充分的,所以单独以(1.55)作为终止准则也是不可靠的。,最后的结论是:对于使用导数的最优化方法,可按以上三个判别过程作为终止准则;对于不使用导数的最优化方法,则只需把涉及,的部分去掉。今后,统称为Himmelblau计算终止准则,简称H终止准则。,例1:已知,求,解:,,,例2:用图解法求解,解:,画出目标函数,的等值线;,画出等式约束,的图
28、形,它是一条抛物线;,画出不等式约束所代表的区域。,容许集为抛物线的一段,最优解为目标函数的等值线与容许集的切点,即最优点满足方程,公切线平行,轴,切点为,代入得,解得,或,得切点,不在容许集上,最优点为,最优值点,交点,例3:用图解法求解,画出目标函数,的等值线;,画出等式约束,解:,的图形,它是一条抛物线;,画出不等式约束所代表的区域。,容许集为抛物线的一段,最优解为抛物线的端点,即方程,的解,最优值,目标函数的等值线与容许集的切点,即最优点满足方程,切点,点,不在容许集上.,最优解,例4:设目标函数为,从点,出发,沿,的方向,作直线搜索,试求搜索到的极小点,并验证,解:,例5:判别最优化
29、问题是否为凸规划,解:,正定,并用图解法求出最优点。,从图上可判别出容许集为淡绿色区域,此区域为凸集,故此最优化问题为凸规划。,都为半平面,它们的交集为凸集,以下判别,为凸函数。,各阶主子式非负,,为凸函数。,为凸集。,即容许集为凸集。,由图解法可求得局部极小点,它一定是此最优化问题的全局最优点。,最优点满足条件,解得,为全局最优点。,在最优化中,目标函数和约束函数皆为线性函数的优化问题称为线性规划(LP),它是相对简单的最优化问题。本章是有关线性规划的理论与求解方法的内容。,第二章 线性规划,2.1 线性规划的各种形式,1.标准形式和典范形式,如下形式的线性规划,称为线性规划的标准形式。,其
30、中各,称为价格系数,各,采用向量矩阵表示法,标准形式可以简写为。,(2.1),称为右端项。,(2.2),在进行理论分析时,有时需要把,表示成,这样,(2.2)中的,又可写成,若,中有,个列向量可以合并成为单位矩阵,且,例如,如下线性规划,,此时(2.2)则称为线性规划的典范形式。,就呈现为典范形式,因为,和,可合并,成单位矩阵。,不失一般性,假定单位矩阵位于前,列,即典范,形式呈现为,(2.3),其中,。,用向量矩阵表示法,那么(2.3)可简写成,(2.4),2.一般形式,线性规划,(2.5),3.一般形式与标准形式的关系,(1)松弛变量,考虑“,”约束中的第,个不等式,(2.6),引入非负变
31、量,,迫使,使不等式约束(2.6)变为等式约束(2.7)的非负变量,称为松弛变量。,(2)剩余变量,考虑“,”约束中的第,个不等式,(2.7),(2.8),引入非负变量,,迫使,引入非负变量,,迫使,使不等式约束(2.8)变为等约束(2.9)的非负变量,(2.9),称为剩余变量。,在引入,个松弛变量、,个剩余变量后,线性规划,(2.5)可化成标准形式:(它含有 个变量 个等式约束),(2.10),该结论表明,可以只讨论标准线性规划。,例2.1 将线性规划,化为标准形式,并用图解法求解原问题,给出标准形式的解。,解 对第1个约束引入松弛变量,,对第2个约束引入,。于是,该线性规划的标准形式为,剩
32、余变量,图解法求解原线性规划如下:,最优解,在直线,与,的交汇处,即,。相应的标准形式的最优解为,。,(3)自由变量,以上讨论都考虑变量的取值是非负的(当变量的取值非正,那么它的负变量的取值即是非负的)。实际中,如果某些变量没有这种约束,也就是说,某些变量可以任意取值,那么这些变量称为自由变量。自由变量可以通过以下两种方法把它消除。,例如,假若,是自由变量。,第一种方法:引入两个非负变量,和,,令,(2.11),将其代入到线性规划的目标函数和约束函数中,自由变量,就消除了。注意,求出新线性规划的最优点后,再利用(2.11)便可以定出,。,第二种方法:取一个包含,的等式约束,例如,由此解出,(2
33、.12),将此式代入到线性规划的目标函数和其他约束函数中,自由变量,也消除了。求出新线性规划的最优点后,,。,利用(2.12)再定出,第一种方法将增加变量的数目,导致问题的维数增大。第二种方法正好相反。,2.2 基本定理,考虑标准线性规划(2.2),即,记容许集,。不妨假定,,,。,1.极点与基本容许解,定义2.2 把 多面体的任何一个面伸展成平面,如果所有其他各面都在这个平面的同侧,称为凸多面体。凸多面体是凸集。,边界为直线或平面是多面体的几何特征。,多面体,凸多面体,定理2.1 线性规划(2.2)的容许集,是凸多面体。,(2)凸集的极点,与凸集相关的另一个重要概念是凸集的极点。,定义2.5
34、 若凸集,中的某个点,不能表示为这个集合,中另外两个不同点的严格凸组合,即,则,称为凸集,的极点。,(3)基本容许解,当(2.2)的容许解又是“,的基本解”时,就,称其为(2.2)的基本容许解。,方程组,满足“基本”条件的的解称为,的基本解。,的基本解是如何定义的呢?,将,表示成向量形式,因为,,故,中必含有,阶的可逆矩阵,,称为,基。基,的每个列向量称为基向量,,的其余列向量称为,非基向量。与基向量对应的变量称为基变量,与非基向量对应的变量称为非基变量。若基是单位矩阵,则称为标准基。非基变量取值皆为0的,解称为基本解。满足,的基本解称为线性规划(2.2)关于基,的基本,容许解。,不失一般性,
35、设,则,令,。若,,得基本解,么该基本解是关于基,的基本容许解。,,那,定义2.10 基变量取值皆不为0的基本解称为非退化的,否则称为退化的;若(2.2)的所有基本容许解都是非退化的,则线性规划(2.2)称为非退化的,否则称为退化的。,(3)基本容许解与极点的关系,引理2.2 设,,,,,。则,是基本容许解,的正分量所对应的,的列向量线性,无关。,定理2.3 设,则,是(2.2)的基本容许解,是,的极点。,从几何角度讲,约束条件,表示空间一条直线在第一象限中的直线段部分。如图所示:,红线部分为容许集,。,有两个极点,和,它们恰恰是两个基本容许解。,如图所示:,有两个极点,和,推论2.4 容许集
36、,的极点个数有限。,2.线性规划基本定理,引理2.5 设,.不妨设,且,线性相关。那么一定存在最多有,个正,分量的容许解。,定理2.7 线性规划(2.2)若有容许解,则必有基本,容许解。,定理2.8 线性规划(2.2)若有最优解,则必有最优基本容许解。,从几何上看,解线性规划存在以下几种可能情形:,唯一解 无穷多解 解无界 无解,2.3 单纯形法,由前述知,(2.2)的容许集,是凸多面体,,中的,极点个数有限,又根据定理2.7、2.8,对于线性规划,我们只关心基本容许解即可。因此,一个显而易见的求解方法是求出全部基本容许解(极点),比较目标函数值就能确定最优解。可是,当,数值较大时,这种方法,
37、的计算量相当大,逆矩阵也不易求。Dantzig给出的单纯形法基本上解决了这个问题。单纯形法的基本思想是:首先找到(求出)一个极点(基本容许解),,并依据最,优性准则判断其最优性,如非最优,则沿凸多面体,条棱找到(迭代到),的一,使目标值降低(不找比,的)的下一个极点(基本容许解),的目标值高,数是有限的,所以在一定的条件下,总可以找到(迭代到),,。因为极点个,最优极点(最优基本容许解)或者说明解无界。,如图所示。,Dantzig单纯形法的思想涉及以下三个具体问题:,有最优点 解无界,一、初始基本容许解的产生;,二、最优性准则;,三、基本容许解的改进。,1.最优性准则,考虑标准线性规划,(2.
38、21),设,为容许基。,并不妨设,。,将(2.21)改写为,(2.22),令,,得关于,的基本容许解,目标函数值,设,为任一容许解,则由(2.22)解出,代入目标函数中得,令,,于是,(2.26),故,.,因为,,因此,只要,,必有,由此得到判断基本容许解是最优解的一个充分条件。,定义2.11 在标准线性规划(2.21)中,设,是一个,基,则,称为变量,关于基,的判别数。,判别数的向量形式为,易知,。,定理2.9(线性规划最优性准则)在标准线性规划(2.21)中,设,是容许基。若所有变量关于基,的判别,数皆非正,则关于基,的基本容许解是最优解。,定义2.12 在标准线性规划(2.21)中,若关
39、于基,基本容许解是最优解,则称,是最优基。,例2.3 考虑标准线性规划,试分别求关于基,和,的基本解。若是,容许解,则判别其最优性。,解,关于,的基变量取值,故关于,的基本解,是基本容许解。计算,最优性准则未满足,因此不能断定,是否是最优解。,因此关于,的基变量取值,故关于,的基本解,也是基本容许解。计算,最优性准则满足,因此断定,是最优解。,2.基本容许解的改进,(1)Gauss-Jordan方程组,假定,是(2.21)的一个基。由,得等价方程组,记,则(2.28)可写成,(2.28),(2.29),(2.29)称为关于基,的Gauss-Jordan方程组(G-J方程组)。,典范线性规划的主
40、约束即是一个G-J方程组。,G-J方程组的性质:,)一个基决定唯一的G-J方程组;,)若,是容许基,则由其G-J方程组可得出关于,的基本容许解,)在G-J方程组中,基变量的系数向量构成单位矩阵。,性质)说明求新的基本容许解的过程实质上就是不同基的G-J方程组间的转化过程。这个转化过程很容易实现。,设,是新基,是用非,基向量,替换,中的,得到的矩阵。,这时G-J方程组间的,转化过程就是要将非基变量,的系数向量,变为单位,向量,(性质).要实现这个过程,则必须有元素,,,称为主元。转化过程显示如下:,关于基,的Gauss-Jordan方程组,关于基,的,Gauss-Jordan方程组,为保证解的改
41、进,替换须满足以下两个条件:,第一,容许性条件。即保证,的G-J方程组的右端项,非负的条件。,第二,下降性条件。即保证,的基本容许解的目标函,的基本容许解的目标函数值的条件。,数值小于,i)容许性条件,由,,即主元还必须为正。,结论是:为保证,的G-J方程组的右端项非负,,(2.36),主元,必须是满足,的正数。,如果主元不存在,,则线性规划解无界。,例2.4 考虑例2.3中的线性规划,关于,的,G-J方程组,试把,和,分别引入基,求新的基本,容许解。,)下降性条件,新解,。,中只有,其余分量皆为0。于是,由(2.26)式得,(2.37),由于,,所以只要,,则,特别当,时,只要,,必有,结论
42、是:引入判别数为正的变量,将保证,的基本,的基本容许解的目标函数值。,容许解的目标函数值不大于,定理2.11(单纯形法基本定理)在标准线性规划,(2.21)中,假设:,),是容许基,关于,的基本容许解,;,是非退化的,即,)非基变量,的判别数,;,),,,是用公式(2.36)确定的一个,行标;,)用,替换,中的,,而其余基向量不变,构成,。,矩阵,那么,,是容许基,且关于,的基本容许解的,目标函数值小于关于,的基本容许解的目标函数值。,定理2.12 在标准线性规划(2.21)中,假设:,),是容许基;,)非基本变量,的判别数,;,),。,那么线性规划(2.21)存在可以使目标函数值任意减小的容
43、许解。,(2)单纯形表,以上过程都可以清晰地在一张表单纯形表上进行,称之为表上作业法。,假设已知(容许)基,,那么关于,的信息全部反映在以下两个式子(线性规划的两个关键数学式)中,,称之为关于基,的增广G-J方程组。,增广G-J方程组其实可由线性规划(2.21)的原始数据经初等行变换得到。原有,(2.45)式左乘,即得(2.43)式,(2.43)式再左乘,加到(2.46)式上便得(2.44)式。,隐去增广G-J方程组中的变量和,的系数向量,将,其余数据列成表,(2.51),称为关于基,的单纯形表。若,是最优基,则称为最优表。,单纯形表是增广G-J方程组的简单表示。,表,称为线性规划的准备表。,
44、类似前面的推导,由准备表容易导出单纯形表,至此,含有标准基的线性规划问题的求解彻底解决。,(3)典范线性规划的解法,考虑典范线性规划,是标准容许基。,典范线性规划含有标准容许基,它的准备表既是单纯形表,因此单纯形法可以直接启动。,单纯形法本质上是求解典范线性规划的算法。,定理2.13 在使用单纯形法求解典范线性规划时,若各次迭代出的基本容许解皆是非退化的,则算法在有限步终止。,推论2.14 典范线性规划或者存在最优基本容许解,或者解无界。,对于如下形式的线性规划,其中,。先引入非负变量,将其化为典范形式,然后就可以启动单纯形法。,3.初始基本容许解的产生,对于标准线性规划,(2.54),引入,
45、个人工变量,,求解辅助线性规划,一个典范线性规划,(2.55),其中,。,显然(2.55)不可能无解。,设(2.55)的最优值为,,显然,。设最优表,对应的G-J方程组为,(2.56),注意:,与,等价。,(2.54)与(2.55)的关系:,若,,则(2.54)无解;,若,,则由(2.56)可得到(2.54)的一个初始基本,容许解。,以下讨论在,下进行。分两种情形:,(1)在最优表中人工变量已全部退出基变量(表现为,中不存在基向量)。,这时,与,等价的,中有了标准基,,表明(2.54)有了初始基本容许解,这时可以开始求解(2.54)(见下面的4.(1)。,即,(2)在最优表中至少还有一个人工变
46、量是基变量(表,中有基向量)。,现为,假设第,个人工变量,仍是基变量,那么它的取值为,。因为,,所以,。考虑(2.56)的第,个方程,(2.58),以下分两种情形:,)若,,则(2.58)实质上成为,的第,个方程是多余方程,,。这表明,从而,的第,个方程也多余。,划去第,个方程,人工变量,将彻底消失。,)若,至少有一个不为0,,不妨设,以,为主元在最优表上进行换基运算,人工变量,就会从基变量中消失。,重复以上步骤,直到人工变量全部从基变量中消失,最终的G-J方程组为,这时与,等价的,中也有了标准基,从而,(2.54)也有了初始基本容许解,于是可以开始求解(2.54)(见下面的4.(2)。,4.
47、标准线性规划的解法,按3.求出(2.54)的初始基本容许解之后,接下来求解(2.54),与3.中的(1)、(2)对应,分别为,(1)求解线性规划,(2)求解线性规划,总结:一般来说,解线性规划主要分为两大步:,第一步,化标准形;,第二步,启动两阶段单纯形法(当标准形是典范线性规划时,直接进入第二阶段)。,例 求解线性规划,2.4 退化的处理,在非退化假定下,单纯形法具有有限终止性(定理2.13)。取消非退化假定,情况会是怎么样?第一,算法2.1可能发生无限循环,求不到最优解;第二,适当修改选主元的规则,则可以保证单纯形法仍具有有限步终止性。,1.选主元规则,单纯形法的核心是换基运算,而换基运算
48、的首要步骤是选主元。选取主元列标的规则称为进基规则;选取主行标的规则称为退基规则。进基规则和退基规则合称选主元规则。选主元规则有多种多样,常用的进基规则有以下两种:,)最大正判别数进基规则,)正判别数最小下标进基规则,选取正判别数中最小的下标作为主元的列标。,常用的退基规则是最小行标退基规则。在使用公式(2.36)确定主元行标,若最小比值在多行上取得,则从中选取最小的行标作为主元的行标。,选取最大判别数的下标作为主元的列标。若同时有多个等值的最大正判别数,则选取其中最小的下标为主元的列标;,最大正判别数进基规则与最小行标退基规则合称Dantzig规则。计算实践表明,在各种选主元规则中,Dant
49、zig规则效果较好,在求解同一线性规划问题时,迭代次数相对较少。它的缺点是,在求解退化问题时,算法可能产生无限循环,求不到最优解。,2.避免循环的规则,这里介绍一种最简单的避免循环的规则Bland规则。,Bland规则 设在单纯形法的迭代过程中,当前容许基是,关于,的基容许解不是最优解,则,主元列标和行标分别由如下两个规则确定:,)Bland进基规则,采用正判别数最小下标进基规则,即主元列标是,由此确定,进基。,)Bland退基规则,假定,。设,又设,则主元行标,由式,确定,由此确定,退基。换句话说,在所有可能的,退基 向量中,选取下标最小的向量退基。,Bland证明:使用带有Bland规则的
50、单纯形法求解典范线性规划,不会发生基的循环。,2.5 修正单纯形法,修正单纯形法是计算机实现的单纯形法。,注意到,包含全部信息的单纯形表,中的数据完全由基,(实际是,)及原始数据决定。可以,就有一切。,说有,第三章 无约束最优化方法,从本章起,以后两章将讨论非线性规划问题。本章首先讨论无约束最优化问题,其一般形式为,(3.1),其中,求解无约束问题的最优化方法可以分为两大类:一类是根据目标函数的梯度(即一阶导数),有时还要根据Hesse矩阵(即二阶导数)提供的信息构造出来的方法导数方法。本章介绍其中的最速下降法、Newton法、共轭梯度法和拟Newton法。另一类是不使用导数,仅仅利用目标函数