第二节-最优化原理与动态规划课件.ppt

上传人:牧羊曲112 文档编号:4095220 上传时间:2023-04-03 格式:PPT 页数:33 大小:2.36MB
返回 下载 相关 举报
第二节-最优化原理与动态规划课件.ppt_第1页
第1页 / 共33页
第二节-最优化原理与动态规划课件.ppt_第2页
第2页 / 共33页
第二节-最优化原理与动态规划课件.ppt_第3页
第3页 / 共33页
第二节-最优化原理与动态规划课件.ppt_第4页
第4页 / 共33页
第二节-最优化原理与动态规划课件.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《第二节-最优化原理与动态规划课件.ppt》由会员分享,可在线阅读,更多相关《第二节-最优化原理与动态规划课件.ppt(33页珍藏版)》请在三一办公上搜索。

1、一、动态规划方法导引 1.全枚举法或穷举法。共有18条可能路线,进行比较,求得最优路线Q A3 B1 C1T。,2.“局部最优路径”法:选择当前最短途径,“逢近便走”。所取决策必是Q A1 B2 C2T,全程长度是13。,全枚举法计算工作量将会十分庞大。局部最优求出的解不一定是最优解。,3.动态规划方法就是从终点逐段向始点方向寻找最短路线的方法。解题步骤如下:把问题划分为几个阶段。按阶段顺序首先考虑最后阶段如第四阶段的最优决策,也就是走哪条路线最短。按阶段顺序依次考虑第三、第二,第一阶段的最优决策,为此只需确定每一阶段上各初始点的最优决策即可。,用动态规划方法逐段求解时,每个阶段上的求优方法基

2、本相同,而且比较简单,每一阶段的计算都要利用上一阶段的计算结果,因而减少了很多计算量。阶段数愈多,这种效果愈明显。,二、动态规划解题 标号法:,最短路径:Q A3 B1 C1T,0,T,3,T,4,T,4,C1,7,C2,6,C1,11,B1,B2,8,B1,8,B1,11,A3,三、动态规划的基本概念。,1.阶段(stage)和阶段变量。把所给问题恰当地划分为若干个相互联系又有区别的子问题,称之为多段决策问题的阶段。,用以描述阶段的变量叫作阶段变量,一般以k表示阶段量阶段数k的编号法有两种:(1)顺序编号;(2)逆序编号法。,2.状态(state)、状态变量和可能状态集(1)状态与状态变量。

3、,(2)动态规划维数。,(3)可能状态集:用S(sk)表示。,3.决策(decision)、决策变量和允许决策集合(1)决策。,(2)决策变量:xk=xk(sk)决策变量xk(sk)的允许决策集用Dk(sk)表示,xk(sk)Dk(sk)允许决策集合实际是决策的约束条件。,4.策略和允许策略集合策略(Policy)全过程策略指具有n个阶段全部过程,简称策略。表示为 x1(s1),x2(s1),xn(sn)。k后部子过程策略,表示为pk(xk),(2)允许策略集合记作P。最优策略:从允许策略集中,找出的具有最优效果的策略。,5.状态转移方程(状态转移律):多阶段决策过程的发展就是用阶段状态的相继

4、演变来描述的。,或简写为,6.指标函数,(1)阶段指标函数(也称阶段收益)vk(sk,xk)简记为vk。,(2)过程指标函数(指标函数)。Vk,n(sk,xk,sk+1,xk+1,sn,xn)。简记为Vk,n。,动态规划求解的问题的过程指标函数(指标函数),必须具有关于阶段指标的可分离形式(和、积或其他形式):,表示某种运算,可为加、减、乘、除、开方等。,常见有:,和,相应的子策略称为sk状态下的最优子策略,记为pk*(sk);而构成该子策赂的各段决策称为该过程上的最优决策,记为,7.最优指标函数:fk(sk),有简记为,8.概念的关系。,阶段kT(sk,xk),阶段k+1T(sk+1,xk+

5、1),四、最优化原理与动态规划的数学模型 1.最优化原理(贝尔曼最优化原理)若某一全过程最优策略为:,则,2.动态规划的数学模型(逆序法时),或,(8.3b)和(8.3d)称为边界条件。,五、动态规划方法的基本步骤,1.阶段的划分,2.正确地定义状态变量sk,(1)要能够正确地描述受控过程的变化特征。(2)包含到达这个状态前的足够信息,且满足无后效性。(3)要满足可知性。,3.正确地定义决策变量及各阶段的允许决策集合Dk(sk)4.能够正确地写出状态转移方程,至少要能正确反映状态转移规律。,5.根据题意,正确地构造出指标函数,应满足下列性质:(1)可分性,。(2)为了进行动态规划计算满足递推性

6、,,或,6.确立边界条件写出动态规划函数基本方程。,阶段1,阶段2,阶段k,阶段k+1,阶段n,状态S1,决策x1,状态S2,v1,决策x2,状态S3,v2,决策xk,状态Sk+1,vk,决策xk+1,vk+1,决策xn,vn,寻求最优解的方向,六、动态规划的分类,离散决策过程,连续决策过程,根据多阶段决策过程的时间参量,确定性决策过程,随机性决策过程,离散确定性决策过程,连续确定性决策过程,离散随机性决策过程,连续随机性决策过程,七、学习方法建议第一步 先看问题,充分理解问题的条件、情况及求解目标。第二步 分析针对该动态规划问题的“四大要素、一个方程”。第三步 动手把求解思路整理出来,或者说,把该问题作为习题独立的来做。,精品课件!,精品课件!,第四步 把自己的求解放到一边,看书中的求解方法,要充分理解教材中的论述。第五步 对照自己的求解,分析成败。动态规划的四大要素 状态变量及其可能集合 sk Sk 决策变量及其允许集合 xk Dk 状态转移方程 sk+1=Tk(sk,xk)阶段收益 vk(sk,xk),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号