《5.2动态规划的基本概念和基本方程.ppt》由会员分享,可在线阅读,更多相关《5.2动态规划的基本概念和基本方程.ppt(19页珍藏版)》请在三一办公上搜索。
1、1,5.2 动态规划的基本概念和基本方程,(一)基本概念,(1)阶段:k,(2)状态变量:Sk,(3)决策变量:uk(Sk),(4)策略,(5)状态转移方程:Sk1 T(Sk,uk),(6)指标函数:Vk,n(Sk),(7)最优指标函数:fk(Sk),2,(二)前例1,(1)阶段:k1,2,6 n=6,(2)状态变量:Sk第k阶段所处的位置 状态集合 如S2:(B1,B2),(3)决策变量uk:在第k段Sk状态时决定选 取的下一段的某点,(4)状态转移方程:Sk1 uk,3,(6)阶段效益:d(Sk,uk)为第k段,采取策略uk 到下一状 态的距离,(5)最优指标函数:fk(Sk):第k段,在
2、Sk状态时到终点G的最 短距离,4,例1 最短路径问题,5,k6,f6(F1)4 f6(F2)3,6,同理 f5(E2)5 u5(E2)F2 f5(E3)9 u5(E3)F2,7,同理 f4(D2)6 u4(D2)E2 f4(D3)8 u4(D3)E2,K=3,8,9,(三)基本方程,或,10,例2,已知某种完好的机器1000台,高负荷时 S1=8y1 a=0.7 低负荷时 S2=5y2 b=0.9,问:每年初应如何安排分配机器,可使得5年总收益最大?,11,解,(1)阶段:k=1,2,3,4,5 n=5,(2)状态变量Sk:第k年初始的完好设备数,(3)决策变量uk:第k年初始分到高负荷下
3、的机器数 Sk-uk:第k年初始分到低负荷下 的机器数,12,(4)状态转移方程:Sk1 0.7 uk+0.9(Sk-uk)=0.9Sk-0.2 uk,(5)最优指标函数:fk(Sk)从第k-5年末采取最优策略的最大收益,(6)一年收益:d(Sk,uk)=8uk+5(Sk-uk)=3uk+5Sk,13,基本方程,14,K=5,15,K=4,16,K=3,17,K=2,K=1,f1(S1)23.7 S1 u1*=0当S11000时 f1(1000)23700,18,结论,第一年1000台投入低负荷 S2 0.9S1-0.2u1 0.9S1 900第二年900台投入低负荷 S3 0.9S2-0.2u2 0.9S2 810第三年810台投入高负荷 S4 0.9S3-0.2u3 0.7S3 567,19,第四年567台投入高负荷 S5 0.9S4-0.2u4 0.7S4 397第五年397台投入高负荷,基本方程,