《离散确定性动态规划模型的求解.ppt》由会员分享,可在线阅读,更多相关《离散确定性动态规划模型的求解.ppt(10页珍藏版)》请在三一办公上搜索。
1,第三节 离散确定性动态规划模型的求解,掌握离散确定性动态规划模型的求解,2,例4:,3,解:(表格法)把12支巡逻队往4个部位派遣看作依次分四个阶段(用k表示,k=1,2,3,4)。(1)状态变量sk表示每个阶段初拥有的可派遣的巡逻队数,是前面阶段决策结果,是本阶段决策依据。(2)各阶段的决策变量就是对各部位派出的巡逻队数,用xk表示。,4,其中pk(xk)表示k阶段派出巡逻队数为xk时,该阶段部位预期损失值。,(3)各阶段允许决策集合为:,(4)状态转移律为:,(5)指标函数为:,5,(6)用fk(sk)表示k阶段状态为sk,以此出发采用最优子策略到过程结束时预期损失值,(7)边界条件为 f5(s5)=0。,6,表8-2,采用逆序法,先考虑给D部位派巡逻队即k=4,7,联合考虑C、D两部位派巡逻队,表 8-3,8,联合考虑B、C、D三部位派巡逻队,8,表8-4,9,联合考虑A、B、C、D四部位派巡逻队,即k=1,表8-5,10,x1*=4,x2*=2,x3*=2,x4*=4。因此该警卫 部门派巡逻队数最优策略为:A部门4支,B部门2支,C部门2支,D部门4支,总预期损失为97单位。,