《《决策运筹学》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《决策运筹学》PPT课件.ppt(46页珍藏版)》请在三一办公上搜索。
1、1,第八章 决策论,李勇建 博士,2,不确定环境中进行决策,实际问题,制造商向市场推出新产品 潜在顾客将会做出什么反应?制造商应当生产多少产品?是否需要在一个小区域中进行试销?为了成功推出产品,需要打多少广告?政府工程承包商投标一个新的合同 工程的实际成本是多少?哪些公司会投标?他们可能的投标价是多少?,3,决策分析介绍,确定性决策(Decisions Under Certainty)自然状态确定(State of nature)选择产生最大收益的决策例子:生产组合(Product Mix)分销配送(Distribution)人员排程(Scheduling),4,不确定下的决策(风险决策)自然
2、状态不确定(有多个可能状态)例子:石油勘探 新产品开发 拍电影,决策分析介绍,5,石油勘探问题,一个石油勘探公司要对是否对新疆某地进行石油勘探,如果勘探则发生$200,000的勘探成本,如果发现石油,值$800,000.如果没有发现石油则价值为0,收益表,实际举例,不勘探,勘 探,有油,没油,0,0,600000,-200000,决策问题的特征:,一系列可供选择的决策;具有一系列的未来可能出现的自然状态;每个自然状态下,每个选择都对应一个支付数;对未来事件发生的可能性进行估计;决策的评估标准。,6,7,决策分析术语,决策者(Decision Maker)是对一个决策(或一系列决策)负责的人或团
3、体 备择方案(Alternatives)是决策者将作出的决策的选项 自然状态(State of nature)决策结果受到决策者无法控制的随机因素影响 收益(Payoff)每一种决策的备选方案及自然状态的组合都会导致某种 结果,是衡量决策结果对决策者的价值的量化指标,8,【例1】(投资问题)请问如何决策?S1:经济形势上升S2:经济形势稳定S3:经济形势下滑,表1:证券投资收益表(单位:元),9,不确定性决策准则,悲观准则(Maximin准则)乐观准则(Maximax准则)折衷准则(Hurwicz准则)等可能准则(Laplace准则)遗憾准则(Minimax regret准则),10,【例1】
4、(投资问题)请问如何决策?悲观准则乐观准则折衷准则等可能准则,其中0.6,表1:证券投资收益表(单位:元),11,(5)遗憾准则,遗憾准则的后悔矩阵,12,最终结果为,不同准则下的决策结果,13,14,总结,悲观准则(Maximin准则):对未来持悲观态度。从每个方案可能出现的最差结果出发,从最不利的结果中选取最有利的结果。乐观准则(Maximax准则):对未来持乐观态度,总是假设会出现对自己最有利的状态。折衷准则(Hurwicz准则):介于悲观准则和乐观准则之间。采用一个乐观系数来反映决策者对状态估计的乐观态度。等可能准则(Laplace准则):将各种可能出现的状态“一视同仁”,认为各状态出
5、现的可能性是相等的。选择具有最大平均收益的方案为最优方案。遗憾准则(Minimax regret准则):基本思想是尽量减少决策后的遗憾,使决策者不后悔或者少后悔。,15,举例,某书店希望订购新出版的一部书籍。据以往经验,新书的销售量可能为50本,100本,150本,或200本。已知每本新书订购价为4元,零售价为6元,剩书的处理价为1元。试分别用乐观难则、悲观准则、折衷准则(乐观系数=0.8)和遗憾准则确定该书的订购量。,乐观准则100200300400,悲观准则100-50-200-350,折衷准则100150200250,16,后悔矩阵 s1 s2 s3 s4 0 100 200 30015
6、0 0 100 200300 150 0 100450 300 150 0,最大后悔300200300450,所以,所作决策分别为乐观准则:采购200本;悲观准则;采购50本;折衷准则:采购200本;遗憾准则:采购100本,17,2 风险决策,【例2】继续考虑例1。根据经验估计,经济形势S1,S2,S3三种情形发生的先验概率分别为0.1,0.5,0.4。此时投资者应该选择哪种方案,使的收益最大?再者先验概率对自然状态的估计可能不准确,那么花费一些钱以获得更好的估计(后验概率)是否值得呢?若此概率信息需要花费15万元才能购买得到,则投资者是否值得去购买这些信息?,0.1 0.5 0.4,表1:证
7、券投资收益表(单位:元),18,先验决策概率最大原则,概率最大的那一个状态在一次决策中最可能出现,因此应该在具有最大发生概率的状态下选择行动方案。具体方法:发现概率最大的自然状态 选择在这种自然状态下收益最大的备择方案 如上例,应该在状态S2前提下选择方案A2。存在的问题如果这些其他收益中有一些是致命的怎么办?如果其他这些收益远比所选择的方案的收益丰厚怎么办?如果最可能的自然状态下收益的差异远小于另一个具有一定可能性的自然状态下的收益,那么决策者会更加关注后者 如果有很多种自然状态且它们的可能性几乎相同,最可能自然状态变为现实的概率就会相当低,19,先验决策最大期望收益(Bayes)准则,适用
8、于一次决策多次重复进行生产的情况。具体方法:每一种备择方案,将每一个收益乘以相应自然状态的先验概率,乘积相加就得到收益的加权平均选择具有最大期望收益的备择方案 在例2中,根据Bayes准则决策结果是选择方案A2,可得收益565元.,0.1 0.5 0.4,加权平均475565400,表1:证券投资收益表(单位:元),20,先验决策最大期望收益(Bayes)准则,先验决策问题在WinQSB中的实现方法完全同于不定决策问题的实现,只是在输入数据时,需要确定各状态的概率而已.存在的问题在确定先验概率时,仍然有相当大的不确定性 先验概率在相当大的程度上是主观的,然而安全的决策应当是基于客观数据和程序的
9、对于平均结果,期望(货币上的)收益忽视了可能的结果对决策者的影响,21,2.2 信息价值,通常一个初步的研究会对自然状态的概率有一个更好的近似.例如:市场调研(Market surveys)市场测试(Test-marketing)地震测试(Seismic testing for oil)问 题:我们得为得到这些信息付多少价值呢?,22,全信息价值,EP(无更多信息)=以原始的先验概率用贝叶斯决 策规则得到的期望收益EP(拥有全信息)=如果知道真实的自然状态进行 决策得到的期望收益EVPI=全信息价值=EP(拥有全信息)-EP(无更多信息)C=获取更多信息的花费如果EVPI C,不值得获取更多的
10、信息如果EVPI C,值得获取更多的信息,23,【例3】继续考虑例2.投资者是否需要花费100元购买此完全信息?分析 完全信息价值,为因此不值得购买该信息。,24,2.3后验决策先验概率:由过去经验或专家估计的将发生事件的概率,P(Si);后验概率:利用样本情报对先验概率修正后得到的概率,P(Ii|Sj);【例4】在例2的基础之上,经济形势与经济形势预测结果的关系如表4所示.现问如何决策?,25,全概率公式 其中B1,B2,Bn构成一个完全的概率空间,即一个概率空间分成n个相互独立的子空间。乘法法则:全概率公式 代入贝叶斯公式,26,先验概率,即自然状态概率 P(S1)=0.1;P(S2)=0
11、.5;P(S3)=0.4后验概率(用全概率公式计算)P(I1)=P(I1|S1)*P(S1)+P(I1|S2)*P(S2)+P(I1|S3)*P(S3)=0.75*0.1+0.20*0.5+0.05*0.4=0.1950P(I2)=P(I2|S1)*P(S1)+P(I2|S2)*P(S2)+P(I2|S3)*P(S3)=0.20*0.1+0.70*0.5+0.15*0.4=0.4300P(I3)=P(I3|S1)*P(S1)+P(I3|S2)*P(S2)+P(I3|S3)*P(S3)=0.05*0.1+0.10*0.5+0.80*0.4=0.3750,27,因此,在信息更新后,决策期望收益最大
12、值是572.25,对应方案是A2。,0.195 0.43 0.375,505.0000572.2500460.7500,加权平均,表1:证券投资收益表(单位:元),28,软件实现在WinQSB中,实现后验决策计算的仍是decision analysis模块“Payoff Table Analysis.,29,类似完全信息的信息价值分析,也可以类似分析经济形势预测的信息价值。如本题,后验决策时的期望收益572.25。,30,现已得到补充情报:经济形势 预测结果为好,则如何决策?计算条件概率(用贝叶斯公式计算)P(S1|I1)=P(I1|S1)*P(S1)/P(I1)=0.75*0.1/0.195
13、0=0.3846P(S2|I1)=P(I1|S2)*P(S2)/P(I1)=0.20*0.5/0.1950=0.5128P(S3|I1)=P(I1|S3)*P(S3)/P(I1)=0.05*0.4/0.1950=0.1026 根据后验概率调整决策(按最大期望收益决策准则)E(A1)=800*0.3846+550*0.5128+300*0.1026=620.50E(A2)=650*0.3846+600*0.5128+500*0.1026=608.97E(A3)=1000*0.3846+400*0.5128+250*0.1026=615.37因此最优方案为A1。,31,3 序列决策决策树,某些决策
14、问题,在进行决策后会产生一些新情况,此时需要进行新的决策;接着又会出现新情况,又进行新决策。这样,决策、情况、决策构成一个序列,即序列决策。描述序列决策的工具是决策树。利用决策树对多阶段风险决策问题进行分析是以期望值准则为决策准则。我们前面的风险决策问题可以应用决策树的方法来描述。,32,例4:某公司需要对某新产品生产批量作出决策,各种批量在不同的自然状态下的收益情况如下表(收益矩阵)。N1发生的概率是0.3。,33,决策树,决策,S1,S2,S3,大批量生产,中批量生产,小批量生产,N1(需求量大);P(N1)=0.3,N1(需求量大);P(N1)=0.3,N1(需求量大);P(N1)=0.
15、3,N2(需求量小);P(N2)=0.7,N2(需求量小);P(N2)=0.7,N2(需求量小);P(N2)=0.7,30,-6,20,10,-2,5,4.8,4.6,6.5,6.5,34,决策树法的计算过程,(1)绘制决策树;(2)自右到左计算各方案的收益期望值,将结果标在方案节点处;(3)选收益期望值最大(损失期望值最小)的方案为最优方案。主要符号 决策点 方案节点 结果节点,35,例5:投标决策,华光公司考虑为一项建设工程进行投标。投标准备费为1万元。中标的可能性为40。若中标后能按期保质完成,则可盈利40万元,若延期1月,罚款5万;延期2月,罚款10万。公司有两种修建方法,一是传统方法
16、,该方法按期完成的可能性为60,延期1月的可能性为20,延期2个月的可能性为20;另一个是改进方法,但需要花1.5万元购置一种设备。改进方法按期完成的可能性为85,延期1月的可能性为10,延期2个月的可能性为5。公司是否应该为这项工程进行投标呢?中标后选择哪一种方法呢?,36,14,37.5,14,39,37,0万元,不准备,准备,中标0.4-1万元,不中标0.6,改进,-1.5,不改进,按期完成0.85,延1月 0.1,延2月 0.05,按期完成0.6,延1月 0.2,延2月 0.2,40万元,35万元,30万元,40万元,-1万元,35万元,30万元,37,4 效用函数,【例5】决策问题的
17、期望收益准则比较问题(1):A1:稳获100元;B1:获得250和0元的概率各为50。问题(2):A2:稳获100元;B2:掷一枚硬币,直到出现正面为止,设共掷了N次,则可获取2N元。直观上,大家喜欢选择方案A1和A2。但是因为(1)同一货币量,在不同风险情况下,对同一决策者带来的主观上的满足程度不一样,也就是具有不同的效用值;(2)决策者大多是根据不同结果或方案对其需求个体的满足程度来进行决策的,而不仅仅是依据货币期望收益最大为原则进行决策。(3)效用正是衡量或比较不同商品、劳务满足人的主观愿望的程度,可用来衡量人们对某些事物的主观价值、态度、偏爱、倾向等。,38,风险态度,将货币价值转化为
18、反映决策者偏好的正确标度的途径称为货币效用函数。效用值是一个相对的指标值,无量纲。一般,凡是决策者最爱好、最倾向的事物的效用值为1。对待效用的态度:保守型,风险回避者(Risk Averse)对损失的金额愈多愈敏感。随着货币数量的增加,函数的斜率递减,称为递减的货币边际效用 冒险型,风险偏好者(Risk Seeker)对损失金额的反应比较迟钝。效用函数的斜率随着货币数量的增加而增大,具有递增的货币边际效用 中间型,风险中性者(Risk-neutral)认为钱的价值等同于其货币价值,货币效用简单地与货币的数量呈直线关系,39,效用与风险态度,保守型,冒险型,中间型,40,使用效用值进行决策:首先
19、把要考虑的因素折合成效用值,然后用决策准则下选出效用值最大的方案,作为最优方案。例6:求下表显示问题的最优方案(万元),41,用收益期望值法:E(S1)=0.360+0.540+0.2(-100)=18万E(S2)=0.3100+0.5(-40)+0.2(-60)=-2万E(S3)=0.30+0.50+0.20=0万 得到 S1 是最优方案,最高期望收益18万。一种考虑:由于财务情况不佳,公司无法承受S1中亏损100万的风险,也无法承受S2中亏损50万以上的风险,结果公司选择S3,即不作任何项目。,42,产生效用函数的方法,1,直接提问法 向决策者提出一系列问题,然后让决策者进行主观衡量并作出
20、回答。2,对比提问法 设两种备选方案A1、A2。A1表示无任何风险情况下得到得到金额x2。A2表示可以以概率p得到金额x1,或以概率1-p得到金额x3。若决策者认为 pU(x1)+(1-p)U(x3)=U(x2),则x2对应的效用为p。x1和x3一般取决策问题可能收益的最大和最小值。一般改变x2三次,确定三点的效用,再加上x1,x2,即可由“五点法”确定效用曲线。,43,用效用函数解释:把上表中的最大收益值100万元的效用定为10,U(100)=10;最小收益值-100万元的效用定为0,U(-100)=0。对收益60万元确定其效用值:设经理认为使下两项等价的p=0.95(1)得到确定的收益60
21、万;(2)以 p 的概率得到100万,以 1-p 的概率损失100万。计算得:U(60)=p*U(100)+(1-p)*U(-100)=0.95*10+0.05*0=9.5,44,类似地,设收益值为40、0、-40、-60相应等价的概率分别为0.90、0.75、0.55、0.40,可得到各效用值:U(40)=9.0;U(0)=7.5;U(-40)=5.5;U(-60)=4.0 我们用效用值计算最大期望,如下表:,45,一般,若收益期望值能合理地反映决策者的看法和偏好,可以用收益期望值进行决策。否则,需进行效用分析。对已经构造出的货币效用函数,这个信息可以类似的使用在决策树中。除了用效用来代替货币效益外,用决策树来分析问题的过程是类似的。评估每一节点的值是期望效用而不再是期望收益,得到的最优策略将使得整个问题的期望效用最大。,作业P205,Ex2,3P207,Ex11,46,