《第十三章决策分析课件.ppt》由会员分享,可在线阅读,更多相关《第十三章决策分析课件.ppt(59页珍藏版)》请在三一办公上搜索。
1、第十三章 决策分析,第十三章 决策分析,决策分析的基本问题,决策是为达到目的,从所有可供选择的方案中,找出最满意的方案的行为,1 决策类型,按内容和层次,战略决策(全局、长远方针性的问题)战术决策(方针执行中具体问题),按重复程度,程序性决策(常规的反复发生的、有一套固定的程序规则)非程序性决策(不经常发生,包含较多的不确定的偶然因素),决策分析的基本问题决策是为达到目的,从所有可供选择的方案中,,决策分析的基本问题(续一),按问题的性质和条件,确定型决策(每一个抉择有肯定的结局)不确定型决策(抉择的结局完全不肯定)风险型决策(抉择的结局不肯定但可以得到各结局出现的概率),决策分析的基本问题(
2、续一)按问题的性质和条件确定型决策(每一,决策分析的基本问题(续二),2 决策的原则(1)信息原则(2)预测原则(3)可行性原则(4)系统原则(5)反馈原则,决策分析的基本问题(续二)2 决策的原则,决策分析的基本问题(续三),形成决策问题,对各方案出现不同结果的可能性进行判断,给出各方案的偏好,选择最为偏好的方案,(3)决策程序,决策分析的基本问题(续三)形成决策问题对各方案出现不同结果的,决策分析的基本问题(续四),(4)决策系统,信息机构,研究智囊机构,决策机构,执行机构,决策分析的基本问题(续四)(4)决策系统信息机构研究智囊机构,决策分析的基本问题(续五),决策者,方案1方案2方案n
3、,结局,状态1状态2状态m,价值标准,决策分析的基本问题(续五)决策者方案1结局状态1价值标准,决策分析的基本问题(续六),决策分析是为了合理分析具有不确定性或风险性决策问题提出的一套概念和系统分析方法,其目的在于改进决策过程,从而辅助决策,但不是代替决策者进行决策。实践证明当决策问题较为复杂时,决策者在保持与自身判断及偏好一致的条件下处理大量信息的能力将减弱,在这种情形下,决策分析方法可为决策者提供强有力的工具。,决策分析的基本问题(续六)决策分析是为了合理分析具有不确定性,决策分析研究的问题的特征,不确定性动态性多目标性模糊性群体性,决策分析研究的问题的特征不确定性,决策矩阵,通常记一个决
4、策问题的可供选择的方案为A1,A2,Am;所有可能的状态为S1,S2,Sn;而aij=u(Ai,Sj)表示当采用方案Ai并且出现状态Sj时的益损值(效用值),则可通过如下的决策表进行决策分析,A1A2Am,S1 S2 Sn,a11 a12 a1n a21 a22 a2n am1 am2 amn,决策矩阵通常记一个决策问题的可供选择的方案为A1,A2,不确定型决策,不确定型决策的基本特征是每一个方案都对应着一些不同的状态,但无法确切地知道哪种状态将出现,也不知道各状态出现的概率。这种情况下的决策主要取决于决策者的素质与要求。设决策矩阵如下,A1A2Am,S1 S2 Sn,a11 a12 a1n
5、a21 a22 a2n am1 am2 amn,不确定型决策不确定型决策的基本特征是每一个方案都对应着一些不,悲观准则(max-min准则),这种方法的基本思想是假定决策者心态比较保守,总是从每个方案可能出现的最差结果出发,且其最佳选择是从这些最不利的结果中选择最有利的结果(差中选优),A1A2Am,S1 S2 Sn,a11 a12 a1n a21 a22 a2n am1 am2 amn,minaij,c1c2cm,选择其中最大者对应的方案,悲观准则(max-min准则)这种方法的基本思想是假定决策者,例,例 设某决策的收益表如下。用悲观准则进行决策。,方案,状态,A1A2A3A4A5,S1
6、S2 S3 S4,5 6 7 4 6 9 7 3 5 5 6 83 5 5 5,min,42333,max,采用悲观准则,最优方案为A1,例例 设某决策的收益表如下。用悲观准则进行决策。方案状态A,乐观准则(max-max准则),A1A2Am,S1 S2 Sn,a11 a12 a1n a21 a22 a2n am1 am2 amn,maxaij,c1c2cm,选择其中最大者对应的方案,这种准则的出发点是假定决策者对未来的结果持乐观的态度,总是假设出现对自己最有利的状态,在从中选择最好的结果(优中选优)。,乐观准则(max-max准则)A1S1 S2,例,对前例,用乐观准则进行决策。,方案,状态
7、,A1A2A3A4A5,S1 S2 S3 S4,5 6 7 4 6 9 7 3 5 5 6 83 5 5 5,max,79785,max,采用乐观准则,最优方案为A2,例对前例,用乐观准则进行决策。方案状态A1S1,折中准则,折中准则是介于悲观准则和乐观准则之间的一个准则,其特点是对客观状态的估计既不是完全乐观,也不是完全悲观,而是采用一个乐观系数来反映决策者对状态估计的乐观程度。具体做法是:取0,1,令,然后取u(Ai)中的最大者对应的方案为最优方案。,折中准则折中准则是介于悲观准则和乐观准则之间的一个准则,其特,例,对前例,用折中准则进行决策,其中乐观系数取=0.8。,方案,状态,A1A2
8、A3A4A5,S1 S2 S3 S4,5 6 7 4 6 9 7 3 5 5 6 83 5 5 5,u(Ai),6.47.66.27.04.6,max,采用折中准则(乐观系数=0.8),最优方案为A2,例对前例,用折中准则进行决策,其中乐观系数取=0.8。方,等可能准则(Laplace准则),这种准则的思想在于将各种可能的状态“一视同仁”,即认为它们出现的可能性是相等的,也就是说,每种状态出现的概率都是1/n。于是可计算出每个方案Ai的期望收益E(Ai),然后选择期望收益最大的方案为最优方案。,等可能准则(Laplace准则)这种准则的思想在于将各种可能,例,对前例,用等可能性准则进行决策。,
9、方案,状态,A1A2A3A4A5,S1 S2 S3 S4,5 6 7 4 6 9 7 3 5 5 6 83 5 5 5,E(Ai),5.55.2555.54.5,max,方案A1与方案A4的数学期望都达到了最大,但明显方案A4的收益波动较大。所以A1最优。,例对前例,用等可能性准则进行决策。方案状态A1S1,遗憾准则(min-max准则),决策中,当某一状态出现时,如果恰好选择了该状态下的最大收益对应的方案,是最理想的。但如果不是选择的这个理想方案,则会感到后悔或遗憾。遗憾准则的基本思想是尽量减少决策后的遗憾,使决策者不后悔或少后悔。具体计算时,首先根据收益矩阵计算出决策者的“后悔矩阵”,该矩
10、阵的元素(称为后悔值)bij定义为,然后求出每个方案的最大后悔值r(Ai),再选择r(Ai)中最小者对应的方案为最优方案。,遗憾准则(min-max准则)决策中,当某一状态出现时,如果,例,收益矩阵,r(Ai),23424,min,min,用遗憾准则最优决策为A1或A4,例方案状态A1S1 S2 S3,不确定型决策方法小结,从上面的讨论可以看到根据不同的决策准则得到的结果可能不同。处理实际问题时可同时采用几个准则来进行分析比较,到底采用哪个方案,需根据具体情况和决策者对自然状态所持的态度而定,下表给出了对本节的例子用不同准则分析的结果,一般来说,被选中多的方案应予优先考虑。,准则,悲观准则乐观
11、准则折中准则(=0.8)等可能准则遗憾准则,A1 A2 A3 A4 A5,不确定型决策方法小结从上面的讨论可以看到根据不同的决策准则得,风险型决策方法,像不确定型决策一样,决策过程中每一个方案都对应着一些不同的状态,也无法确切地知道哪种状态将出现,但与不确定型决策不同的是可以确定各状态出现的概率。这样可以计算每个方案的期望收益(损失)值,并取期望收益最大(期望损失最小)的方案为最优方案。这种决策方法称为期望值法。采用这种方法进行决策实际上默认了如下两个假设:(1)无差异性:一个确定的收益与一个与之等值的期望收益是无差别的(2)大利性:决策者总是希望期望收益越大越好,风险型决策方法像不确定型决策
12、一样,决策过程中每一个方案都对应,期望值法,设决策问题的收益矩阵如下(注意:现在知道每种状态出现的概率),A1A2Am,S1 S2 Sn,a11 a12 a1n a21 a22 a2n am1 am2 amn,p1 p2 pn,E(Ai),E(A1)E(A2)E(Am),其中,选择其中最大者对应的方案为最优方案,期望值法设决策问题的收益矩阵如下(注意:现在知道每种状态出现,例(p423),方案,A1 自行钻井A2 无条件出租A3 有条件出租,状态,S1 产油50万桶S2 产油20万桶S3 产油5万桶S4 无油,收益表,A1A2A3,S1 S2 S3 S4,0.1 0.15 0.25 0.5,6
13、50000 200000-25000-7500045000 45000 45000 45000250000 100000 0 0,例(p423)方案A1 自行钻井状态S1 产油50万桶收益表,例(p423),各方案的期望收益,根据期望收益最大原则,应选择方案A1,即石油公司应自行钻井。,例(p423)各方案的期望收益根据期望收益最大原则,应选择方,转折概率(1),例(p425)有一风险型决策问题的收益表如下,方案,状态,AB,S1 S2,p1=0.7 p2=0.3,500-200-150 1000,根据期望收益最大原则,应选方案A,转折概率(1)例(p425)有一风险型决策问题的收益表如下方,
14、转折概率(2),但在上例中若状态S1出现的概率由0.7变到0.6,则,于是最优方案应为B。可见决策中概率参数的变化会引起决策结果的变化。,转折概率(2)但在上例中若状态S1出现的概率由0.7变到0.,转折概率(3),一般地,设是状态S1出现的概率,则,为观察概率的变化是如何影响决策的,令E(A)=E(B),得,由上面方程解得*=0.649。称*=0.649为转折概率,明显地当*时应选方案A,而*时应选方案B。,转折概率(3)一般地,设是状态S1出现的概率,则为观察概率,灵敏度分析,在实际工作中,可把状态概率、益损值等在可能的范围内做几次变动,分析一下这样的变动会给期望益损值和决策结果带来的影响
15、。这一工作称为灵敏度分析。如果参数稍加变动而最优方案不变,则这一最优方案是稳定的;反之如果参数稍加变动会引起最优方案的改变,则原最优方案不是稳定的,这时需对问题进行进一步的分析。,灵敏度分析在实际工作中,可把状态概率、益损值等在可能的范围内,利用后验概率的方法和信息价值,在风险型决策中,我们通常需要各状态出现的概率,但这些概率往往只是对状态的出现可能性的事先的估计,这种估计可能是不准确的,当我们对决策问题进一步收集信息后,可能获得对状态出现的可能性的更准确的估计,这种估计可以称为后验概率,而先前的估计称为先验概率。进一步收集信息(或追加信息)的工作若记为B,则后验概率就是P(Si|B),即它是
16、一个条件概率。由先验概率获得后验概率的过程称为概率的修正。利用后验概率可以使决策更加准确。,利用后验概率的方法和信息价值在风险型决策中,我们通常需要各状,概率的修正需要考虑的问题,追加的信息应有助于改进对风险型决策的分析。这需要解决如下两个问题:如何根据追加信息对先验概率进行修正,并根据后验概率进行决策。由于获取信息通常需要花费,因此需要考虑将追加信息后的收益的增加值与获得信息花费的成本进行比较,当追加信息带来的新收益大于追加信息的成本时,才值得去收集新信息。将追加信息带来的新收益称为信息的价值。,概率的修正需要考虑的问题追加的信息应有助于改进对风险型决策的,利用后验概率进行决策,利用后验概率
17、进行决策需要应用如下两个概率公式,条件概率公式:,全概率公式:,利用后验概率进行决策利用后验概率进行决策需要应用如下两个概率,例(p426),进一步收集信息的方式:进行地震试验,试验的结果与相关的概率见下表。,P(Ii|Sj),构造很好(I1)构造较好(I2)构造一般(I3)构造较差(I4),50万桶(S1)20万桶(S2)5万桶(S3)无油(S4),0.580.560.460.19,0.330.190.250.27,0.090.1250.1250.31,0.00.1250.1250.23,例(p426)进一步收集信息的方式:进行地震试验,试验的结果,先计算每种试验结果出现的概率P(Ii),P
18、(Ii|Sj)构造很好(I1)构造较好,再利用条件概率公式计算可得后验概率:,P(Sj|Ii),构造很好(I1)构造较好(I2)构造一般(I3)构造较差(I4),50万桶(S1)20万桶(S2)5万桶(S3)无油(S4),0.1650.2400.3250.270,0.1270.1100.2410.522,0.0420.0880.1470.723,0.0000.1070.2360.657,其中,如:,再利用条件概率公式计算可得后验概率:P(Sj|Ii)构造很好,试验结果“构造很好”,下面计算在试验结果为“构造很好”时,各方案的期望收益,可见在这种情况下应选择方案:A1,试验结果“构造很好”下面计
19、算在试验结果为“构造很好”时,各,试验结果“构造较好”,下面计算在试验结果为“构造较好”时,各方案的期望收益,可见在这种情况下应选择方案:A1,试验结果“构造较好”下面计算在试验结果为“构造较好”时,各,试验结果“构造一般”,下面计算在试验结果为“构造一般”时,各方案的期望收益,可见在这种情况下应选择方案:A2,试验结果“构造一般”下面计算在试验结果为“构造一般”时,各,试验结果“构造较差”,下面计算在试验结果为“构造较差”时,各方案的期望收益,可见在这种情况下应选择方案:A2,试验结果“构造较差”下面计算在试验结果为“构造较差”时,各,信息的价值,根据试验结果(即利用后验概率)进行决策的期望
20、收益为,试验结果为“构造很好”的概率,试验结果为“构造很好”的情形下的期望收益,由例1的讨论可知,不做地震试验时的期望收益为51250元,做试验后增加了期望收益,因此地震试验信息的价值为77500-51250=26250(元),大于地震试验的费用12000(元),因而做地震试验是合算的。,信息的价值根据试验结果(即利用后验概率)进行决策的期望收益为,决策树,前面讨论的决策问题中,每个问题都只要做一次决策,因此是所谓的一步决策问题。但许多实际问题往往需要经过多步决策才能获得解决,是属于多步决策问题,在这样的决策问题中,每一步的决策依赖于上一步决策的结果,同时也会影响到下一步的决策,也即是一个多阶
21、段的决策过程。对这样的决策问题用决策表表示是不方便的。通常用决策树来表示决策分析过程。,决策树前面讨论的决策问题中,每个问题都只要做一次决策,因此是,决策树的组成,决策树用图论的语言来说是一棵树。为便于表示决策过程,决策树的节点(顶点)分为如下类型:(1)决策点,一般用方形节点表示,从这类节点引出的边表示不同的决策方案,边下的数字表示采用该方案的支出。(2)状态点,一般用圆形节点表示,从这类节点引出的边表示不同的状态,边下的数字表示该状态出现的概率。(3)结果点,一般用带有圆心的圆形节点表示,位于树的末梢(叶子),并在这类节点旁标注数字表示对应结果的益损值。,决策树的组成决策树用图论的语言来说
22、是一棵树。为便于表示决策过,例(p428),A,投标,-40000,不投标,B,中标,0.4,不中标,0.6,C,0,0,方法1,-260000,D,方法2,-160000,E,成功,0.8,600000,失败,0.2,-100000,成功,0.5,600000,失败,0.5,-100000,是否参加投标,采用何种方法开发,结局,例(p428)A投标-40000不投标B中标0.4不中标0.,利用决策树进行决策分析,在利用决策树进行决策分析时通常也是依赖最大期望准则。具体做法是:先从树的末梢开始,计算出每个状态点上的期望收益,然后将其中最大值标在相应的决策点旁。决策时,根据期望收益最大原则从后向
23、前进行“剪枝”,直到最开始的决策点。由此就给出了一个由多阶段决策构成的完整决策方案。,利用决策树进行决策分析在利用决策树进行决策分析时通常也是依赖,例(p428续),460000,250000,200000,80000,40000,例(p428续)A投标-40000不投标B中标0.4不中标0,第四节 效用函数方法,一、效用的概念,对风险型决策,采用期望值法进行分析时,需要两个假定:无差异性和大利性。但这样的假定并不总是合理的。例如对下面的问题:(1)方案A1:稳获100元;方案B1:获250元和获0元的机会各为41%和59%,你会选择哪个方案(2)方案A2:稳获10000元;方案B2:掷一枚硬
24、币,直到出现正面为止,若掷到n次才出现正面,则可获2n元,你会选哪个方案。,第四节 效用函数方法一、效用的概念对风险型决策,采用期望值法,效用的概念,对问题1,方案A1有确定的收益,期望值E(A1)=100;而方案B1的期望收益为E(B1)=0.41250+0.59 0=102.5E(A1).,对问题2,方案A2有确定的收益,期望值为E(A2)=10000;而对方案B2有,状态n,状态概率,1 2 3 4 5,1/2(1/2)2(1/2)3(1/2)4(1/2)5,收益,2 22 23 24 25,E(B2)=(1/2)2+(1/2)2 22+(1/2)3 23+=E(A2),效用的概念对问题
25、1,方案A1有确定的收益,期望值E(A1)=,效用的概念(续1),例7(p433)例7 表明同一货币量在不同的客观条件下给决策者带来的主观上的满足感是不同的,因此,决策者在很多的场合是根据不同的结果或方案对其需求欲望的满足程度来进行决策,而不是任何情况下都根据期望收益最大原则进行决策的。,效用是用来衡量人们对货币、商品或劳务的主观满足程度的一个概念。,效用是一个主观概念,它因人、因事、因地而变化。,利用效用函数进行决策就是用效用值代替实际的收益值进行决策,也就是采用期望效用最大原则。,效用的概念(续1)例7(p433)效用是用来衡量人们对货币、,效用曲线的确定(1),效用还具有特点:(1)同一
26、货币量,在不同的风险情况下,对同一决策者来说有不同的效应。(2)在同等风险程度下,由于不同的决策者对风险的态度不同,因此相同的货币量对不同的决策者有不同的效用。由于效用具有这样的特点,效用常被用来量化决策对风险的态度。,效用曲线的确定(1)效用还具有特点:,效用曲线的确定(2),对每一个决策者都可以测定反映他对风险态度的效用曲线(效用函数)。这里效用是个相对值。首先假定对决策者来说最偏好、最倾向、最愿意的事物(方案)的效用值为1;而最不喜欢、最不倾向、最不愿意的事物的效用值为0(也可以使得效用值在0到100之间,等等)。接着用下面的对比提问法来确定效用曲线。,效用曲线的确定(2)对每一个决策者
27、都可以测定反映他对风险态度,效用曲线的确定(3),对比提问法,方案,状态,A1,A2,S1P,S11-P,x,x,y,z,其中成立大小顺序关系:zxy或yxz。记对应收益x的效用值为U(x),则决策者认为上面两个方案等价时应有,PU(y)+(1-P)U(z)=U(x),方案A1与方案A2有相同的期望效用值,注意到上式中有四个参数x,y,z,P,对比提问就是任意给定其中三个,然后就第四个应取何值提问。,效用曲线的确定(3)对比提问法方案状态A1A2S1 S1xx,效用曲线的确定(4),对比提问的方式:,(1)每次给定x,y,z的值,就P应取何值向决策者提问:“P取何值时,您认为方案A1和A2等价
28、?”,(2)每次给定P,y,z的值,就x应取何值向决策者提问:“x取何值时,您认为方案A1和A2等价?”,(3)每次给定P,x,y(或 z)的值,就z(或y)应取何值向决策者提问:“z(或y)取何值时,您认为方案A1和A2等价?”,效用曲线的确定(4)对比提问的方式:(1)每次给定x,y,效用曲线的确定(5),对比提问法的具体操作(五点法):,实际计算中常固定P=0.5,然后给定y,z的值,向决策者提问,确定x值,再由表达式,0.5U(y)+0.5U(z)=U(x),计算x的效用值。将y,z的取值改变三次,就可得到效用曲线上的三个点,再加上收益最差时效用为0和收益最好时效用为1,实际就已经得到
29、效用曲线上的五个点,利用这五个点就可以将效用曲线大致描绘出来。,通常用x*和x0分别表示决策者心目中的最有利和最不利的结果,于是U(x*)=1,U(x0)=0,效用曲线的确定(5)对比提问法的具体操作(五点法):实际计算,例(p435),x*=200,x0=-100,于是U(200)=1,U(-100)=0,即已经获得效用曲线上的两个点,再用对比提问法获得另外三个点。,(1)请决策者在方案A1:“稳获x元”和方案A2:“以50%的机会获得200元,50%的机会损失-100元”之间进行比较。问决策者当x取何值时两个方案一样好。比方说先取x=25,若决策回答偏好A1,则减少x的值到x=10,若仍回
30、答偏好A1,则再减少x的值到x=-10,若回答偏好A2,则逐步增加x的值,直到得到使得两方案一样好的x的值时为止。设x=0时决策者认为两方案一样好。则,U(0)=0.5U(200)+0.5U(-100)=0.5,例(p435)x*=200,x0=-100,于是U(20,例(p435续一),(2)用x=0,U(0)=0.5代替(1)中的x*=200,U(200)=1,重新提问。,也就是要决策者比较A1:“稳获x元”与A2:“以50%的机会获得0元,以50%获得-100元”的两个方案。假设,决策者最后确定当x=-60时两方案等价则,U(-60)=0.5U(0)+0.5U(-100)=0.50.5+
31、0.5 0=0.25,则又得到效用曲线上一个新的点,例(p435续一)(2)用x=0,U(0)=0.5代替(1,例(p435续二),(3)用x=0,U(0)=0.5代替(1)中的x0=-100,U(-100)=0,重新提问。,也就是要决策者比较A1:“稳获x元”与A2:“以50%的机会获得0元,以50%获得200元”的两个方案。假设,决策者最后确定当x=80时两方案等价则,U(80)=0.5U(0)+0.5U(200)=0.50.5+0.5 1=0.75,则又得到效用曲线上一个新的点,例(p435续二)(3)用x=0,U(0)=0.5代替(1,例(p435续三),将坐标平面(x,U(x)上的五个点(-100,0),(-60,0.25),(0,0.5),(80,0.75)与(200,1)用光滑的曲线连起来就得到效用曲线的大致图形。,-100,200,x,0,0.5,1,U(x),例(p435续三)将坐标平面(x,U(x)上的五个点(,效用函数的分类,保守型,中间型,冒险型,保守型对收益的减少比较敏感,冒险型对收益的增加比较敏感,效用函数的分类保守型中间型冒险型保守型对收益的减少比较敏感,