《数学建模决策分析课件.ppt》由会员分享,可在线阅读,更多相关《数学建模决策分析课件.ppt(67页珍藏版)》请在三一办公上搜索。
1、1,决策分析模型,一、概述,在决策问题中,每个可供选择的方案称之为行动,记为a,而所有可能行动a的集合称为行动空间,记为A。行动是决策系统的自变量,它可以是连续的,也可以是离散的。,例如,某地要创建出租车公司,制定了三种购车方案:100辆、150辆、200辆,这里的行动就是一个离散变量。,又如,某食 品销售公司考虑购进一批食用油,要制定一个利润大、库存积压少的购入量方案,这时的行动就是一个连续变量。,2,方案确定以后,所产生的后果是否唯一确定,有时还取决于一些决策者无法控制的因素。在决策中,把行动确定以后,目标值所含的参数s称为状态,s的集合称 作状态空间,记为。,状态取值可以是连续的,也可以
2、是离散的。例如,某企业经营是否盈利可以分为盈利、盈亏平衡、亏损三种离散状态。企业经营状况也可以使用量化指标表示成连续值。,行动在状态下产生的后果,可以用收益或损失表示,在决策中,收益函数、损失函数均称为决策函数,记为F(s,a)。决策函数是决策的依据,它与行动空间、状态空间一直构成了决策系统,记为(,A,F)。,3,决策分类,4,例1、某石油公司计划开发海底石油,有四种勘探方案 A1,A2,A3,A4可供选择。勘探尚未进行,只知可能有以下三种结果:S1:干井,S2:油量中等,S3:油量丰富,对应于各种结果各方案的损益情况已知,应如何决策?,例2、某洗衣机厂,根据市场信息,认为全自动洗衣机应发展
3、滚筒式,有两种方案。A1:改造原生产线,A2:新建生产线。市场调查知,滚筒式销路好的概率为0.7,销路不好为0.3。两种方案下各种情况的损益情况已知,应如何决策?,5,确定性决策方法,根据行动的性质,确定性决策问题可以划分为离散型和连续型两种,由于同一问题往往有多种处理方法,因此,这里只能简单介绍几种常用方法。,1、加权评分法 在行动方案有限且离散的情况下,加权评分法是确定性问题的一种简便决策方法,该方法把方案涉及到的因素用指标表示,同时考虑不同指标在不同方案下的不同作用(指标值)及各指标重要性(指标权重)的差异,指标权重和指标值经算术和,综合成一个可比量值,来实现方案选 优。这种方法能从主观
4、和客观两方面反映问题,所产生的结果一般比较符合实际。,6,2、微分法 当行动是连续变量,或者行动虽是离散变量,但其取值个数很多,甚至是无穷多,行动的取什多一个或少一个数量间接对行动结局基本没有影响,可用微分法求最 佳行动。微分法的理论依据是极值理论,其决策准则是;使收益函数达到最大或使损失函数达到最小的行动就是最佳行动,因此,求最佳行动就是求函数的最大值(或最小值)。,7,3、数学规划法,上面介绍的加权评分法和微分法是确定性决策方法中的两种古典方法,其出发点在于求收益函数的最大值和损失函数的最小值。这两种方法通常适用于变量不多的决策问题,随着变量增加其适用性越来越差。,近几十年来,随着运筹学等
5、数学理论的发展,以数学规划理论为基础的一整套最优化方法在决策方面起着越来越重要的作用。例如,处理多变量决策问题的线性规划法,处理离散变量决策问题的整数规划法等。,8,第一节:不确定性决策,9,收益矩阵:,10,选A1,乐观原则是一种冒险的决策模式,它反映了决策者的乐观情绪和风险意识。这种模式适用于最好状态发生的可能性很大,或研究对象承受风险能力强的情况。,11,悲观原则反映了决策者的悲观情绪,是一种保守的决策方法。例如,企业承受风险的能力较差,或最坏的状态很可能发生时,常采用这种决策原则。,12,选A3,13,悲观原则显得过于悲观保守,而乐观原则又显得太冒险,这种情况下可采用乐观系数法。这种方
6、法要求决策者首先提出一个系数(用 表示,0 1)来表示其乐观程度。决策者越乐观,值越接近于1;越悲观,值越接近于0。因此,这种方法叫乐观系数法。这种方法尽管避免了两种极端情况,但也没有利用全部可用信息,而且,乐观系数 的恰当确定也是一个难点。,14,选A1,15,在缺乏准确信息的情况下,各行动状态是未知的。因此,有理由认为每一状态出现的概率是相同的。,16,选 A2,17,该原则与悲观原则相似,也带有保守性质,反映了决策者的悲观情绪。但后悔值原则与悲观原则又有所不同,其一是它从损失的角度考虑问题,其二它又不是过分保守。,i,j,j,18,选 A1,19,20,例:产品,成本30元/件,批发价3
7、5元/件,当月售不完1元/件。每批10件,最大生产力40件/月(批量生产与销售),应如何决策?,21,第二节:风险决策,(一)、期望值准则,(1)、矩阵法,选 A2,22,例2,分析当P(S1)为何值时,方案会从A1 A2,23,当P(S1)=0.8 P(S2)=0.2时,E(A1)=0.8500+(-200)0.2=360E(A2)=0.8(-150)+0.2(1000)=80,仍A1P(S1)=0.6 P(S2)=0.4时 E(A1)=220E(A2)=310,选A2,24,一般:E(A1)=500+(1-)(-200)=700-200E(A2)=(-150)+(1-)(1000)=-11
8、50+1000令E1=E2 得=0.65称=0.65为转折概率 0.65 选A1 0.65 选A2,25,(2)、决策树法,概率分枝 标自然状态的概率,26,例1,电视机厂试生产三种电视机Ai(i=1,2,3)。市场大、小Sj(j=1,2)。生产哪种?,27,解:,100,-20,75,10,50,30,1,2,3,4,0.6,0.4,0.6,0.4,0.6,A1,A2,A3,P(S1)=0.4,28,解:,多级决策问题,29,例2、化工原料厂,由于某项工艺不好,影响效益,现厂方欲改革工艺,可自行研究(成功可能为0.6),买专利(成功可能为0.8)。若成功,则有2种生产方案可选,1是产量不变,
9、2是增产;若失败,则按原方案生产,有关数据如下。试求最优方案。,30,31,解:,0.1,32,解:,0.1,33,最 优 决 策,买 入 专 利,成功则增产,失败则保持原产量。,34,(3)、贝叶斯法(后验概率法)(Bayes法),处理风险决策问题时,需要知道各种状态出现的概率:P(1),P(2),P(n),这些概率称为先验概率。,风险是由于信息不充分造成的,决策过程还可以不断收集信息,如果收集到进一步信息S,对原有各种状态出现概率估计可能会有变化,变化后的概率为P(jS),此条件概率表示在追加信息S后对原概率的一个修正,所以称为后验概率。Bayes法就是一种后验概率方法。,35,P(jSi
10、)通过概率论中Bayes公式计算得出,36,例1,某钻井大队在某地进行石油勘探,主观估计该地区为有油(1)地区的概率为 P(1)0.5,没油(2)的概率为 P(2)0.5,为提高勘探效果,先做地震试验,根据积累资料得知:,37,有油地区,做试验结果好(F)的概率P(F1)0.9有油地区,做试验结果不好(U)的概率P(U1)0.1无油地区,做试验结果好(F)的概率P(F2)0.2无油地区,做试验结果不好(U)的概率P(U2)0.8,求:在该地区做试验后,有油和无油的概率 各为多少?,38,解:,做地震试验结果好的概率P(F)P(1)P(F1)P(2)P(F2)0.50.9+0.50.2=0.55
11、,做地震试验结果不好的概率P(U)P(1)P(U1)P(2)P(U2)0.50.8+0.50.1=0.45,39,用Bayes公式求解各事件的后验概率:,40,用Bayes公式求解各事件的后验概率:,41,例2,某公司有资金500万元,如用于某项开发事业,估计成功率为96%,一年可获利润12;若失败则丧失全部资金;若把资金全存在银行,可获得年利率6%,为辅助决策可求助于咨询公司,费用为5万元,根据咨询过去公司类似200例咨询工作,有下表:,42,试用决策树方法分析该公司是否应该咨询?资金该如何使用?,43,T1:咨询公司意见:可以投资T2:咨询公司意见:不宜投资E1:投资成功E2:投资失败,4
12、4,P(E1)=0.96 P(E2)=0.04,45,46,47,答:求助于咨询公司 如果投资公司给出可以投资意见则投资 如果投资公司给出不宜投资意见则存入银行,48,由于地位、经验和性格的不同,决策者对于风险决策带来的风险所取的态度往往存在着很大的差异。,例1:设有两个决策问题问题一:方案A1:稳获100 元;方案B1:获250 元和0 元的概率各为41%和59%。问题二:方案A2:稳获10000 元;方案B2:掷一枚硬币,直到出现正面为止,若此时所掷次数为N,则可获2N 元.直观上看,多数人会选A1 和A2。,(二)效用值决策准则,49,但计算期望收益得:E(B1)=0.41250+0.5
13、90=102.5100=E(A1)E(B2)=(1/2)2+(1/22)22+(1/23)23+=1+1+=10000=E(A2)因此根据期望收益最大的原则,应该选择方案B1和B2。,这会令实际的决策者难以接受。例1 说明,完全根据期望收益作为评价方案的准则有时是不合理的。,例2、有甲、乙二人,甲提出请乙掷硬币,并约定:若出正面,乙获利40元;若出反面,乙向甲支付10元。现在,乙有两个选择,接受甲的建议(方案A)或者不接受甲的建议(记为B),计算可得乙的期望收益为:E(B)=0;E(A)=0.540-0.510=15,50,根据期望最大化原则,乙应该接受甲的建议。如果设乙是个穷人,手中仅有的1
14、0元钱是他一家三天的口粮钱。这时,乙对甲的建议的态度会发生变化,很可能宁愿用这10元钱来买全家三天的口粮,不致挨饿,而不去冒投机的风险。这个例子说明即使对同一个决策者来说,当其所处的地位、环境不同时,对风险的态度一般也是不同的。,上述例子说明:现实中,决策方案的确定不仅仅依据期望收益最大原则,常要考虑到问题发生的环境、时期及决策者对问题的认知等方面因素。为此经济学家提出了效用的概念,并在此基础上建立了效用理论。,51,一般来说,效用是一个属于主观范畴的概念,是衡量决策方案的总体指标,反映决策者对决策问题各因素的总体看法.(1)同一货币量,在不同风险情况下,对同一决策者来说具有不同的效用值;(2
15、)在同等风险程度下,不同决策者对风险的态度不同,即相同的货币量在不同人看来具有不同的效用。,效用值是一个相对的指标,它的大小表示决策者对于风险的态度,对某事物的倾向和偏差等主观因素的强弱程度。,52,为此,在对某个问题提供决策的咨询意见时,我们可以通过与决策者进行对话,来建立相应的效用函数。此效用函数应能在一定的程度上反映决策者在决策问题上的决策偏向和评价标准。于是,利用这种效用函数作决策,依据的原则就称为效用值准则。,在一个决策问题中,通常情况下,我们将可能得到的最大收益值b的效用值取为1;而把可能得到的最小收益值a的效用值取为0。,用效用值进行决策:首先把要考虑的因素折合成效用值,然后在决
16、策准则下选出效用值最大的方案,作为最优方案。,53,如何通过与决策者对话建立相应的效用函数呢?对于一个决策问题,如果最小收益值为a,最大收益值为b,我们以收益x 为自变量,a,b上的效用函数设为U(x),并有U(a)=0,U(b)=1。对于x a,b,U(x)称为x 的效用值,U(x)0,1。,效用函数曲线,用效用量化决策者对风险的态度对每个决策者,都可以确定反映他对风险态度的效用曲线,主要用对比提问法确定效用曲线。,54,对比提问法:,设计两种方案 A1,A2A1:无风险可得一笔金额 X2A2:以概率P得一笔金额 X3,以概率(1-P)损失一笔金额 X1,X1X2X3,u(xi)表示金额xi
17、 的效用值。,55,在某种条件下,决策者认为A1,A2两方案等效。P U(x1)+(1-P)U(x3)=U(x2)()P,x1,x2,x3 为4个未知数。已知其中3个可定第4个。,56,提问的方式大体有3种:1)每次固定x1,x2,x3的值,改变P,并向决策者提问:“P取何值时,您认为A1和A2等价?”2)每次固定P,x2,x3的值,改变x1,并向决策者提问:“x1取何值时,您认为A1和A2等价?”3)每次固定P,x1,x2的值,改变x3,并向决策者提问:“x3取何值时,您认为A1和A2等价?,57,一般用改进的VM法,即固定P=0.5,每次给出x1,x3,通过提问定x2,用(*)求出U(x2
18、)5点法,定5个点作图,58,例1、在某次交易中,决策者认为:可承担的最大损失是-1000万元 可获得的最大收益是2000万元 U(2000)=1 U(-1000)=0,提问(1)A1:无风险得?你觉得A1,A2等效?A2:以0.5可能得2000万,0.5可能损失1000万。,回答 1200万,0.5U(2000)+0.5U(-1000)=U(1200)则U(1200)=0.5,59,提问(2)A1:无风险得?你觉得A1,A2等效?A2:以0.5可能得1200万,0.5可能损失-1000万。,回答 800万,0.5U(1200)+0.5U(-1000)=U(800)0.50.5=U(800)=
19、0.25,提问(3)A1:无风险得?你觉得A1,A2等效?A2:以0.5可能得800万,0.5可能损失-1000万。,回答 200万,U(200)=0.50.25=0.125,60,1,0,1000,2000,1200,200,800,0.5,0.25,0.125,冒险型,61,62,(3)效用值准则决策,63,(1)期望值准则(决策树法),1,340,2,3,建小厂A2,建大厂A1,150,340,0.7,0.3,0.7,0.3,4010-160240,1010-160-60,10010-300700,-2010-300-500,64,结论:应建立大厂,65,(2)效用值准则(决策树法),1)求决策者最大可能损益值 建大厂销路好:700 u(700)=1 建大厂销路差:-500 u(-500)=0,66,2)效用曲线,0,-500,700,1,u(240)0.82u(-60)0.58,67,结论:应建立小厂,