《应用运筹学决策论.ppt》由会员分享,可在线阅读,更多相关《应用运筹学决策论.ppt(130页珍藏版)》请在三一办公上搜索。
1、决 策 论周 晶,一、概述,什么是决策?,通俗地说就是从可选方案中选出一种正确的方案以解决问题;我們常常为达到某一特定的目标寻找行动的准则或措施。为了回答涌现在我們周围一个又一个的“怎么办”也常作出决择,這种貌似简单的活动,实质上就是决策;决策是人們日常生活和工作中普遍存在的一种活动。古往今來,人类社会发展的每段历史进程,无不烙有决策的痕迹。,决策科学的发展,在我国古代,就有“运筹於帷幄之中,决胜於千里之外”之說。战国策、孙子兵法、史记、资治通鉴、三国志等一大批古典文献就记载了我国古代经济、政治、军事等方面的大量决策事例和决策思想。,决策科学的发展,但总的來說,古代人类社会的实践活动,在其广度
2、、深度上是有限的,是与社会的小生产方式相适应的,决策活动主要凭借於决策者个人的才智与经验,如楚汉相争时的张良、三国时的诸葛亮、元末明初的刘伯温,几乎完全是凭借个人的才学、胆识与聪明才智在历史的长河中谱写了一曲曲令后人传颂的决策佳话。,决策科学的发展,世纪以來,随着生产社会化的发展,社会生产、科学研究以及其他社会活动规模越來越大,社会系统结构愈來愈复杂,涉及因素也更多,从而使得人类决策活动的不确定因素与风险都相应地增加了许多,“差之毫厘,失之千里”,稍有不慎就可能酿成重大的决策失误。因此,世界各国越來越重视决策与决策方法的研究,历史上的个人决策也渐渐地被“群体决策”所取代。当今世界,决策在朝着科
3、学化、民主化的方向不断迈进。,决策科学的发展,把决策问题上升到理论高度是西方现代管理理论对人类文明的贡献。决策学派的代表人西蒙就系统地研究了决策的理论,提出决策是统带管理的一项中心活动,它存在于管理活动的任何一个环节、贯穿于管理的全过程的重要思想,并因此而成为管理方面唯一获得诺贝尔经济学奖的人。,决策的四个流程,西蒙认为做出正确的决策包括四个流程:(1)找出制定决策的根据,即收集情报;(2)找到可能的行动方案;(3)在诸行动方案中进行抉择,即根据当时的情况和对未来发展的预测,从各个备选方案中选定一个方案;(4)对已选择的方案及其实施进行可行性和效益性评价。,案例“空城计”,三国演义。探马来报司
4、马懿率兵来攻西城,已距西城只有五里之遥,而此时西城却兵力空虚,赵云已领兵先回西川,马谡、王平被派去街亭,只有一些老弱病残,怎么才能战胜司马懿的大兵?,诸葛亮的决策,第一,决策所根据的情报很准确:一是对手司马懿大兵距西城已只有五里,自己却只有一些老弱病残;二是司马懿生性多疑。第二,可能的行动方案还是有的:一是战,用这些老弱病残去跟司马懿的大兵去斗,取胜的可能可以认为是没有;二是不战,示之以城中有埋伏的假相,司马懿因为多疑兴许可以被蒙而不敢进城与战。,诸葛亮的决策,第三,从上述方案中选定一个方案。选择的方法是哪一个方案取胜的可能性(概率)更大,显然不战而胜的概率更大。所以选定选择第二个方案。,诸葛
5、亮的决策,第四,对选定的方案进行可行性和效益性评价:可行性很明显,大开城门、自己带上两个书童,穿起鹤氅,带上纶巾去到城头焚香操琴,这些都是可以做到的;效益性也很明显,不这样做是必败无疑,这样做也可能败,但还有成功的希望,退一万步讲,败了也只跟不这样做是一样的结果,不得已而已,而如果成功了则保住的就是全城父老的身家性命和整个城池,这则是前一个方案不可能达到的。,决策的关键因素,决策目标、决策所依据的信息和内外因条件是影响决策质量的三个关键因素;决策与目标目标是方案选择的依据。决策与环境决策的实施是否有效,还必须考虑外部环境条件的变化,考虑各种可能出现的意外情况。有时意外情况的应付是否成功将使决策
6、产生截然相反的实际效果。决策与信息正确的决策必须以信息完全为前提。所以不论是军事上还是商战中,人们都把情报工作看为重中之重。,决策层次的分类Madan G Singh,战略决策(Strategy)涉及某组织发展和生存有关的全局性、长远问题的决策(如企业的产品定位、市场开发等)战术决策(Technic)为完成战略决策所规定的目的而进行的决策(如企业产品规格的选择、工艺的选择、和设备的选择等)日常决策(operation)为完成战术决策的要求对执行行为方案的选择(如生产中的产品合格标准的选择、日常生产调度),决策结构的分类,非程序化决策(非结构化)传统方法:经验、直观判断现代方法:人工智能、专家系
7、统,决策支持系统程序决策(结构化)传统方法:习惯、标准规程现代方法:运筹学,管理是科学和也是艺术,决策方法的分类,定性方法(专家经验、启发式方法、心理学、社会学、行为科学)适用于非结构化的决策问题定量方法(数学方法)适用于结构化的决策问题,决策的方法定性方法,德尔菲法头脑风暴法詹姆斯.马奇(James March)提出垃圾桶模型:当面对一个决策,组织中的成员就会提出一连串的问题和解决方案。其中大多被扔进垃圾桶,只有极少的方案和最后的决策关联。查尔斯.H.开普纳(Charles H.Kepner)和本杰明.切勾(Benjarmn Tregoe)1958年创立了开普(K-T)公司,1965年理智管
8、理提出了K-T技术:作出一个决策报告,详细说明决策指定的水平。指出对团队最好的影响。指定出目标,“分清”必须和“需要”,列出重要等级(1-10)指定评估各项选项。如果不能达到“必须”就淘汰。计算各种选项的重要性来得出分数,最高者就是最后选项。最后要进行风险度计算。如果风险度较高,则淘汰,再考虑分数次高者。,决策问题分类,Simple decision problems:,X2=1,X1=2,X3=3,X3 is optimal,X2=3,X1=2,X3=1,X2,X4 is optimal,X4=3,And What would you do now?,X1=1 or 4,X2=0 or 5,
9、X1 guarantees at least 1X2 guarantees at least 0,X1 may yield 4X2 may yield 5,X1 is optimal,X2 is optimal,Pessimistic decision-maker,Optimistic decision-maker,不确定性情形下的决策问题,What would you do now?,X1=1 or 4With same probability,X2=0 or 50.25 for 00.75 for 5,X1 gives the expected payoff of 0.5*1+0.5*4=
10、2.5X2 gives the expected payoff of 0.25*0+0.75*5=3.75,随机性情形下的决策问题,多重选择标准的决策问题,我们常常面临着这样的选择:购物:价廉物美买房:选择要考虑环境、价格、距离等因素测评:如学生对教师教学质量的评估,多项指标。,例1 大学毕业生就业选择问题 获得大学毕业学位的毕业生,在“双向选择”时,用人单位与毕业生都有各自的选择标准和要求。就毕业生来说选择单位的标准和要求是多方面的,例如:能发挥自己才干作出较好贡献(即工作岗位适合发挥自己的专长);工作收入较好(待遇好);生活环境好(大城市、气候等工作条件等);单位名声好(声誉等);工作环境
11、好(人际关系和谐等)发展晋升机会多(如新单位或前景好)等。,工作选择,可供选择的单位P1 P2,Pn,目标层,准则层,方案层,目标层,O(选择旅游地),准则层,方案层,例2.选择旅游地,如何在3个目的地中按照景色、费用、居住条件等因素选择.,例3 科研课题的选择 某研究所现有三个科研课题,限于人力及物力,只能研究一个课题。有三个须考虑的因素:(1)科研成果贡献大小(包括实用价值和科学意义);(2)人材的培养;(3)课题的可行性(包括课题的难易程度、研究周期及资金)。在这些因素的影响下,如何选择课题?,决策的要素,决策者可供选择的的方案(行动、策略)目标或准则(衡量方案的优劣)自然状态(不能被决
12、策者所控制的客观存在的环境)结果(每一方案选择所导致的后果,即收益或损失)决策者的价值观(偏好),决策问题的分类,按问题的目标分单目标、多目标决策按自然状态的特性分风险型(已知自然状态的概率分布)不定型(不知自然状态的概率分布)按决策过程的连续性分单阶段决策多阶段决策(序列(序贯)决策,Markov决策)按决策人的数量分单人、群决策,课程内容大纲,一、概述二、随机自然状态下的决策问题不定型风险型三、序列决策四、决策的效用五、决策理论的新进展,二、随机自然状态下的决策问题,2.1描述随机型决策问题的要素,自然状态集合(states of nature)包含所有可能的 自然状态,所谓自然状态是指不
13、能由决策人控制的环境决策人的行动集(decision alternatives)决策人所有可能采取的行动后果(或结果)(outcome):即是自然状态与行动方案对效用函数(payoff or utility)是定义在后果空间上的实值函数,反映了后果对决策人的价值,例:某公司需要对某新产品生产批量作出决策,各种批量在不同的自然状态下的收益情况如下表(收益矩阵):,随机型决策分类,不 确 定 型 决 策 问 题(Decision Making without Probability)在决策环境不确定的条件下进行,对各自然状态发生的概率一无所知风 险 型 决 策 问 题(Decision Makin
14、g with Probability)在决策环境不确定的条件下进行,各自然状态发生的概率可以预测,特征:自然状态已知;各方案在不同自然状态下的收益值已知;自然状态发生不确定,且不知道发生的概率。,2.2 不确定情况下的决策,例:某公司需要对某新产品生产批量作出决策,各种批量在不同的自然状态下的收益情况如下表(收益矩阵):,(一)悲观准则(最大最小准则)conservative(pessimistic)approach,思路:决策者从最不利的角度去考虑问题 先选出每个方案在不同自然状态下的最小收益值(最保险),然后从这些最小收益值中取最大的,从而确定行动方案。,(一)悲观准则(最大最小准则),用
15、a(Si,Nj)表示收益值,Conservative Approach,The conservative approach would be used by a conservative decision maker.For each decision the minimum payoff is listed and then the decision corresponding to the maximum of these minimum payoffs is selected.(Hence,the minimum possible payoff is maximized.),Exampl
16、e:Burger Prince,Burger Prince Restaurant is contemplating opening a new restaurant on Main Street.It has three different models,each with a different seating capacity.Burger Prince estimates that the average number of customers per hour will be 80,100,or 120.The payoff table for the three models is
17、as follows:Average Number of Customers Per Hour N1=80 N2=100 N3=120 S1=Model A$10,000$15,000$14,000 S2=Model B$8,000$18,000$12,000 S3=Model C$6,000$16,000$21,000,Example,Conservative ApproachA conservative decision maker would use the conservative approach.List the minimum payoff for each decision.C
18、hoose the decision with the maximum of these minimum payoffs.Minimum Decision Payoff Choose S1 S1$10,000 maximum S2$8,000 S3$6,000,(二)乐观准则(最大最大准则)Optimistic Approach,思路:决策者从最有利的角度去考虑问题:先选出每个方案在不同自然状态下的最大收益值(最有利的),然后从这些最大收益值中取最大的,从而确定行动方案。,(二)乐观准则(最大最大准则),用a(Si,Nj)表示收益值,Optimistic Approach,The optimi
19、stic approach would be used by an optimistic decision maker.The decision with the largest possible payoff is chosen.,Example:Burger Prince,Burger Prince Restaurant is contemplating opening a new restaurant on Main Street.It has three different models,each with a different seating capacity.Burger Pri
20、nce estimates that the average number of customers per hour will be 80,100,or 120.The payoff table for the three models is as follows:Average Number of Customers Per Hour N1=80 N2=100 N3=120 S1=Model A$10,000$15,000$14,000 S2=Model B$8,000$18,000$12,000 S3=Model C$6,000$16,000$21,000,Example,Optimis
21、tic Approach An optimistic decision maker would use the optimistic approach.All we really need to do is to choose the decision that has the largest single value in the payoff table.This largest value is 21000,and hence the optimal decision is S3.Maximum Decision Payoff S1$15,000 S2$18,000 choose S3
22、S3$21,000 maximum,(三)折衷主义准则,思路:决策者取乐观准则和悲观准则的折衷:先确定一个乐观系数(01),然后计算:CVi=*max a(Si,Nj)+(1-)*min a(Si,Nj)从这些折衷标准收益值CVi中选取最大的,从而确定行动方案。,三、折衷主义准则,用a(Si,Nj)表示收益值取=0.7,(四)最小机会损失准则(最小的最大后悔值准则)Minimax Regret Approach(Savage 萨维奇准则),思路:决策者从后悔的角度去考虑问题:把在不同自然状态下的最大收益值作为理想目标把各方案的收益值与这个最大收益值的差称为未达到理想目标的后悔值,然后从各方案最
23、大后悔值中取最小者,从而确定行动方案。,(五)最小的最大后悔值准则,aij表示偏差,Minimax Regret Approach,The minimax regret approach requires the construction of a regret table or an opportunity loss table.This is done by calculating for each state of nature the difference between each payoff and the largest payoff for that state of natu
24、re.Then,using this regret table,the maximum regret for each possible decision is listed.The decision chosen is the one corresponding to the minimum of the maximum regrets.,Example:Burger Prince,Burger Prince Restaurant is contemplating opening a new restaurant on Main Street.It has three different m
25、odels,each with a different seating capacity.Burger Prince estimates that the average number of customers per hour will be 80,100,or 120.The payoff table for the three models is as follows:Average Number of Customers Per Hour N1=80 N2=100 N3=120 S1=Model A$10,000$15,000$14,000 S2=Model B$8,000$18,00
26、0$12,000 S3=Model C$6,000$16,000$21,000,Example,Minimax Regret ApproachFor the minimax regret approach,first compute a regret table by subtracting each payoff in a column from the largest payoff in that column.In this example,in the first column subtract 10,000,8,000,and 6,000 from 10,000;in the sec
27、ond column,subtract 15,000,18,000,and 16,000 from 18,000;etc.The resulting regret table is:,N1,N2,N3,S1,0,3,000,7,000,S2,2,000,0,9,000,S3,4,000,2,000,0,Example,Minimax Regret Approach(continued)For each decision list the maximum regret.Choose the decision with the minimum of these values.Decision Ma
28、ximum Regret S1 7,000 S2 9,000choose S3 S3 4,000 minimum,(六)等可能性(Laplace)准则,思路:决策者把各自然状态发生看成是等可能的.设每个自然状态发生的概率为 1/事件数,然后计算各行动方案的收益期望值。,(六)等可能性准则,用 E(Si)表示第i方案收益期望值,2.3 风险型情况下的决策,特征:自然状态已知;各方案在不同自然状态下的收益值已知;自然状态发生的概率分布已知。,(一)最大可能准则,思路:取概率最大的自然状态,按照确定型问题进行讨论。,(二)期望值准则-矩阵法Expected Monetary Value,思路根据各自
29、然状态发生的概率,求不同方案的期望收益值,取其中最大者为选择的方案。E(Si)=p(Nj)a(Si,Nj),Decision Making with Probabilities,Expected Value ApproachIf probabilistic information regarding the states of nature is available,one may use the expected value(EV)approach.Here the expected return for each decision is calculated by summing the
30、products of the payoff under each state of nature and the probability of the respective state of nature occurring.The decision yielding the best expected return is chosen.,Example:Burger Prince,Burger Prince Restaurant is contemplating opening a new restaurant on Main Street.It has three different m
31、odels,each with a different seating capacity.Burger Prince estimates that the average number of customers per hour will be 80,100,or 120.The payoff table for the three models is as follows:Average Number of Customers Per Hour p1=0.4 p2=0.2 p3=0.4 N1=80 N2=100 N3=120 S1=Model A$10,000$15,000$14,000 S
32、2=Model B$8,000$18,000$12,000 S3=Model C$6,000$16,000$21,000,矩阵法的局限性,决策矩阵表示法只能描述单级决策问题;决策矩阵表示法要求所有行动方案面对的自然状态完全一致。,(三)期望值准则-决策树法,决策树决策节点,一般用方块表示,由它引出的分枝叫方案分枝,表示该决策点的可选方案;状态点,一般用圆块表示,由它引出的分枝叫状态分枝或概率分枝,表示该方案面对的状态;结果节点,一般用三角块表示,代表某一方案在相应状态下的收益或效用值。,决策点 方案节点 结果节点,1,1,2,3,大批量生产,中批量生产,小批量生产,N1(需求量大);P(N1)
33、=0.3,N1(需求量大);P(N1)=0.3,N1(需求量大);P(N1)=0.3,N2(需求量小);P(N2)=0.7,N2(需求量小);P(N2)=0.7,N2(需求量小);P(N2)=0.7,30,-6,20,10,-2,5,生产决策问题的决策树,(三)期望值准则-决策树法,决策过程逆向归纳法绘制决策树;自右到左计算各方案的期望值,将结果标在方案节点处;选收益期望值最大的方案为最优方案。,(三)期望值准则-决策树法,1,1,2,3,大批量生产,中批量生产,小批量生产,N1(需求量大);P(N1)=0.3,N1(需求量大);P(N1)=0.3,N1(需求量大);P(N1)=0.3,N2(
34、需求量小);P(N2)=0.7,N2(需求量小);P(N2)=0.7,N2(需求量小);P(N2)=0.7,30,-6,20,10,-2,5,4.8,4.6,6.5,期望值,Example:Burger Prince,Decision Tree,1,0.2,0.4,0.4,0.4,0.2,0.4,0.4,0.2,0.4,S1,S2,S3,N1,N1,N1,N2,N3,N2,N2,N3,N3,Payoffs,10,000,15,000,14,000,8,000,18,000,12,000,6,000,16,000,21,000,2,3,4,Example:Burger Prince,Expect
35、ed Value For Each Decision Choose the model with largest EV Model C.,3,4,S1,S2,S3,EV=0.4*10000+0.2*15000+0.4*14000=$12600,EV=0.4*8000+0.2*18000+0.4*12000=$11600,EV=0.4*6000+0.2*16000+0.4*21000=$14000,Model A,Model B,Model C,2,1,三、序列决策,序列决策,许多决策问题,当进行决策后,又有新情况(或状态),又需要进行新的决策,如此出现决策、情况、决策、。构成了一个序列,称为一
36、个决策序列。描述决策序列的有效工具是决策树。举例:某石油钻井队,在一片估计可能出油的荒地上钻探,可先做地震试验然后决定钻井与否;也可不做地震试验,只凭经验决定是否钻井。已知做地震试验的费用是3000元,而钻井的费用为10000元。,1,2,1,2,试验,好,钻井,出油,不出油,-3000,0.6,-10000,0.85,0.4,3,3,钻井,出油,不出油,-10000,0.10,不钻井,不钻井,4,4,钻井,出油,不出油,-10000,0.55,不钻井,不好,不试验,0.15,0.90,0.45,0,0,40000,40000,40000,0,0,0,0,1,2,1,试验,好,钻井,-3000
37、,0.6,-10000,0.4,3,钻井,-10000,不钻井,不钻井,4,钻井,-10000,不钻井,不好,不试验,0,34000,22000,0,4000,0,1,2,1,试验,好,钻井,-3000,0.6,-10000,0.4,3,钻井,-10000,不钻井,不钻井,4,钻井,-10000,不钻井,不好,不试验,0,34000,22000,0,4000,0,1,1,试验,好,-3000,0.6,0.4,不好,不试验,24000,12000,0,1,试验,-3000,不试验,14400,12000,最优决策序列:不试验,钻井,14400,12000,秘书问题,瓦特.威洛比是一家从事经济分析
38、和预测的咨询公司.这家公司的总经理凯.塞拉女士想雇佣一位新的事务秘书,正大算请职业介绍所推荐适当的人选同他会面。根据过去的经验,她自信能凭面谈即可断定求职者在受雇后的表现是极好的、好的、还是一般的。她给三种人以相应的分数:极好的为3分,好的为2分,一般为1分。一往的经验还使她相信,会见极好的候选人的概率为0.2,会见好的候选人的概率为0.5,而会见一般的候选人的概率为0.3。,T0.2,F0.3,G0.5,继续,继续,停止,T0.2,F0.3,G0.5,继续,T0.2,F0.3,停止,G0.5,停止,继续,停止,停止,1,2,3,3,3,2,2,停止,停止,T极好,F一般,G好的,T0.2,F
39、0.3,G0.5,继续,继续,停止,T0.2,F0.3,G0.5,继续,继续,停止,1.9,3,3,2,2,停止,停止,T0.2,F0.3,G0.5,继续,继续,停止,T0.2,F0.3,G0.5,继续,继续,停止,1.9,3,3,2,2,停止,停止,T0.2,F0.3,G0.5,继续,继续,停止,T0.2,F0.3,G0.5,1.9,3,3,2,2,停止,最后的期望值=2.336,1.9,1.9,2,2.17,2.17,2.17,2.336,3,3,分 析,归纳起来,最优的决策序列是:只有在第一次碰到极好的秘书时,会见后停止面试,否则无论是好或一般都继续;在第二次,只有当碰到一般时,继续会见
40、下一位,其他情况都停止面试。,四、决策的效用,选择:A:肯定10000元 B:概率得 30000元,概率得 0,有两种选择A:稳获100元B:41%的机会得到250元,59%的机会得到0有两种选择A:稳获10000元B:掷一均匀的硬币,直到出现正面为止,记所掷次数为N,则得到 元,问 题?,效用函数如何确定?直接用所获得的金钱数额作为效用合理吗?,圣彼得堡悖论,18世纪上半叶,俄罗斯圣彼得堡曾流行过关于抛硬币的赌博游戏,规则是:上抛一枚质地均匀的硬币,如出现反面,则再上抛直至有人头的正面出现为止。若正面出现的次数在第n次,则得2n元,当然参与者必须先支付庄家k元。问题是,参与者愿意先付多少赌注
41、才愿意参与赌博?根据概率论的分析,赌徒的期望收益随着抛硬币的次数趋向无穷而达到无穷大。但不是人人都愿意参与的。,精神价值与效用,Berneulli首先提出精神价值(Moral value)概念,他认为人们拥有财富金额的多少并不代表这些财富对这个人的真正价值。对钱财的真实价值与他的钱财拥有量之间有对数关系。19世纪的西方经济学家在接受了Berneulli的关于“精神价值”的思想,把这种现象称为“边际效用递减规律”。1881年Edewordth提出商品效用的概念,采用等值曲线来反映商品价值的优先次序,形成了19世纪的经济学效用理论。效用是决策主体对客体的偏好的数值度量,用它来衡量人们对某些事物的主
42、观价值、态度、偏爱、倾向等等。,效用理论,效用的基本概念人们主观上对货币在某种风险情况下的态度和价值的度量叫做效用,用效用值来度量。同样货币同样的风险,不同的决策人有不同的效用值;同样的货币同样的决策人,不同的风险态度,有不同的效用值。效用曲线?在某种风险态度下某个决策人的效用值对货币的关系。如何取得决策者的效用函数?采用心理风险实验法,用五点拟合。,风险的态度,Lottery 1:50%可能得$50,000 and 50%可能0;Lottery 2:肯定得$K问题:K 是多少才认为与Lottery1 等价?If K=$25,000,风险中性 risk neutral.If K$25,000,
43、风险追求 risk seeking.,效用函数,效用函数是对决策者的偏好的定量描述;效用值是一个相对值,无量纲,一般用 0,1 或0,10或0,100之间的数来表示。,效用曲线的类型,One Type of Utility Function,U(X)=(X-Xmin)/(Xmax-Xmin)aThe exponent a encodes risk attitude risk averse(风险规避):0 1:,Three Risk Attitudes,1,2,1,2,试验,好,钻井,出油,不出油,-3000,0.6,-10000,0.85,0.4,3,3,钻井,出油,不出油,-10000,0.
44、10,不钻井,不钻井,4,4,钻井,出油,不出油,-10000,0.55,不钻井,不好,不试验,0.15,0.90,0.45,0,0,40000,40000,40000,0,0,0,0,1,2,1,2,试验,好,钻井,出油,不出油,-3000,0.6,-10000,0.85,0.4,3,3,钻井,出油,不出油,-10000,0.10,不钻井,不钻井,4,4,钻井,出油,不出油,-10000,0.55,不钻井,不好,不试验,0.15,0.90,0.45,0,-10000,27000,27000,30000,-13000,-3000,-13000,-3000,效用函数:U=(x-xmin)/(xm
45、ax-xmin)0.5,1,2,1,2,试验,好,钻井,出油,不出油,0.6,0.85,0.4,3,3,钻井,出油,不出油,0.10,不钻井,不钻井,4,4,钻井,出油,不出油,0.55,不钻井,不好,不试验,0.15,0.90,0.45,0,-10000,27000,27000,30000,-13000,-3000,-13000,-3000,利润,效用,0.68,0.27,0.98,0.98,1,0,0.6,0,0.6,效用函数:U=(x-xmin)/(xmax-xmin)0.5,0.833,0.098,0.672,0.833,0.60,0.68,0.74,0.74,决策序列:先做试验,如果
46、好就钻井,否则不钻井。,五、决策理论的新进展,期望效用理论之于阿莱斯悖论:,1)有两个投资机会与:会稳赢3000元;会以80概率获4000元,20概率得零;大多数人会选。这说明 2)再考虑投资机会与:会以20的概率获4000元,80的概率得零,会以25的概率得3000元,75的概率得零,这时,上述在与中偏好的大多数人又会选,这又说明:,期望效用理论之于阿莱斯悖论:,直观上看,机会只是025,而机会也只是0.25,显然,人们在、之间的 选择与在、之间的选择了发生了不一致,期望效用理论在解释圣彼得堡悖论时,在期望值理论的基础上有很大的突破,但对阿莱斯悖论却无法解释,而正是这一悖论的出现,引起了人们
47、对期望效用理论的反思,促进了展望理论的发展。(阿莱斯由于提出这一悖论以及与该悖论相关的对人类选择行为的一系列研究,而获得了1988年的诺贝尔经济学奖),测 验,有两种选择A:肯定获得10000元B:50%的可能获得20000元,50%的可能什么也得不到;问:你选择A or B?,测 验,有两种选择A:肯定失去10000元B:50%的可能失去20000元,50%的可能没有得失;问:你选择A or B?,答 案,面对获得,大多数人往往是风险规避的 面对失去,大多数人又成了冒险家,理性决策,理性(rationality)是指在给定条件和约束的限度内,实现给定目标的一种合乎逻辑的行为方式。非理性(ir
48、rationality)主要靠情感机制(激励、冲动、情绪、个性)或者其他非理性机制(如直觉)所进行的行为方式。理性决策在给定的条件和约束下,为实现既定的决策目标,其决策过程是一个“以理性为基础、合乎逻辑”的过程。理性决策是建立在一系列假设基础上的,如清晰的问题、明确的目标、无限的认识能力、明确稳定的偏好等。,决策理论研究的热点,有限理性决策理论理性决策假设的局限、从决策方法学 走向决策行为学(behaviour decision making)个体决策行为个体决策行为、决策者的心理压力、认知偏误、行为模式群体决策行为组织决策行为,2002,The prize was awarded joint
49、ly to 丹尼尔卡尼曼和弗农史密斯 for their pioneering analysis of心理和实验经济学方面杰出贡献,创始人丹尼尔-卡恩曼(Daniel Kahneman):,2002年瑞典皇家科学院宣布,该年度诺贝尔经济学奖授予美国普林斯顿大学的丹尼尔卡内曼(Daniel Kahneman)和美国乔治梅森大学的维农-史密斯(Vernon L.Smith),他们都是实验经济学的创始人与大师,Prospect Theory(展望理论或前景理论)创始人丹尼尔-卡恩曼(Daniel Kahneman):,丹尼尔-卡恩曼:1934年出生于以色列的特拉维夫,1954年在耶路撒冷Hebrew
50、 University获得数学和心理学学士学位,1958年迁入美国,1961年获得了加州大学伯克利分校的心理学博士学位,从1993年开始担任普林斯顿大学心理学教授和公共关系学教授。丹尼尔卡恩曼(Daniel Kahneman)的主要贡献是在不确定条件下的人为判断和决策方面的发现,是行为经济学的开创者之一,也是“幸福经济学”的重要研究者之一。他率先将源于心理学的综合洞察力应用于经济学的研究,从而为一个新的研究领域奠定了基础,使经济学的理论更加丰富。,用实验来解释展望理论:,实验一假设美国正在准备防御一种罕见的亚洲疾病的迅速蔓延,估计会使六百人丧生。有人提出了两种方案来对付该疾病。针对这些方案的后