5决策分析6学时.ppt

上传人:sccc 文档编号:5850200 上传时间:2023-08-27 格式:PPT 页数:123 大小:1.37MB
返回 下载 相关 举报
5决策分析6学时.ppt_第1页
第1页 / 共123页
5决策分析6学时.ppt_第2页
第2页 / 共123页
5决策分析6学时.ppt_第3页
第3页 / 共123页
5决策分析6学时.ppt_第4页
第4页 / 共123页
5决策分析6学时.ppt_第5页
第5页 / 共123页
点击查看更多>>
资源描述

《5决策分析6学时.ppt》由会员分享,可在线阅读,更多相关《5决策分析6学时.ppt(123页珍藏版)》请在三一办公上搜索。

1、第五讲 决策分析,李刚西安交通大学管理学院,主要内容,1管理决策2 不确定性问题的决策3风险型决策分析4 博弈与决策5 冲突分析,1 管理决策,一、基本概念决策是管理的重要职能,它是决策者对系统方案所做决定的过程和结果,决策是决策者的行为和职责。按照H.A.西蒙(H.A.Simon)的观点,“管理就是决策”。因此,决策分析的一般过程也即管理系统分析的过程。决策是一种过程情报活动、设计活动、抉择活动、实施活动,1 管理决策,决策问题的基本模式(,j):决策者的第种策略或者方案,使决策变量,决策者可以控制j:决策者和决策问题所出的第种环境条件,是状态变量,决策者不可控;:决策者在第中状态下选择第种

2、方案的结果,是决策问题的价值函数值,一般叫做损益值、效用值,1 管理决策,决策问题分类例子:某部门要进行工程项目建设,经过估算可知:如果下月开工建设,天气好,则可以按时完工,企业能获得收益元;如果开工后天气不好,则不能正常施工,企业损失元;不论天气好坏,均不开工,企业损失元;请作出是否开工决策?,1 管理决策,1)确定型决策知道决策人知道可靠的天气预报信息,则可以做出确定型决策.比如,直到下个月是好天气,则决策为:,1 管理决策,确定型决策必须具备的条件存在着决策人希望达到的一个目标(比如 利润最大)只存在一个确定的自然状态(比如天气好)存在着可供决策人选择的两个或者两个以上的行动方案(策略)

3、不同行动方案存在确定的自然状态下的损益值,通过计算,可以定量表示,1 管理决策,2)风险型决策又叫做统计型决策或者随机型决策在上例中,如果决策人能够获知下月天气好坏的概率信息,则其决策问题就是风险型决策,开工:.().不开工:.2+(-5000).=-5000决策:开工,1 管理决策,风险型决策存在的条件存在着决策人希望达到的一个目标存在着两个或者两个以上不以决策人主观意志为转移的自然状态存在着两个或者两个以上可供决策人选择的行动方案不同方案在不同自然状态下的损益值,可以定量表示在几种状态中,未来究竟出现哪一种的可能性,可以预先估算出来;,1 管理决策,3)不确定性决策不知道各类自然状态今后发

4、生的概率信息例子:某企业要生产新产品,有三种方案,建立新的自动化生产线(方案A1),改建原有的生产线(方案A2),在原来的生产线继续生产(方案A3)对该产品的市场销量的估计为:需要量很大,一般,较低,很低等四种情况。经过估算,在不同的生产线方案下,不同销售状态下的损益值如下表:,1 管理决策,缺少关于各种自然状态(销售好坏)出现的概率信息,所以是不确定性决策,1 管理决策,4.对抗型决策Wij=f(Ai,Bj)i=1,m,j=1,n 其中:A决策者的策略集;B竞争对手的策略集 可采用对策论及其冲突分析等方法来分析解决。这类决策分析问题是当前管理、经济界比较关注的问题。5.多目标决策,决策分析过

5、程,1 信息活动为决策收集足够的、准确的信息2 设计活动选择决策目标,即确定决策的依据和准则。3 抉择活动根据已确定的准则,对各种方案进行分析、计算和评价,用以选出一个最优方案的活动过程4 实施活动对决策的方案进行实施、跟踪和学习。,风险性决策分析过程,确定决策模型结构:构建决策树估算各行动方案下的损益值:估计备选方案在不同环境状态下所付出的代价和取得的收益确定主观概率:估计未来环境中各种状态出现的概率评价方案:按估计的后果和概率计算备选方案的效益(效用)指标,按照效益(效用)最大者为最优方案,风险性决策分析过程,灵敏度分析:由于后果值和概率的主观性和不确定性,确定决策模型中参数的变化范围收集

6、信息:对灵敏度高的参数需收集更多信息进行研究,但考虑信息价值问题选择方案,主要内容,1管理决策2 不确定性问题的决策3风险型决策分析4 冲突分析,2 不确定型问题的决策,决策者根据自己的主观倾向进行决策,根据决策者主观态度不同有以下五种常用的决策准则和方法:悲观主义准则 乐观主义准则 乐观系数准则 最小机会损失准则 等可能性准则,悲观主义准则,从各方案的最小益损值中选择最大的,也称“小中取大”法,是一种万无一失的保守型决策者的选择准则。,悲观主义准则,把每个方案在不同自然状态下的最小损益值找出来则MinA1850,420,-150,-400=-400MinA2600,400,-100,-350

7、=-350MinA3400,250,90,-50=-50然后从各方案的最小损益值中找到一个最大的Max-400,-350,-50=-50与最大值相对应的方案是A3,则选择A3方案,乐观主义准则,决策者对客观情况总是抱乐观态度,从各方案最大益损值中选择最大的,也称“大中取大”。是一种偏于冒进的决策准则。把每个方案在不同自然状态下的最大损益值找出来则MinA1850,420,-150,-400=850MinA2600,400,-100,-350=600MinA3400,250,90,-50=400然后从各方案的最大损益值中找到一个最大的Max850,600,400=850与最大值相对应的方案是A1

8、,则选择A1方案,乐观系数准则,一种折衷准则,决策者对客观条件的估计既不乐观也不悲观,主张一种平衡,用一个乐观系数(01),计算各方案的折衷益损值,从中选取最大的。计算方法求取各方案的最大损益值ximax求取各方案的最小损益值ximin各方案的折衷损益值为Xi=Ximax+(1-)XiminXi最大者为最优方案,乐观系数准则,后悔值准则,决策者一般易于接受某状态下收益最大的方案,但由于无法预知那一状态一定出现,当决策者没有采纳收益最大的方案,就会感到后悔。求取每个状态下,最大收益值与其他收益值之差作为后悔值或机会损失值,然后从各方案的最大后悔值中选取最小值,与之对应的方案就是最优方案,后悔值准

9、则,1)先找出对应各种自然状态下每个行动方案的最大损益值,用*标注,后悔值准则,求出各方案在不同自然状态下的后悔值,后悔值准则,从各方案的最大后悔值中,找出最小后悔值Min350,300,450=300与之对应的行动方案是A2,等可能性准则,决策者不能肯定那种状态会出现,采取一视同仁的态度,认为出现的可能性相等,有n个状态,其出现的概率均为1/n,计算各方案的期望最大收益值,从中选取最大的。例如:,主要内容,1管理决策2 不确定性问题的决策3风险型决策分析4 冲突分析,3风险型决策分析,风险型决策也称随机型决策或统计型决策最大可能性法最大期望收益准则(Expected Monetary Val

10、ue,EMV)最小机会损失准则(Expected Opportunity Loss,EOL)决策树法,最大可能性法,从可能出现的状态中,选择一个概率最大的状态进行决策,而不考虑其他状态,问题转化为确定型决策应用条件:在收益矩阵中的元素差别不大,而各状态中某一状态的概率明显地大的多;如果各状态概率很接近,而益损值相差较大时,不宜采用。,EMV和EOL,决策目标考虑的是收益值,计算各方案的期望收益值,从中选择期望收益最大的。决策目标考虑的是损失值,计算各方案的期望损失值,从中选取期望损失最小的。,决策树法,描述多级决策(序列决策)的工具所谓决策树法就是利用树形图模型来描述决策分析问题,并直接在决策

11、树图上进行决策分析。“”表示决策节点,从它引出的分枝为方案枝,分枝数量与方案数量相同,分枝上要注明方案名称。“O”表示状态节点,从它引出的分枝为状态分枝或概率分枝,分枝数量与可能出现的自然状态数量相同,分枝上要注明状态出现的概率。“”表示结果节点,不同方案在各种状态下所取得的结果(益损值),标注在结果节点的右端。,决策树,决策树举例,有一钻探队做石油钻探,可以先做地震试验,费用为0.3万元/次,然后决定钻井与否,钻井费用为1万元,出油收入为4万元。根据历史资料,试验结果好的概率为0.6,不好的概率为0.4;结果好钻井出油的概率为0.85,不出油的概率为0.15;结果不好钻井出油的概率为0.1,

12、不出油的概率为0.9。也可不做试验而直接凭经验决定是否钻井,这时出油的概率为0.55,不出油的概率为0.45,试用决策树进行决策。,决策树计算,结论:不试验直接钻井,期望收入为1.2万元。,钻井,不钻井,钻井,不钻井,多级决策树,某化妆品公司生产BF型号护肤化妆品。由于现有生产工艺比较落后,产品质量不易保证且成本较高,销路受到影响。在产品价格保持现有水平时无利可图,当产品价格下降时还要亏本,只是在产品价格上涨时才稍有盈利。为此公司决定要对该产品生产工艺进行改进,提出两种方案以供选择:一是从国外引进一条自动化程度较高的生产线;另一是自行设计一条有一定水平的生产线。,多级决策树,根据公司以往引进和

13、自行设计的工作经验显示,引进生产线投资较大,但产品质量好且成本较低,年产量大,引进技术的成功率为80%。而自行设计生产线,投资相对较小,产品质量也有保证,成本也较低,年产量也大,但自行设计的成功率只有60%。进一步考虑到无论是引进或自行设计生产线,产量都能增加。,多级决策树,因此,公司生产部门又制定了两个生产方案:一是产量与过去相同(保持不变),一是产量增加,为此又需要进行决策。最后,若引进或自行设计均不成功,公司只得仍采用原有生产工艺继续生产,产量自然保持不变。公司打算该护肤化妆品生产5年。根据以往价格统计资料和市场预测信息,该类产品在今后5年内价格下跌的概率为0.1;保持原价的概率为0.5

14、,而涨价的概率为0.4。,状态,概率,损益值,方案,信息价值分析,在灵敏度分析后,有些关键状态的概率有时灵敏度很高,需要进一步收集信息,提高先验概率的精度,来更准确可靠地评定这些参数。进一步收集信息需要进行“调查研究”,通过收集样本、统计分析取得更可靠的信息。“调查研究”所得到的咨询信息一般都有误差,调研结果要考虑其失误的可能性“调查研究”需要费用,不管咨询结果是否有用,都得付费,因此在调研前要考虑所得到的信息用途多大,即信息的价值分析。为了衡量调研人员提供信息的用途大小,一般根据历史资料,用该人员(单位)过去提供正确或不正确信息的概率来表示。,信息价值分析,决策所需的信息一般可以分为两类。一

15、类是完全信息,即据此可以得到完全肯定的自然状态信息,这样就有助于正确的决策,从而使决策结果能获得较大的收益,但为获得完全信息的代价也相当可观,而且在现实中和在多数情况下,要获得这种完全信息也较为困难或根本不可能做到;另一类是抽样信息,这是一类不完全可靠的信息。通过抽样所获得的信息,用统计方法来推断自然状态出现的概率,据此来选择行动方案。抽样信息虽不十分可靠,但为获得此类信息的代价也较小,且在实际中和在多数情况下,也只可能获得这类信息以供决策之需。,完全信息价值,某化工厂生产一种化工产品,据对统计资料的分析表明,该产品的次品率可以分成五个等级(即五种状态),每种等级(状态)的概率如表73所示。进

16、一步的分析可知,产品次品率的高低与该产品所用主要原粒的纯度有关。今已知,化工原料纯度高,次品率低(如S10.02),反之则次品率高(S50.20)。而化工原料的纯度高低,又与运输、保存日期等因素有关。,完全信息价值,完全信息价值,为此,工厂主管生产的部门建议在生产该产品前,先对该化工原料增加一道“提纯”工序,通过提纯工序,能使全部原料都处于S1状态,从而降低了次品率。但增加提纯工序就增加了工序费用,经过核算可知,每批原料的提纯费用为3400元。经估算,在不同纯度状态下其益损值如表74所示。如果在生产前,先将化工原料检验一下,通过检验可以完全掌握每批化工原料处于何种纯度状态,这样可以对不同纯度的

17、原料采用不同策略,即提纯或不提纯,从而使益损期望值为最大。,完全信息价值,状态,概率,损益值,方案,完全信息价值,由图76可知,通过检验,当某批原料纯度处于S1、S2或S3状态时,采用A2(不提纯)方案,其益损值大于A1方案。反之若处于S4或S5状态时,则采用A1(提纯)方案,这时其益损值大于A2方案。据此可计算益损期望值为2220元。与没有经过检验工序相比,由于通过检验完全知道原料纯度的状态信息,因此可得完全信息的价值为2220-1760=460元。通过该例可知,为获得完全信息所要付出的代价,不应大于完全信息所能得到的收益期望,本例中即不应大于460元本例如图76中提纯方案分枝菱形内的数字为

18、50,即增加检验工序只花费50元,而能多获460元的收益。因此,增加检验工序是可取的。,抽样信息价值,某家电公司由于原产品结构已陈旧落后,产品质量差而销路不广。为满足广大消费者日益增长的需要,公司拟对产品结构进行改革,制定了两种设计方案。全新设计方案(A1),即产品结构全部重新设计;改型设计方案(A2),即在原有产品结构基础上加以改进。,抽样信息价值,如采用全新设计方案,由于结构全部重新设计。原有许多工艺装备都不能继续利用,需重新添置,故投资费用较大。但由于结构新型且工艺先进,故可提高产品质量和生产率,如产品销路好,则工厂可获较大收益。反之,如销路差,则因开工不足,投资未能及早回收,公司亏损也

19、大。又如采用改型设计方案,则原有工艺装备基本上都可利用,故投资费用少,因此无论销路好或销路坏,都能获得一定收益而不致亏损。公司根据以往统计资料可得销路好的概率为0.35,销路差的概率为0.65,计划将该产品生产5年,其益损值可以估算如表75所示。,抽样信息价值,益 损,状态,方案,概率,四、效用值理论,决策准则可传递性独立性期望收益值的缺陷后果多样性:是多次试验的平均值决策者的价值观需要一种能表达人们主观价值的衡量指标,并能综合衡量各种定量和定性的后果这样的指标没有统一的客观尺度,因人而异,视个人的经济、社会和心理条件而定,伯努利期望效用值理论,效用值:人们在拥有财富多少不一的条件下,增加同样

20、的财富所感受到的效用值是不同的,随财富的增加效用值总是在增加,但增长率是递减的买彩券:5(500)元一张,0.5概率中奖得10(1000)元,期望收益值为零;问题:如何遵循理性原则求得效用值?,冯诺曼-摩根斯坦期望效用值理论,定义了计量效用值,使效用值的计算成为现实在“伯”的基础上提出,针对风险状况下财富的价值,而“伯”的是针对确定状况下财富的价值而提出的,效用曲线性质分析稳重型效用曲线,稳重型效用曲线:非负,U(0)=0,曲线形状随财富X的增加而趋于扁平,即随着财富的增多,附加财富带来的满足程度逐渐下降,,效用曲线性质分析冒险型效用曲线,冒险型效用曲线:曲线为凸(呈碗状)一些小企业主,创业时

21、(或处于较穷困情况)愿意冒风险,而具有一定规模后又变的稳妥,这种情况下效用曲线为组合曲线,效用曲线,混合型效用曲线,博弈与决策,李刚西安交通大学管理学院,引子博弈的不确定性,在一次具体的战斗中,一方是否发起进攻,是一个决策。如果发起进攻,对方肯定有所反应,客观上讲,必然会有一个确定的结果存在,这是确定性的表现。但是最后的结果如何,取决于对方如何应对,所以在发起进攻时,并不能知道结局是怎样的,这就是不确定性的表现。,如果一方发起进攻后,另一方马上投降,则战斗结束;如果对方进行反攻,从理论上来讲,结果取决于双方实力以及双方收益的大小。由此可以看出博弈的广泛存在,在现实生活中做出任何决策时,实际上都

22、受到其他主体决策的影响并对我们做决策产生一定影响,决策的结果除了由我们自己决定外还要受到其他决策主体的影响,这实际上就是一个博弈过程。,二、参与者(PLAYER),参与博弈的利益主体叫做参与者。英文原意为玩主,也有译成局中人的。在二人博弈中,有两个参与者;在三人博弈中,有三个参与者;在多人博弈中,有多个参与者。,三、策略和策略空间,1策略 在给定条件博弈中,参与者完整的一套行动计划叫做策略。例如我国古代著名的谋略故事“田忌赛马”中,国王的赛马计划是:先出上等马,再出中等马,最后出下等马;田忌的赛马计划是:先出下等马,再出上等马,最后出中等马。这里的赛马计划就是一套完整的行动计划,也就是一个策略

23、。,2策略空间,参与者可以选择的策略的全体就组成了策略空间。例如在“田忌赛马”中,共有六种行动方案可供选择:上中下(先出上等马,再出中等马,最后出下等马)、上下中、中上下、中下上、下上中、下中上。决策时田忌可以选择其中任何一个策略,在故事中,因为国王固定选择了上中下,所以田忌选择了下上中,从而赢得了比赛。任何一人策略的改变都将使结果也随之改变,比如国王选择了中下上,而田忌选择了下上中,则国王将赢得比赛。,四、报酬函数与报酬矩阵,1报酬函数 每一个参与博弈的参与者,他的收益依附于各个参与者所出的策略,这种收益与策略的依附关系就构成了报酬函数。也就是说,第i个参与者的收益取决于所有参与者的策略,而

24、不仅仅是自己的策略,表示成数学式子就是:Ri=Ri(S1,S2,Sn)。其中Ri表示第i个参与者的收益,Si(i=1,n)表示第i个参与者所出的策略。,2报酬矩阵,参与博弈的多个参与者的报酬可以用一个矩阵或框图表示,这样的矩阵或框图就叫做报酬矩阵。例如有甲乙两个供货商组成一个价格卡特尔,双方都有选择遵守约定价格或者违反约定价格的权利。报酬矩阵如下图所示:,矩阵中每组数字中的前一个数字表示甲的收益,后一个数字表示乙的收益。当甲守约时,乙如果守约,收益为8,乙如果违约,收益为10;当甲违约时,乙如果守约,收益为6,乙如果违约,收益为7。所以,当甲守约时,乙会选择违约(108);当甲违约时,乙也会选

25、择违约(76)。反之不管乙如何选择,甲都会选择违约,最终的结果是双方都选择违约。报酬矩阵改变,就会影响到双方的决策。例如双方的报酬矩阵变成下图所示:,此时双方可能都选择守约,因为当甲守约时,乙会选择守约(1210);当甲违约时,乙也会选择守约(2-4)。反之不管乙如何选择,甲都会选择守约,最终的结果是双方都选择守约。,博弈过程参与者的决策行为要受到博弈规则的影响,即博弈规则的变化会改变报酬矩阵中的报酬值。比如在图 8-1中,由于卡特尔中的每一个供货商都追求自身利益的最大化,并且没有措施来保证遵守价格约定,表面上可能都信誓旦旦的承诺守约,但是实际中双方会违约。,如果卡特尔追求整体利益的最大化,并

26、且由于历史、政治、制度、惩罚等措施来保证遵守价格约定,双方就可能和平共处,遵守价格约定。在历次中东战争中,由于民族宗教原因,OPEC石油的产量和价格都得到了严格的执行。,五、均衡及博弈的解,当博弈的所有参与者都不想改换策略时所达到的稳定状态叫做均衡,均衡的结果叫做博弈的解。比如图8-1中甲乙两个供货商组成的卡特尔。不管甲如何选择,乙必然选择违约,同样不论乙如何选择,甲必然选择违约。最终双方都选择了违约,并且只要给定的条件不变,双方就都不会改变策略,结果非常稳定,达成均衡。,在这个均衡中,不管甲如何选择,乙都不会改变策略,同样无论乙如何选择,甲也不会改变策略,这种均衡就叫做占优均衡。这种无论对方

27、如何决策,自己总是会选择的策略叫做占优策略,由双方的占优策略所达成的均衡叫做占优均衡。再比如,在学校中,学生平时学习可能是非常努力也可能是非常懒散;老师可能把考试题出的很难,也可能出的很容易。从博弈论的角度,这里的老师和学生就构成了一个博弈,双方的报酬矩阵如下:,由于老师出难题比出容易题要花费更多的时间和精力,所以收益较低,从而无论学生平时努力程度如何,老师一定选择出容易的题;由于学生只要努力学习就会取得更好的成绩,所以无论老师所出考题难度如何,学生一定会选择努力学习,这同样构成一个占优均衡。经常遇到的还有一种均衡,是有条件的均衡,叫做纳什均衡。简单的说就是敌变我变、敌不变我亦不变。在后面第二

28、节中将详细介绍纳什均衡。,六、囚犯两难困境,囚犯两难困境是博弈论中一个著名的例子,讲的是甲乙两名嫌疑犯作案后被警察抓住,分别被关在不同的屋子里受审,双方不能互通消息,每名嫌疑犯都面临坦白和不坦白两种选择。警察告诉他们:在两人都坦白的情况下,各判刑10年;在两人都不坦白的情况下,各判刑3年;在一人坦白另一人不坦白的情况下,坦白的一方会被从轻处罚,只被判刑1年,不坦白的一方则被重判15年。可以根据坦白后是否会受到制裁两种情况来讨论最终的均衡结果。,1、坦白后不会受到制裁时的情况 此时,双方收益矩阵如下:,图8-4,如图,在乙不坦白的情况下,如果甲坦白,甲会被从轻处罚,只被判刑1年,乙被重判15年;

29、如果甲也不坦白,由于证据不足,甲乙都只会被判刑3年。在乙坦白的情况下,如果甲也坦白,甲乙会被判刑10年;如果甲不坦白,乙会被从轻处罚,只被判刑1年,甲则被重判15年。可见,在乙不坦白的情况下,甲最好是坦白,从而可以被从轻处罚;在乙坦白的情况下,因为被判刑10年总比15年要好,甲最好也是坦白,所以甲会选择坦白。,同理,无论甲如何选择,乙的最好选择也是坦白。结果双方都选择坦白,都被判刑10年。可见,我国公安机关”坦白从宽,抗拒从严“的心理攻势在大多数情况下都是可以奏效的。囚犯两难困境说明个人的理性可能导致集体结果的不妙。在现实社会中,人人都追求完美反而可能会导致社会变得很糟糕。,2.坦白后会受到制

30、裁时的情况 博弈论的一个重要思想就是规则改变报酬矩阵,改变了报酬矩阵就会影响到行为方式。如果犯罪组织有着严格的惩罚制度,任何一个罪犯坦白后,不论坦白的事情严重与否,犯罪组织一定会杀人灭口,并且总是能迅速做到。这个规则将改变报酬矩阵,新的报酬矩阵如下图所示:,由于坦白后将被灭口,所以收益将是-。在乙不坦白的情况下,甲最好是不坦白;在乙坦白的情况下,因为被判刑15年总比死去要好,甲最好也是不坦白,所以甲会选择不坦白。同理,无论甲如何选择,乙的最好选择也是不坦白。结果双方都选择不坦白,各自被判刑3年。,智猪博弈,有一头大猪和一头小猪住在同一个猪圈里,猪圈的一侧放者猪食槽,另一侧安装着一个控制食物供应

31、的按钮。按一次按钮,有8个单位的食物进槽,但需承担2个单位的成本。偌大猪小猪同时到达猪食槽,大猪吃到5个单位的食物,小猪吃到3个单位的食物;若大猪先到,大猪吃7个单位的食物,小猪只能吃到1个单位;若小猪先到,小猪吃到4个单位食物,大猪也吃到4个单位食物。,智猪博弈(boxed pigs game),小猪 去按 等待 去按 3,1 2,4 大猪 等待 7,-1 0,0,大猪的收益外部化,小猪不劳而获,免费搭了大猪的便车。,众里寻他千百度,约会游戏:假定你是位女性,决定要结婚,你身边交际圈里有100位合适的单身男子都有意追求你,你的任务是,从他们中挑选一位作为结婚对象。你会怎样做呢?严格要求:每个

32、人你只能约会一次,而且只能当场决定选择还是放弃,不能把他们“冷冻”起来作为后备,一旦你选择了其中一个,你就没有机会再约会别人了。如果你的动机是找到最好的那个人,现实是没有一个策略可以保证实现这个目标。,一个办法是:将第一组人(比如先取10名)作为试验品,就像在糖果店试吃品一样,之后如果遇到比这组更好的对象,就可以考虑嫁给他。损失惨重的两种情形:前10名刚好是全部里面最糟的,碰巧下一个又是倒数11名;最好的选择恰好已经在前10名当中,导致你设了一个永远无法达到的标准,最后只好在所有机会都出现后选择第100个。,两难选择,抽样从10改为30或40如何?如果你抽去的样本太少,你得出的结论可能并不准确

33、;可是如果你取样太多,结论倒是准确了,可是又很可能错失最佳选择(他正好在取样里,被牺牲掉了)。,有没有最佳样本数的存在?苏格拉底的答案:1/3分出大中小三类,1/3验证是否正确,1/3选择属于大类中的一个。,小鸡博弈(the game of chicken),设想汤姆和吉米是两个顽皮的小孩,他们在小伙伴的鼓动下要进行一场关于勇气的比赛:两人分别从一条独木桥的两端冲向对方,谁退却谁就是“小鸡”。显然,如果两个人都向前冲,则两败俱伤,设支付水平为-2;如果一个勇进而另一个退却,则勇进者受到小伙伴的欢呼,退却者受到嘲讽,设支付分别为4和-1;若两人同时退却,则一起受到小伙伴的嘲笑,设支付为0,因为两

34、人一起受到嘲笑比起一人单独受到嘲笑要好受些。,吉米 退却 勇进 退却 汤姆 勇进,0,0,-1,4,4,-1,-2,-2,有两个均衡。实际会怎样?,可能之一:两兵相遇,勇者胜,未来影响现在,地摊、车站、旅游点人群流动性大,不但商品和服务质量差,而且假货横行,因为商家和顾客之间“没有明天”。在公共汽车上,两个陌生人可能为一个座位吵架,可如果他们认识就会相互谦让。道德、法律、权力利益的划分,都与“还要见面”有关。,扩大未来的影响。使得未来相对于现在更重要些:使相互作用更持久、更频繁(分解:商人们喜欢一个大订单分别按每次发货时间付款,而不愿等到最后付总帐)改变对策的四个可能的收益支付值;教给对策者促

35、进合作的准则、实施和技能;,出租比出售好,1937-1987,曼哈顿人口增长了300万,但出租车只多了100辆。短缺迹象:合法经营一辆出租车的权利(“大奖章”)在市场公开标价12.5万美元;同时,出租车按每天两班、每班12小时出租,每班价格约为60美元(每年约4.5万美元)。假如市政府拍卖100个新的大奖章,就能轻松赚到1250万美元。问题是,所有的获得者担心,市政府明年还会拍卖100个新的大奖章。如果市政府不能承诺限制大奖章数量,结果是没有人愿意为大奖章出高价。,纽约市政府应采取什么办法,能同时增加出租车的数目和库房收入?出租大奖章而不是出售。没有人要为以后的价值付钱。一步一步作出承诺:人们

36、愿意在一周或一年内相信政府,新的规定的通过需要一段时间;与其将今年的大奖章、明年的大奖章以及未来的大奖章合并为一枚永久性的大奖章,然后再出售,还不如一次只出售一枚大奖章,从而恢复自己的可信度。,公平还是不公平,如果给你两个师的兵力,你来当司令,任务是攻克“敌人”占据的一座城市,“敌人”的守备是三个师;规定双方的兵力只可整师调动,通往城市的道路有甲、乙两条,当你发起攻击时,若你的兵力超过敌人你就获胜;若你的兵力比“敌人”守备部队兵力少或者相等,你就失败。你如何制定攻城方案?,斜坡上的均衡,拿出1元钞票,请大家给这张钞票开价;每次叫价以5分为单位;出价最高者得到这张1元钞票,但出价最高者和次高者都

37、要向拍卖人支付相当于出价数目的费用。骑虎难下,及早退出乃是明智之举。,僵化的理性与逻辑,BF实验(Bee and fly):把几只蜜蜂和几只苍蝇撞在一个玻璃瓶中,然后将瓶子平放,让瓶底朝向窗口,结果会怎么样?蜜蜂会不停地在瓶子底部寻找出口,直到累死;而苍蝇在不到两分钟内全部逃出。蜜蜂喜欢光亮而且有智力,坚定地认为出后在光线最亮的地方(实验人员的臆测);苍蝇则对事物的逻辑不在意,到处乱飞。,别人的钱包更诱人,一位教授和两个学生(A和B)共进午餐,教授提议完一个游戏:把二人的钱包交给教授,教授数了一下发现其中一个钱包的金额是另一个的两倍(但他没有告诉谁多谁少),然后问他们是否愿意互换钱包?,藏羚羊

38、,珍稀动物的保护问题面临着一个难解的矛盾;藏羚羊“戒指披肩”,生存岌岌可危,政府严禁猎杀,抬高了藏羚羊毛的价格(大腕名言:“能出2000美金的主儿,就不在乎出4000美金”。而且,4000美金反而更能显示其身价),使盗猎成了“高风险、高收益”的生意,于是更多的亡命之徒加入盗猎者的行列。怎么办?允许随便捕杀肯定不是办法:没等价格下降,藏羚羊就会被猎杀光了。人工饲养理论上似乎可以,但是技术上未必可行,而且,一旦允许藏羚羊交易,野生、饲养又很难分辨,可怜的野生藏羚羊还是要被捕杀。这真是一个难解决的问题。,毒品,毒品之害,人所公认,可是在荷兰等国家,买卖轻度麻醉品确实合法的。很多学者,包括两位诺贝尔经

39、济学奖获得者弗里德曼和贝克尔,也都公开支持麻醉品合法化。他们的理由如下:我们缺乏道德上的理由去惩罚那些自杀的人。我们可以用言语来劝说,但我们没有权利组织和惩罚他们;麻醉品合法化后“自愿”食用麻醉品的人数可能会上升,也可能会下降,但“被迫”食用麻醉品的人数肯定会下降;由于麻醉品只能在地下买卖,所以品质的不到保证,瘾君子的身体会受到更严重的损害;管制之下,麻醉品的价格极高,这会诱使瘾君子从事其他犯罪活动;一旦放开管制,价格暴跌,原来靠麻醉品牟取暴利的犯罪分子会失去赖以生存的温床,瘾君子从事其他犯罪活动的机会也会减少。,三个快枪手,在一个西部小镇上,三个枪手正在进行生死决斗,枪手甲枪法精准,十发八中

40、;枪手乙枪法不错,十发六中;枪手丙枪法拙劣,十发四中。假如三人同时开枪,谁活下来的机率大一些?才华出众者创造历史,碌碌无为者繁衍子孙。,投票制度的利弊,选举结果取决于选举规则。A/B/C三人竞选公职,9位选民偏好如下:2位公民:A B C4位公民:C A B3为公民:B A C不同规则下的结果简单多数且第一选择有效:C胜出;多数人并不喜欢C,但却拥有忠贞选民;加权计票(2/1/0):A胜出;偏好投票(绝对多数第一名获胜;剔出第一名票数最少者,依原序重新分配):B胜出。谁才是“民众真正的期待”?,“英雄”为何成了失败者,A/B/C三候选人,17人投票第一选择:A/6人,B/6人,C/5人在首选B

41、和C的选民中分别有2人和3人把A作为第二选择复选制每位选民只投一票,当无人得票过半时,在最高票的两人中进行复选 A(比B多1票),假设第一次选举前,A展示了一件英雄行为(如救了一位落水儿童),使B的部分支持者(即对A也有好感的那2个人)在最后一分钟决定改投给A。结果是A的8票没有过半,B少了2票遭到淘汰;在复选中,A仍维持8票,C则因获得了B选民的4票后来居上,赢得了最后胜利。,一个悖论,解决公地悲剧的一个方法(通过私有化人们从保护中获得利益)却是更大的公地悲剧的根源(个人和国家追逐利益,破坏地球环境)。这其实也并不奇怪,“人类社会学三定律”其中有这样一条:一个系统内的解决之道,将成为更大系统

42、的难题。,参考读物,白波/著,博弈游戏,哈尔滨出版社,2004年5月Avinash K.Dixit and Barry J.Nalebuff著,王尔山译,策略思维 商界、政界及日常生活中的竞争策略,中国人民大学出版社,2002,第三节:冲突分析,一、对策论与冲突分析 冲突分析(Conflict Analysis)是国外近年来在经典对策论(Game Theory)和偏对策理论(Metagame Theory)基础上发展起来的一种对冲突行为进行正规分析(Formal Analysis)的决策分析方法,,其主要特点是能最大限度地利用信息,通过对许多难以定量描述的现实问题的逻辑分析,进行冲突事态的结果

43、预测和过程分析(预测和评估、事前分析和事后分析),帮助决策者科学周密地思考问题。它是分析多人决策和解决多人竞争问题的有效工具之一。国外已在社会、政治、军事、经济等不同领域的纠纷谈判、水力资源管理、环境工程、运输工程等方面得到了应用,我国也已在社会经济、企业经营和组织管理等领域开始应用。对策(Game)是决策者在某种竞争场合下作出的决策,是一种人为的不确定型决策(竞争或对抗型决策)。作为一类特殊的决策问题,对策的基本模式(概念模型)如图710所示。,图710 对抗型决策的概念模型,对策论起源于20世纪20年代初,40年代中和60年代中均得到了很大发展,70年代以来在许多方面又取得了丰硕成果。70

44、年代初,N.Howard(英)提出了一种以现实生活中最容易出现 的情况为基础的对策理论Metagame Theory(偏对策理论)。其基本思想是认为在选择策略时要考虑其他局中人可能的反应,即将各局中人的策略作为一种函数,使其构成更高一级的对策,即偏对策。另外,在该理论描述中,主张用结局的优先序代替其赢得值,从而使得对策模型的可实现性大大增强。,到了80年代,M.Fraser和W.Hipel(加拿大)在偏对策的基础上,提出了一种研究冲突事态的方法冲突分析方法,从而使得对策理论更加实用化。该方法的提出也迎合了近一、二十年来对策化(gaming)或通过模拟手段来研究对策问题的趋势。冲突分析方法的主要

45、特色是:(1)能最大限度地利用信息,尤其对许多难以定量分析的问题,用冲突分析解决起来更显得得心应手,因而较适于解决工程系统中考虑社会因素影响时的决策问题和社会系统中的多人决策问题。,(2)具有严谨的数学(集合论)和逻辑学基础,是在一般对策论基础上发展起来的偏对策理论的实际应用。(3)冲突分析既能进行冲突事态的结果预测(事前分析),又能进行事态的过程描述和评估(事后分析),从而可为决策者提供多方面有价值的决策信息,并可进行政策和决策行为的分析。(4)分析方法在使用中几乎不需任何的数学理论和复杂的数学方法,很容易被理解和掌握。主要分析过程还可用计算机、通过人机对话解决,因而具有很强的实用性。目前,

46、使用较多的冲突分析软件是CAP(Conflict Analysis Program)或DM(Decision Maker)。,(5)冲突分析用结局的优先序代替了效用值,并认为对结局比较判断时可无传递性,从而在实际应用中避开了经典对策论关于效用值和传递性假设等障碍。二、冲突分析的程序及要素 1、冲突分析的一般过程 冲突分析的一般过程或程序如图711所示。,图711 冲突分析过程示意图,(1)对冲突事件背景的认识与描述HT5SS以对事件有关背景材料的收集和整理为基本内容。整理和恰当的描述是分析人员的主要工作。主要包括:冲突发生的原因(起因)及事件的主要发展过程;争论的问题及其焦点;可能的利益和行为

47、主体及其在事件中的地位及相互关系;有关各方参与冲突的动机、目的和基本的价值判断;各方在冲突事态中可能独立采取的行动。对背景的深刻了解和恰当描述,是对复杂的冲突问题进行正规分析的基础。,(2)冲突分析模型(建模)是在初步信息处理之后,对冲突事态进行稳定性分析用的冲突事件或冲突分析要素间相互关系及其变化情况的模拟模型,一般用表格形式比较方便。(3)稳定性分析是使冲突问题得以“圆满”解决的关键,其目的是求得冲突事态的平稳结局(局势)。所谓平稳局势,是指对所有局中人都可接受的局势(结果),也即对任一局中人i,更换其策略后得到新局势,而新局势的效用值(赢得)或偏好度都较原局势为小,则称原来的局势为平稳局

48、势。因在平稳状态下,没有一个局中人愿意离开他已经选定的策略。故平稳结局亦为最优结局(最优解)。稳定性分析必须考虑有关各方的优先选择和相互制约。,(4)结果分析与评价 主要是对稳定性分析的结果(即各平稳局势)做进一步的逻辑分析和系统评价,以便向决策者提供有实用价值的决策参考信息。2、冲突分析的基本要素 冲突分析的要素(也叫冲突事件的要素)是使现实冲突问题模型化、分析正规化所需的基本信息,也是对冲突事件原始资料处理的结果。主要有:(1)时间点:是说明“冲突”开始发生时刻的标志;对于建模而言,则是能够得到有用信息的终点。因为冲突总是一个动态的过程,各种要素都在变化,这样很容易使人认识不清,所以需要确

49、定一个瞬间时刻,使问题明朗化。但时间点不直接进入分析模型。,(2)局中人(Players):是指参与冲突的集团或个人(利益主体),他们必须有部分或完全的独立决策权(行为主体)。冲突分析要求局中人至少有两个或两个以上。局中人集合记作N,N|=n2。(3)选择或行动(Options):是各局中人在冲突事态中可能采取的行为动作。冲突局势正是由各方局中人各自采取某些行动而形成的。每个局中人一组行动的某种组合称为该局中人的一个策略(Strategy)。第i个局中人的行动集合记作Oi,|Oi|=ki。,(4)结局(Outcomes)。各局中人冲突策略的组合共同形成冲突事态的结局。全体策略的组合(笛卡尔乘积

50、或直积)为基本结局集合,记作T,|T|=2。结局是冲突分析问题的解。(5)优先序或优先向量(Preference Vector)。各局中人按照自己的目标要求及好恶标准,对可能出现的结局(可行结局)排出优劣次序,形成各自的优先序(向量)。三、冲突分析基本方法举例(见图7-12),冲突分析古巴危机,时间点1962年10月,冲突局势基本明朗局中人美国、前苏联选择行动美国:设立封锁圈、空袭前苏联:撤除导弹、使事态升级结局美国2个选择,苏联两个选择总共组合起来共有2(2+2)=16种结局可以用二进制数表示,其中1215结局不可能,删除掉优先序的确定美国:4 6 5 7 2 1 3 0 11 9 10 8

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号