高鸿业版微观经济学博弈论.ppt

上传人:牧羊曲112 文档编号:5011469 上传时间:2023-05-29 格式:PPT 页数:48 大小:203.13KB
返回 下载 相关 举报
高鸿业版微观经济学博弈论.ppt_第1页
第1页 / 共48页
高鸿业版微观经济学博弈论.ppt_第2页
第2页 / 共48页
高鸿业版微观经济学博弈论.ppt_第3页
第3页 / 共48页
高鸿业版微观经济学博弈论.ppt_第4页
第4页 / 共48页
高鸿业版微观经济学博弈论.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《高鸿业版微观经济学博弈论.ppt》由会员分享,可在线阅读,更多相关《高鸿业版微观经济学博弈论.ppt(48页珍藏版)》请在三一办公上搜索。

1、博弈论初步,引言:目前,博弈论发展的非常深入,这里只是介绍一些初步知识。在二十世纪四、五十年代,由冯诺依曼、摩根斯坦把对策论、运筹学引入经济学,形成了最早的博弈论。几十年来,博弈论在经济学中发挥着越来越大的重要作用,1994年的诺贝尔经济学奖就授予三位博弈论学家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi),博弈论字面的意思是游戏策略,及用类似游戏中解决问题的方法,揭示解决社会、经济及其他领域问题的策略、对策,因此有的还把博弈论译成对策论。准确的说博弈论是在给定的条件下寻求最优策略,这里给定的条件包含其他人的策略以及本人的决策对其他决策主体的影响。,策略性活动在社会、经

2、济、政治生活中大量存在,也可以说,整个社会、经济、政治生活都是博弈行为。因此,博弈论作为一种方法,广泛的应用在经济、政治、军事、外交中,只是博弈论在经济学中应用的最广泛、最成功。如前面介绍过的古诺均衡,就属于经济学中的博弈过程。,三、博奕论模型(对策论模型),(一)博奕论或称对策论是指这样一种竞争状况,其中有两个或两个以上的人(厂商)各自追求自身的利益,而任何一方都不能单独决定其结果。1、零和博弈(不合作博弈)一个参与者所得是另一个参与者所失。所得与所失之和为零。例1:参与人:甲、乙;行动或策略:猜硬币;结果:都为正面或都为反面甲输给乙1角,如果是一正一反,甲赢乙1角;报酬:一个1角硬币,2、

3、非零和博弈(1)合作博弈(局中人都希望行动或策略保持一致的博弈)例2:参与人:小王、小李;行动或策略:两人约会但都忘记了见面地点;结果:相遇共进晚餐,否则扫兴而归;报酬:共进晚餐每人得到效用100,扫兴而归效用为-20,(2)不合作博弈例3:参与人:邦德、詹妮;行动或策略:坦白或抵赖;结果:一方坦白可释放,另一方抵赖判10年,如果都抵赖各判1年,如果都坦白各判8年;报酬:各自刑期的负数,(二)上策均衡与纳什均衡1、上策均衡:一个有理性的选手在博弈中不会运用下策囚徒困境:在信息不对称的情况下,若邦德认为詹妮会坦白,则邦德会选择坦白,若邦德认为詹妮会抵赖,则邦德还会选择坦白。同理詹妮的最有利的选择

4、也是坦白。坦白是两个人的上策。当不管对方选择什么策略,己方都能以不变应万变,这种博弈成为上策均衡的博弈。上策均衡即指每一个人都有上策可用,而仅仅是用这一策略的状况。(一个均衡解),2、纳什均衡,(1)纳什均衡:如果给定局中人i的策略是Si*,则局中人j的上策是Sj*;如果给定局中人j的策略是Sj*,则局中人i的上策是Si*。(Si*,Sj*)就是纳什均衡。,两个纳什均衡:(A,A)(B,B),(2)在零和博弈中,甲乙两人无绝对的上策,上策的选择取决于对方的选择,不存在纳什均衡。,无均衡解,若策略组合(Si*,Sj*)是上策均衡,则对于i和j而言无论对方选择什么策略(Si*,Sj*)都是上策。若

5、策略组合(Si*,Sj*)是纳什均衡,对于i,当对方选择Sj*时,Si*才是上策;对于j,当对方选择Si*时,Sj*才是上策。上策均衡是纳什均衡的特例。,第一节基本概念 一、博弈论 定义:博弈论是描述、分析多人决策行为的一种决策理论,是多个经济主体在相互影响下的多元决策,决策的均衡结果取决于双方或多方的决策。如下棋,最后的结果就是由下棋双方你来我往轮流做出决策,决策又相互影响、相互作用而得出的结果。,二、参与者(PLAYER)参与博弈的利益主体叫做参与者。英文原意为玩主,也有译成局中人的。在二人博弈中,有两个参与者;在三人博弈中,有三个参与者;在多人博弈中,有多个参与者。,三、策略和策略空间

6、1策略 在给定条件博弈中,参与者完整的一套行动计划叫做策略。例如我国古代著名的谋略故事“田忌赛马”中,国王的赛马计划是:先出上等马,再出中等马,最后出下等马;田忌的赛马计划是:先出下等马,再出上等马,最后出中等马。这里的赛马计划就是一套完整的行动计划,也就是一个策略。,2策略空间 参与者可以选择的策略的全体就组成了策略空间。例如在“田忌赛马”中,共有六种行动方案可供选择:上中下(先出上等马,再出中等马,最后出下等马)、上下中、中上下、中下上、下上中、下中上。决策时田忌可以选择其中任何一个策略,在故事中,因为国王固定选择了上中下,所以田忌选择了下上中,从而赢得了比赛。任何一人策略的改变都将使结果

7、也随之改变,比如国王选择了中下上,而田忌选择了下上中,则国王将赢得比赛。,四、报酬函数与报酬矩阵 1报酬函数 每一个参与博弈的参与者,他的收益依附于各个参与者所出的策略,这种收益与策略的依附关系就构成了报酬函数。也就是说,第i个参与者的收益取决于所有参与者的策略,而不仅仅是自己的策略,表示成数学式子就是:Ri=Ri(S1,S2,Sn)。其中Ri表示第i个参与者的收益,Si(i=1,n)表示第i个参与者所出的策略。,2报酬矩阵 参与博弈的多个参与者的报酬可以用一个矩阵或框图表示,这样的矩阵或框图就叫做报酬矩阵。例如有甲乙两个供货商组成一个价格卡特尔,双方都有选择遵守约定价格或者违反约定价格的权利

8、。报酬矩阵如下图所示:,图 8-1,矩阵中每组数字中的前一个数字表示甲的收益,后一个数字表示乙的收益。当甲守约时,乙如果守约,收益为8,乙如果违约,收益为10;当甲违约时,乙如果守约,收益为6,乙如果违约,收益为7。所以,当甲守约时,乙会选择违约(108);当甲违约时,乙也会选择违约(76)。反之不管乙如何选择,甲都会选择违约,最终的结果是双方都选择违约。报酬矩阵改变,就会影响到双方的决策。例如双方的报酬矩阵变成下图所示:,图 8-2,此时双方可能都选择守约,因为当甲守约时,乙会选择守约(1210);当甲违约时,乙也会选择守约(2-4)。反之不管乙如何选择,甲都会选择守约,最终的结果是双方都选

9、择守约。,博弈过程参与者的决策行为要受到博弈规则的影响,即博弈规则的变化会改变报酬矩阵中的报酬值。比如在图 8-1中,由于卡特尔中的每一个供货商都追求自身利益的最大化,并且没有措施来保证遵守价格约定,表面上可能都信誓旦旦的承诺守约,但是实际中双方会违约。,如果卡特尔追求整体利益的最大化,并且由于历史、政治、制度、惩罚等措施来保证遵守价格约定,双方就可能和平共处,遵守价格约定。在历次中东战争中,由于民族宗教原因,OPEC石油的产量和价格都得到了严格的执行。,五、均衡及博弈的解 当博弈的所有参与者都不想改换策略时所达到的稳定状态叫做均衡,均衡的结果叫做博弈的解。比如图8-1中甲乙两个供货商组成的卡

10、特尔。不管甲如何选择,乙必然选择违约,同样不论乙如何选择,甲必然选择违约。最终双方都选择了违约,并且只要给定的条件不变,双方就都不会改变策略,结果非常稳定,达成均衡。,在这个均衡中,不管甲如何选择,乙都不会改变策略,同样无论乙如何选择,甲也不会改变策略,这种均衡就叫做占优均衡。这种无论对方如何决策,自己总是会选择的策略叫做占优策略,由双方的占优策略所达成的均衡叫做占优均衡。再比如,在学校中,学生平时学习可能是非常努力也可能是非常懒散;老师可能把考试题出的很难,也可能出的很容易。从博弈论的角度,这里的老师和学生就构成了一个博弈,双方的报酬矩阵如下:,图8-3,由于老师出难题比出容易题要花费更多的

11、时间和精力,所以收益较低,从而无论学生平时努力程度如何,老师一定选择出容易的题;由于学生只要努力学习就会取得更好的成绩,所以无论老师所出考题难度如何,学生一定会选择努力学习,这同样构成一个占优均衡。经常遇到的还有一种均衡,是有条件的均衡,叫做纳什均衡。简单的说就是敌变我变、敌不变我亦不变。在后面第二节中将详细介绍纳什均衡。,六、囚犯两难困境(prisoners dilemma)囚犯两难困境是博弈论中一个著名的例子,讲的是甲乙两名嫌疑犯作案后被警察抓住,分别被关在不同的屋子里受审,双方不能互通消息,每名嫌疑犯都面临坦白和不坦白两种选择。警察告诉他们:在两人都坦白的情况下,各判刑10年;在两人都不

12、坦白的情况下,各判刑3年;在一人坦白另一人不坦白的情况下,坦白的一方会被从轻处罚,只被判刑1年,不坦白的一方则被重判15年。可以根据坦白后是否会受到制裁两种情况来讨论最终的均衡结果。,1、坦白后不会受到制裁时的情况 此时,双方收益矩阵如下:,图8-4,如图,在乙不坦白的情况下,如果甲坦白,甲会被从轻处罚,只被判刑1年,乙被重判15年;如果甲也不坦白,由于证据不足,甲乙都只会被判刑3年。在乙坦白的情况下,如果甲也坦白,甲乙会被判刑10年;如果甲不坦白,乙会被从轻处罚,只被判刑1年,甲则被重判15年。可见,在乙不坦白的情况下,甲最好是坦白,从而可以被从轻处罚;在乙坦白的情况下,因为被判刑10年总比

13、15年要好,甲最好也是坦白,所以甲会选择坦白。,同理,无论甲如何选择,乙的最好选择也是坦白。结果双方都选择坦白,都被判刑10年。可见,我国公安机关”坦白从宽,抗拒从严“的心理攻势在大多数情况下都是可以奏效的。囚犯两难困境说明个人的理性可能导致集体结果的不妙。在现实社会中,人人都追求完美反而可能会导致社会变得很糟糕。,2.坦白后会受到制裁时的情况 博弈论的一个重要思想就是规则改变报酬矩阵,改变了报酬矩阵就会影响到行为方式。如果犯罪组织有着严格的惩罚制度,任何一个罪犯坦白后,不论坦白的事情严重与否,犯罪组织一定会杀人灭口,并且总是能迅速做到。这个规则将改变报酬矩阵,新的报酬矩阵如下图所示:,图8-

14、5,由于坦白后将被灭口,所以收益将是-。在乙不坦白的情况下,甲最好是不坦白;在乙坦白的情况下,因为被判刑15年总比死去要好,甲最好也是不坦白,所以甲会选择不坦白。同理,无论甲如何选择,乙的最好选择也是不坦白。结果双方都选择不坦白,各自被判刑3年。,第二节纳什均衡 一、举例 假定A、B两个企业都生产白酒,白酒分为高度和低度两种。报酬矩阵如图所示:,图8-6,对于B企业来说,A企业如果选择了生产高度白酒,那么B企业会选择生产什么呢?因为800 700,所以B企业会选择生产低度白酒。A企业如果选择了生产低度白酒,因为900 600,那么B企业会选择生产高度白酒。对于A企业来说,如果B企业选择了生产高

15、度白酒,因为1000 600,A企业就会选择生产低度白酒。如果B企业选择了生产低度白酒,因为900 800,A企业就会选择生产高度白酒。,这里,A企业的决策取决于B企业的决策,同样B企业的决策取决于A企业的决策。但是A企业选择了生产高度白酒以后,只要不变化,B企业就会选择生产低度白酒不变化。反过来也一样,B企业如果选择了生产高度白酒不变化,A企业就会选择生产低度白酒不变化,这实际上是一个纳什均衡,纳什均衡就是在给定别人最优的情况下,自己最优选择达成的均衡。,通俗的讲,就是给定你的最优选择,我会选择能够使我最优的选择,或者说,我选择在给定你的选择的情况下我的最优选择,你选择了给定我选择情况下你的

16、最优选择。这种均衡最后到底均衡在哪一点,由具体情况决定。在存在帕累托改善的情况下,可能会达到帕累托最优。,在本例中,B企业选择了生产高度白酒,A企业选择生产低度白酒是一种均衡;B企业选择了生产低度白酒,A企业选择生产高度白酒也是一种均衡。由于在B企业选择生产高度白酒,A企业选择生产低度白酒的时候,A、B两企业的收益都比B企业选择生产低度白酒,A企业选择生产高度白酒时的收益要高,存在着帕累托改善,因此最后可能会达到帕累托最优,即B企业选择生产高度白酒,A企业选择生产低度白酒。,1.定义 设有n个参与者(n2),如果第i个参与者选择Si*时比选择Si时的收益都要好或至少不差。换句话讲,就是在别人都

17、没有变化策略的情况下,i如果变化策略,i就要吃亏。这样Si*就是i的最优策略。即给定别人策略,自己选择最优策略。决策做出后,每一个参与者都不会变化,至少是别人不变化,自己就不变化。概言之,纳什均衡指的是:在一个纳什均衡里,任何一个参与者都不会改变自己的策略,如果其他参与者不改变策略,2均衡的确定 在二人博弈中,可以采用画圈法来确定均衡。在给定一方的策略后,把自己的最优策略画上一个圆圈,如果在某一个框中,两个收益值都被画上圆圈的话,此框所表示的决策就是一个均衡。上例中,采用画圈法,会发现存在着两个均衡。,800,900,900,1000,图8-7,3.纳什均衡与占优均衡的比较 占优均衡一定是纳什

18、均衡,纳什均衡不一定是占优均衡。占优均衡比纳什均衡更稳定。因为占优均衡要求任何一个参与者对于其他参与者的任何策略选择来说,其最优策略是惟一的。而纳什均衡只要求任何一个参与者在其他参与者的策略选择给定的条件下,其选择的策略是最优的。也就是说,纳什均衡是有条件下的占优均衡,条件是它的参与者不改变策略。如果其他的参与者改变策略,我就要改变策略。,例如,图8-1的博弈均衡既是占优均衡,同时又是纳什均衡。图8-7中的两组均衡的策略组合,都是纳什均衡,而不是占优均衡,,4无帕累托改进的例子 并不是所有的均衡都会有帕累托改进的机会。如下图所示,有甲乙两辆汽车同时经过一个路口,如果两车都不采取措施的话,将会发

19、生碰撞,这时每辆车面临着继续开和等待两个选择。如果两个都选择继续开的话,就会相撞,收益都为-10。如果甲选择继续开而乙选择等待,甲收益为1,乙收益为0。,反过来,如果乙选择继续开而甲选择等待,乙收益为1,甲收益为0。如果两车都选择等待,甲乙收益都为-1。这时的均衡有两个,如果甲选择继续开,乙就会选择等待;如果乙选择继续开,甲就会选择等待。双方的收益矩阵如下图所示:,最终均衡在哪一种情况,取决于交通规则。,图8-8,二、无纳什均衡的例子 实际上,纳什均衡也是一种特殊情况,并不是所有的博弈都会产生纳什均衡。例如:在足球比赛中,罚点球的时候,守门员和罚球者也构成一个博弈,双方的收益矩阵如下图所示:,

20、图8-9,假设罚球者罚球时可以选择三个方向:左中右;守门员也可选择三个方向扑球,左中右。当罚球者选择了左的情况下,如果守门员也选择了左,罚球者将得-1,守门员将得+1;如果守门员选择了右或者中,罚球者将得+1,守门员将得-1。当罚球者选择了中的情况下,如果守门员也选择了中,罚球者将得-1,守门员将得+1;如果守门员选择了右或者左,罚球者将得+1,守门员将得-1。,当罚球者选择了右的情况下,如果守门员也选择了右,罚球者将得-1,守门员将得+1;如果守门员选择了左或者中,罚球者将得+1,守门员将得-1。当判断罚球者将向左罚球的时候,守门员一定选择左;当判断罚球者将向中罚球的时候,守门员一定选择中;当判断罚球者将向右罚球的时候,守门员一定选择右。,同样,当罚球者判断守门员将向右扑球时,罚球者将向左或中发球;当罚球者判断守门员将向右扑球时,罚球者将向右或中发球;当罚球者判断守门员将向中扑球时,罚球者将向左或右发球。此时没有均衡存在,双方都只能靠运气。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号