《管理经济学5第五讲博弈论ppt课件.ppt》由会员分享,可在线阅读,更多相关《管理经济学5第五讲博弈论ppt课件.ppt(57页珍藏版)》请在三一办公上搜索。
1、博弈论,(一)基本概念(二)纳什均衡及其判断方法(三)从静态博弈到动态博弈(四)从完全信息博弈到不完全信息博弈,(一)基本概念,参与人(players): 决策的个体,其目标都是自身效用的最大化行动(actions)与策略(strategies) 行动:某个参与人所能做的某一选择,它所能做的全部行动的集合称为行动集。一个行动组合(action profile)是一个由博弈中的n个参与人每人选取一个行动所组成的一个集; 策略:是决定参与人在博弈中每一个不同情况下如何选择行动的规则(策略集、策略组合),(一)基本概念,支付(payoffs) 第i个人的支付表示在所有的参与人和自然都选择了各自行动且
2、博弈已经完成后,他所获得的效用 支付矩阵,(一)基本概念,结果(outcome)与均衡(equilibrium) 结果:是指在博弈结束后,建模者从行动、支付和其他变量的取值中所挑选出来的他所感兴趣的要素的集合 均衡:指由博弈中的n个参与人每人选取的最佳策略所组成的一个策略组合,(一)基本概念,以囚徒困境为例,(二)纳什均衡及其判断方法,常见的均衡概念有三种: 优势策略均衡 (dominant strategy equilibrium) 重复剔除优势均衡 (iterated dominance equilibrium ) 纳什均衡 (Nash equilibrium ),(二)纳什均衡及其判断方
3、法,优势策略均衡 如果无论其他参与人选择什么策略,某个策略都是参与人i 的强最佳应对,那么该策略就是参与人i 的优势策略,每个人参与人的优势策略的组合就是优势策略均衡,(二)纳什均衡及其判断方法,(二)纳什均衡及其判断方法,弱优势策略均衡 剔除了每个参与人的全部弱劣势策略(可以一样好,绝不会更好)所得到的一个策略组合。重复剔除优势均衡 剔除了某一参与人的弱劣势策略,再重新考察各个参与人剩下的策略中那些是弱劣的并剔除,最终得到的策略组合。,(二)纳什均衡及其判断方法,弱优势策略均衡,(二)纳什均衡及其判断方法,俾斯麦海之战 1943年,日本海军上将木村受命将日本陆军运抵新几内亚,其间必须穿越俾斯
4、麦海,美国海军上将肯尼计划进行轰炸。 穿越俾斯麦海有两条路线:较短的北线和较长的南线,木村需要从中选择一条,肯尼也需要决定如何派飞机,如果选错了,轰炸天数就会减少。,(二)纳什均衡及其判断方法,重复剔除优势均衡,(二)纳什均衡及其判断方法,纳什均衡 在一个策略组合中,在其他参与人都不会改变已有策略的条件下,如果没有参与人有改变自己策略的激励,则称此种策略组合为纳什均衡,(二)纳什均衡及其判断方法,智猪博弈,(二)纳什均衡及其判断方法,判断的方法可以有两种 劣势策略消去法 相对优势策略划线法,(二)纳什均衡及其判断方法,(二)纳什均衡及其判断方法,相对优势策略划线法,(二)纳什均衡及其判断方法,
5、纳什均衡是谁都没有激励去改变现状,改变就会不如现在(严格纳什均衡)或者至少不会比现在好,它是一个稳定的结果。,(二)纳什均衡及其判断方法,(二)纳什均衡及其判断方法,(二)纳什均衡及其判断方法,监督博弈 税收机关的纯策略是检查或不检查 纳税人的纯策略是逃税或不逃税 a:应纳税款 C:检查成本 F:罚款 假定Ca+F,(二)纳什均衡及其判断方法,(二)纳什均衡及其判断方法,(二)纳什均衡及其判断方法,类似可得到:,阿根廷作家奥斯瓦尔多索利亚诺的一部短篇小说世界上耗时最长的点球:一场在阿根廷乡间举办的足球比赛在终场前几秒钟不得不停止,因为一位偏心的裁判刚刚因为判罚了一个点球而被愤怒的球员一脚踢了出
6、去。联赛法庭判决这场比赛的最后二十秒钟事实上就是那个点球将在下周日重新进行。这样每个人都有一周的时间准备那个点球。,在罚点球前几天的晚餐上,需要扑救点球的守门员加托迪亚兹思考主罚的那位球员会怎么做:“康斯坦总是朝右边踢。”“不错,一直如此。”俱乐部主席说。“但是他知道我知道这个。”“那样的话我们就要丢球了。”“没错,不过我知道他知道我知道。”加托又说。“那你就准备好朝右边扑救。”餐桌上有一个人插嘴说。“不,他知道我知道他知道的。”加托迪亚兹说,他离开餐桌,躺在床上开始了无尽的思考。,(二)纳什均衡及其判断方法,石头、剪刀、布游戏 赢者得1、输者-1、平局得0,(二)纳什均衡及其判断方法,如果允
7、许混合策略,每个有限博弈都有至少一个纳什均衡在n人策略式博弈中,如果每个参与人的纯策略空间Si是欧式空间上的一个非空的、闭的、有界的凸集,支付函数ui(s)是连续的且对si是拟凹的,那么存在一个纯策略纳什均衡,(二)纳什均衡及其判断方法,一个博弈的纳什均衡不一定只有一个,可能有两个,也可能更多,(二)纳什均衡及其判断方法,情侣博弈,(二)纳什均衡及其判断方法,如果出现两个以上的均衡应该如何选择,(二)纳什均衡及其判断方法,(二)纳什均衡及其判断方法,路径依赖问题,(二)纳什均衡及其判断方法,(二)纳什均衡及其判断方法,(二)纳什均衡及其判断方法,对每一个参与者而言,对不同的均衡结果是有不同的偏
8、好的,不同的结果有时取决于不同的路径,所以为获得自己想要的结果,要想办法使对方相信,某些路径你是决不会采取的,以将此种路径排除。 破釜沉舟,(二)纳什均衡及其判断方法,练习 情侣博弈,如果男方处心积虑要和女方在一起,而女方想方设法躲避他 a构造一个博弈矩阵反映上述情况; b是否存在纳什均衡,(二)纳什均衡及其判断方法,如果A国有两个师的兵力而B国有三个师的兵力,任务是攻克B国一座城市。规则是:双方兵力只能整师调动,通往城市道路只有甲乙两条,如果A攻击时,兵力超过对方就获胜,相等或少就失败。A国的策略是什么,(三)从静态博弈到动态博弈,静态博弈是指双方同时决策,或者在决策时不知道对方决策的结果动
9、态博弈是指一方先决策,另一方后决策,(三)从静态博弈到动态博弈,先发优势与后发优势,(三)从静态博弈到动态博弈,(三)从静态博弈到动态博弈,到后推理的基本思想 防鲨网的突破 避免恶意收购的防鲨网:董事会共有5位成员,按目前选举办法,一年只能更换一位。要改变选举程序,可以提交建议,按规定,投票以顺时针次序沿着董事会圆桌进行,一份提议必须获得50%以上支持(缺席算反对),且任何人若是提交一份建议而未获得通过,他及其赞同者都将失去自己的董事席位和股份,由其他人平分,(三)从静态博弈到动态博弈,A先生成为新董事,他提出提议,内容是: 如果该提议全票5通过,A可以选择一个全新的董事会,其余董事可获得不多
10、的补偿 如果4:1通过,投反对票的董事就要离开,没有任何补偿 如果3:2通过,A将会把他的51%股份平分给另两位投赞成票的董事,投反对票的董事就要离开,没有任何补偿,(三)从静态博弈到动态博弈,强盗分金 有5个强盗掘出了100块金币。经协商,分配金币的规则为:老大先提出分配方案,经5人表决,如多数人同意,方案就被通过,否则老大将被扔入大海喂鲨鱼。如果老大被扔入大海,则由老二提出分配方案,如多数人同意方案就被通过,否则老二也要被扔入大海。以下类推。金币会怎样分配,(三)从静态博弈到动态博弈,博弈的扩展式表述,A,开发,不开发,N,N,大0.5,小0.5,大0.5,小0.5,B,B,B,B,(4,
11、4),(8,0),开发,(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),开发,开发,开发,不开发,不开发,不开发,不开发,(三)从静态博弈到动态博弈,节(node)枝(branches)信息集(information set),(三)从静态博弈到动态博弈,A,开发,不开发,N,N,大0.5,小0.5,大0.5,小0.5,B,B,B,B,(4,4),(8,0),开发,(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),开发,开发,开发,不开发,不开发,不开发,不开发,(三)从静态博弈到动态博弈,A,开发,不开发,N,N,大0.5,小0.5,大0
12、.5,小0.5,B,B,B,B,(4,4),(8,0),开发,(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),开发,开发,开发,不开发,不开发,不开发,不开发,(三)从静态博弈到动态博弈,如果已知需求小,A,开发,不开发,B,B,开发,(-3,-3),(1,0),(0,1),(0,0),开发,不开发,不开发,(三)从静态博弈到动态博弈,(三)从静态博弈到动态博弈,子博弈精炼纳什均衡,A,开发,不开发,B,B,开发,(-3,-3),(1,0),(0,1),(0,0),开发,不开发,不开发,(三)从静态博弈到动态博弈,子博弈精炼纳什均衡 1)是原博弈的纳什均衡 2)是每
13、一个子博弈上的纳什均衡剔除不可置信的威胁,(四)从完全信息博弈到不完全信息博弈,共同知识(common knowledge) 如果某一信息是所有参与人都知道的 如果每个参与人都知道所有参与人知道这一信息 如果每个参与人都知道所有参与人都知道所有参与人知道这一信息 如此这般以至无穷 这一信息就成为共同知识,(四)从完全信息博弈到不完全信息博弈,完全信息 每个参与人特征、策略空间、支付函数都是共同知识不完全信息,(四)从完全信息博弈到不完全信息博弈,海萨尼转换(Harsanyi transformation) 引入虚拟参与人“自然”,“自然”首先行动决定参与人某些信息贝叶斯纳什均衡,买方向卖方发出信号求购某物品,物品的价值为100;买方开价为p,如果卖方同意,买方得到100-p,卖方得到p,如果卖方不同意,两者所得均为0,买方向卖方发出信号求购某物品,物品的价值为100;买方开价为p,如果卖方同意,买方得到100-p,卖方得到p,如果卖方不同意,可以提出自己的价格x(此时物品价值60)如果买方同意,买方得到60-x,卖方得到x,如果买方不同意,都是0,