《解释现实中的纳什均衡现象.ppt》由会员分享,可在线阅读,更多相关《解释现实中的纳什均衡现象.ppt(36页珍藏版)》请在三一办公上搜索。
1、解释现实中的纳什均衡,To Explain Nash Equilibrium In Reality,汇报人:胡春韩发丽郭超周欣 2017/04/11,纯策略纳什均衡,基本理论案例思考,混合策略纳什均衡,基本扑克猜色案例,完全且完美信息动态博弈,概念 逆向归纳法 国际贸易中的博弈,子博弈精炼纳什均衡,案例定义讨论,01,02,03,04,/目录,CONTENTS,一、完全信息静态博弈,二、完全信息动态博弈,纯策略纳什均衡,1,Part,基本理论 案例 思考,汇报人:胡春 2017/04/11,纳什均衡,Nash:一个数学天才,1950年在22岁获得数学哲学博士学位,诺贝尔经济学奖得主,电影Bea
2、utiful Mind 主人翁纳什均衡:在完全信息静态博弈中各方都实现个利益最大化的策略组合状态纯策略:假定每个参加者每次只选择一个策略进行博弈,占优策略,占优策略:不论对方采取何种策略时,某一策略均为最优策略,则此策略为占优策略。,企业1价格不变:10-30,企业2应当选择“价格不变”企业1涨价:3025,企业2应当选择“价格不变”结论:“价格不变”是企业2的占优策略,企业1在决策时必须以此为前提,A、B企业广告博弈的损益矩阵,观察A:不管B如何选择,做广告都是最优的B:不管A如何选择,做广告都是最优的,A、B企业广告博弈的损益矩阵,观察A&B 的占优策略都是做广告不理会对手的策略均有占优策
3、略均衡,没有占优策略的博弈,观察A:没有占优策略,取决于B的选择B:做广告问题A的最佳选择是什么?,占优策略和纳什均衡,NASH均衡:我所做的是给定你所做的我所能做的最好的你所做的是给定我所做的你所能做的最好的,占优策略“我做我所能做最好的,不管你做什么”“你做你所能做最好的,不管我做什么”,为什么在城市中心道路上禁止汽 车鸣喇叭?,观察A缓行:98,司机B抢行A抢行:21,司机B抢行结论:抢行是B的占优策略B缓行:98,司机A抢行B抢行:21,司机A抢行结论:抢行是A的占优策略,对纳什均衡的思考,思考自从古典经济学家亚当 斯密提出西方经济学的基本前提“经济人”,特别是经新古典经济学家的精确论
4、述,将“经济人”作为整个西方经济学的逻辑起点之后,经济学家几乎用了一个世纪来证明斯密的核心理论,但是这种对于逻辑起点的证明至今没有完成大部分经济学家只能认为这是一个不证自明的公理前提;有的经济学家更认为,西方“经济人”的合理性是上帝给予的这一切表明纳什均衡理论的基础有其不扎实的一面。因为现实中的决策者常常并不只考虑最大限度地获得经济利益,有时候为了公平等方面的要求,会放弃部分或者全部经济利益。,混合策略纳什均衡,2,Part,基本介绍 扑克猜色游戏 案例,汇报人:韩发丽 2017/04/11,有些博弈不存在(纯策略的)纳什均衡谁单独改变策略都不会得到进一步的好处如果允许混合策略,那么每个有限同
5、时博弈都有纳什均衡,基本介绍,参与人1:max Eu=q(p(-1)+(1-p)1)+(1-q)(p1+(1-p)(-1)=-pq+q-pq+p-pq-1+q+p-pq=-4pq+2q+2p-1一阶条件为零求得:p=1/2,扑克猜色游戏,当2出红色的概率q1/2,1出黑色的概率为1,因为他出红色得到的预期收益大于他出黑色;当2出红色的概率q1/2,1出红色的概率为0,因为他出黑色的期望收益大于他出红色。,扑克猜色游戏,参与人1,参与人2,给定参与人1(q,1-q),参与人2的支付是:q+(-1)(1-q)(红色)=(-1)q+(1-q)(黑色);,给定参与人2(p,1-p),参与人1的支付为:
6、p(-1)+(1-p)(红色)=p+(-1)(1-p)(黑色);,求得(1/2,1/2)是纳什混合战略均衡,扑克猜色游戏,F上级奖励反腐部门反腐部门的查处部门R不腐败官员收益K腐败官员被查处惩罚A腐败收益P腐败官员所耗时间、精力W0官员现工资W1退休工资,案例:腐败治理,收益分析,结果解释,完全且完美信息动态博弈,3,Part,概念 逆向归纳法 国际贸易中的博弈,汇报人:郭超 2017/04/11,完全且完美信息的动态博弈,动态博弈:参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此做出相应的选择。完全信息的博弈:参与者的收益函数是共同知识的博弈。完全且完美信息的动态博弈
7、:博弈进行的每一步当中,要选择行动的参与者都知道这一步之前博弈进行的整个过程。,完全且完美信息的动态博弈描述,参与者1从可行集A1中选择一个行动a1,参与者2观察到a1之后,从可行集A2中选择一个行动a2,两人的收益分别为u1(a1,a2)和u2(a1,a2),完全且完美信息的动态博弈特点,逆向归纳法,当在博弈的第二个阶段参与者2行动时,由于其前参与者1已选择行动a1,他面临的决策问题可以表示为:假定对A1中的每一个a1,参与者2的最优化问题只有惟一解,用R2(a1)表示,这就是参与者2对参与者1的行动的反应(或最优反应)。,逆向归纳法,由于参考者1能够和参与者2一样解出2的问题,参与者1可以
8、预测到参与者2对1每一个可能行动a1所做出的反应,这样1在第一阶段要解决的问题可以归结为:假定参与者1的最优化问题同样有惟一解,表示为a1*,我们称(a1*,R2(a1*))是这一博弈的逆向归纳解。,逆向归纳法,国际贸易中的博弈,2001年中国加入了世界贸易组织。国际贸易中倾销是指在正常贸易中一国向另一国出口的某一产品价格低于其正常价值的价格。倾销对市场的破坏作用,各国便采取针对措施即反倾销来限制倾销。倾销商往往不愿就这样失去在进口国的利益,势必又会产生反倾销的新的对策规避。例如转移生产、变成品输出为零件输出、改变产品型号等。为避免反倾销措施的失败,保护本国利益,捍卫法制的尊严,各个国家纷纷针
9、对规避行为制定了反规避措施。,国际贸易中的博弈,国际贸易中的博弈,维护公平竞争的贸易秩序,为维护我国产业的经济安全发挥了重要作用,使受损害的产业得以较快康复和进行产业结构调整,遏制了国外对我国滥用反倾销措施和歧视性待遇,反倾销的意义,子博弈精炼纳什均衡,4,Part,案例 定义 讨论,汇报人:周欣 2017/04/11,案例扩展式,参与者1,参与者2,L,R,L,R,31,12,L,R,参与者2,21,00,战略:参与者的一个战略是关于行动的一个完整的计划,明确了可能遇到的每一种情况下对可行行动的选择。,参与者1战略,L,R,L,R,L,R,参与者2战略,L,R,L,R,案例扩展式,子博弈精炼纳什均衡,逆向归纳纳什均衡:(R,(R,L),解:解是对期望将要发生的情况给出相应的行动及结果均衡:均衡是战略集合(战略又是关于行动的完全的计划),逆向归纳解:(R,L),子博弈精炼纳什均衡,子博弈精炼纳什均衡,定义(赛尔滕,1965):如果参与者的战略在每一个子博弈中都构成了纳什均衡,则称纳什均衡是子博弈精炼的。,任何有限的完全信息动态博弈都存在子博弈精炼纳什均衡。,子博弈精炼纳什均衡定义,讨论案例标准式,纯战略纳什均衡:(R,(R,L);(L,(R,R),讨论案例标准式,纯战略纳什均衡:(R,(R,L);(L,(R,R),子博弈精炼纳什均衡:(R,(R,L),排除不可置信威胁,