《经济博弈论-02-完全信息静态博弈(Park)课件.ppt》由会员分享,可在线阅读,更多相关《经济博弈论-02-完全信息静态博弈(Park)课件.ppt(34页珍藏版)》请在三一办公上搜索。
1、2023/4/3,1,第二章 完全信息静态博弈,分析思路 纳什均衡 混合策略和混合策略纳什均衡*纳什均衡的存在性*纳什均衡的选择和存在性,2023/4/3,2,楔子,本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。,2023/4/3,3,2.1 基本分析思路和方法,一、上策均衡上策(dominate str.):不管其它博弈方选择什么策略,一博弈方的
2、某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略ui(Si*,S-i)ui(Si,S-i)上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方的上策,则称为上策均衡。*上策均衡必然是该博弈比较稳定的结果上策均衡不是普遍存在的,2023/4/3,4,2.1 Cont.,-5,-5,0,-8,-8,0,-1,-1,坦白,不坦白,坦白,不坦白,Payoff,妻(囚徒 2),夫(囚徒1),2023/4/3,5,2.1 Cont.,二、下策均衡严格下策(dominate str.):不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略,ui(
3、Si,S-i),ui(Si*,S-i),分别称为弱下策、严格下策严格下策反复消去,1,0,1,3,0,4,0,2,L,M,U,D,Payoff,Player 2,Player 1,0,1,2,0,R,2023/4/3,6,2.1 Cont.,寻找均衡的技术技巧划线法,2023/4/3,7,2.1 Cont.,寻找均衡的技术技巧箭头法,1,0,1,3,0,1,0,4,0,2,2,0,2023/4/3,8,2.2 纳什均衡,一、纳什均衡的定义 博弈方:1,n;表示有n个博弈方 策略空间:S1,.,Si,Sn,博弈方 i 的第 j 个策略 Sij Si 博弈方 i 的得益:ui 博弈:G=S1,.S
4、n;u1,.un 纳什均衡:在博弈 G=S1,.Sn;u1,.un中,如果由各个博弈方的各一个策略组成的某个策略组合 S1*,.Sn*中,任一博弈方 i 的策略 Si*,都是对其余博弈方策略的组合 S1*,.Si-1*,Si+1*,Sn*的最佳对策,也即对任意 ui(S1*,.Si-1*,Si*,Si+1*,.Sn*)ui(S1,.Si-1*,Sij,Si+1*,Sn*)都成立,则称 S1*,.Sn*为G的一个纳什均衡,2023/4/3,9,Cont.,二、纳什均衡的一致预测性质一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致
5、的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能,2023/4/3,10,Cont,三、纳什均衡与严格下策反复消去法 上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡 命题1:在n个博弈方的博弈 G=S1,.Sn;u1,.un中,如果严格下策反复消去法排除了除 S1*,.Sn*之外的所有策略组合,那么 S1*,.Sn*一定是该博弈的唯一的纳什均衡 命题2:在n个博弈方的博弈中 G=S1,.Sn;u1,.un中,如果 S1*,.Sn*
6、是G的一个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的,2023/4/3,11,Cont,证明:纳什均衡与严格下策反复消去法(反证法)命题1:如果 消去所有后余下的Si*,S-i*不是纳什均衡 不是纳什均衡,一定存在那么Si,S-i*,使得Si*,S-i*Si,S-i Si*,S-i*inSi*,S-i,Si,S-i*in Si,S-i 所以,Si*,S-i*Si,S-i*命题2:如果纳什均衡Si*,S-i*被严格下策反复消去;那么必然存在一个Si,使得Si,S-i Si*,S-i进而,Si,S-i*Si*,S
7、-i*与纳什均衡的定义,矛盾,2023/4/3,12,2.3 无限策略分析和反应函数,古诺的寡头模型Player:厂商1,2Strategy:q1,q2Payoff:P=8-(q1+q2),c1=c2=2;u1=6q1-q1q2-q12,u2=6q2-q1q2-q22,How to find the equilibrium?,(3,0),(6,0),(0,3),(0,6),古诺模型的反应函数图示,R1(q2),R2(q1),q1,q2,2023/4/3,13,Cont。,伯特兰德寡头模型模型Player:厂商1,2Strategy:0,p1max,0,p2maxPayoff:q1(p1,p2)
8、=28-p1-0.5p2,q2(p1,p2)=28-p2-0.5p1,c1=c2=2;u1=(p1-2)(28-p1-0.5p2);u2=(p2-2)(28-p2-0.5p1);Howe to find the equilibrium?,maxu1=max(p1-2)(28-p1-0.5p2);maxu2=max(p2-2)(28-p2-0.5p1);,p1p2,p1*=0.5(30-0.5p2*);p2*=0.5(30-0.5p1*);p1*=p2*=20,2023/4/3,14,Cont。,公共草地养羊问题Player:3个农户Strategy:0,q1,max,0,qn,max,Q=q1
9、+q2+q3Payoff:ui=qi100-(q1+q2+q3);-qic;Howe to find the equilibrium?,maxu1=maxq1100-(q1+q2+q3);q1c;maxu2=maxq2100-(q1+q2+q3);q2c;maxu3=maxq3100-(q1+q2+q3);q3c;,q1q2 q3,q1*=q2*=q3*=24,u1*=u2*=u3*=576,如果总体来看,maxQ100-Q Qc;Q*=48,u=2304公共资源的悲剧!,2023/4/3,15,Cont.,反应函数的问题和局限性有此博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导
10、函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。,2023/4/3,16,2.4 混合策略和混合策略纳什均衡,一、猜硬币博弈,(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念,-1,1,1,-1,1,-1,-1,1,正面,反面,正面,反面,猜硬币方,盖硬币方,2023/4/3,17,Cont.,二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G=S1,.
11、Sn;u1,.un 中,博弈方 i 的策略空间 Si1,.Sik,则博弈方 i 以概率分布pi1,.pik随机在其k个可选策略中选择的“策略”,称为一个“混合策略”,其中0 pij 1,对 1 j k,都成立,pi1+.pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。,2023/4/3,18,Cont.,三、一个例子 该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析,I 的混合策略(p):3p+1(1-p)=2p+5(1-p)II的混合策略(q):2q+5(1-
12、q)=3q+1(1-q)u1=p2q+5(1-q)+(1-p)3q+1(1-q)=2.6u2=q3p+1(1-p)+(1-q)2p+5(1-p)=2.6,2,3,5,2,3,1,1,5,C(q),D(1-q),A(p),B(1-p),Payoff,Player 2,Player 1,2023/4/3,19,Cont.,博弈方2选C的收益(p混)3p+1(1-p)=1+2p博弈方2选D的收益(p混)2p+5(1-p)=5-3p博弈方1选A的收益(q混)2q+5(1-q)=5-3q博弈方1选B的收益(q混):3q+1(1-q)=1+2q,0,p=1,u2(C),u2(D),0,p=1,q=1,0.
13、8,0.8,0,q=1,u1(B),u1(A),0.8,2023/4/3,20,五、小偷和守卫的博弈,加重对首位的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概略,0,-D,-D,守卫得益(睡),S,p=1,小偷p混合下,守卫的得益睡时:-Dp+S(1-p)不睡时:0*p+0*(1-p),守卫睡觉时的得益,p*,守卫不睡觉时的得益,2023/4/3,21,Cont.,0,-P,守卫得益(睡),V,q=1,守卫q混合下,小偷的得益偷:Vq-P(1-q)=-P+(V+P)q不偷:0*q+0*(1-q)=0,偷时的得益,q*,不偷的得益,加重对小偷的处罚:短期内能
14、抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒,2023/4/3,22,Cont.,多重均衡博弈和混合策略夫妻之争的混合策略纳什均衡,妻子的p混合策略使:1p+0(1-p)=0p+3(1-p)丈夫的q混合策略使:2q+0(1-q)=0q+1(1-q),夫妻之争博弈的混合策略纳什均衡 策略 得益博弈方1(3/4,1/4)0.67博弈方2(1/3,2/3)0.75,2023/4/3,23,Cont.,夫妻之争丈夫选时装的得益(p混):p-0(1-p)=p丈夫选足球的得益(p混):0p+3(1-p)=3-3p妻子选时装的得益(q混):2q+0(1-q)=2q妻子选足球的得益(q混):
15、0q+1(1-q)=1-q,0,p=1,u2(球),u2(时),0,p=1,q=1,3/4,3/4,0,q=1,u1(时),u1(球),1/3,R2,R1,1/3,3,1,2023/4/3,24,Cont.,制式问题,1,3,0,0,0,0,2,2,A(q),B(1-q),A(p),B(1-p),厂商1,厂商2,payoff,厂商A的p混合策略使:3p+0(1-p)=0p+2(1-p)厂商B的q混合策略使:1q+0(1-q)=0q+2(1-q),制式问题的混合策略纳什均衡 策略 得益厂商1(0.4,0.6)0.67厂商2(0.67,0.33)0.75,2023/4/3,25,Cont.,三、混
16、合策略和严格下策反复消去法包括混合策略时,严格下策反复消去法依然成立(左)博弈不存在纯策略严格下策,如果I使用p混合策略,如(.5,.5,0),2023/4/3,26,重新思考“夫妻之争”,夫妻约会:但电话断了!能遇见么妻子根据对“丈夫”的判断,q,考虑决定:u1时装=2q+0(1-q)=2qu1足球=0q+1(1-q)=1-q如果判断q大,2q 1-q,or,q 1/3 妻子最好直接去时装!问题:混合策略的得益小:双方预期得益0.67,0.75均小于两个纳什均衡遇不到的概率:1/3*1/4+2/3*3/4=7/12,2023/4/3,27,2.5 纳什均衡的存在性(略),2023/4/3,2
17、8,2.6 纳什均衡的选择和分析方法扩展(选),2.6.1 多重纳什均衡博弈的分析2.6.2 共谋和防共谋均衡核心是均衡的精炼问题!,2023/4/3,29,Cont.,多重纳什均衡博弈的分析一、帕累托上策均衡(鹰鸽博弈)这个博弈中有两个纯策略纳什均衡,(战争,战争)和(和平,和平),显然后者帕累托优于前者,所以,(和平,和平)是本博弈的一个帕累托上策均衡。,-5,-5,-10,8,8,-10,10,10,战争,和平,国家2,战争,和平,国家1,战争与和平,2023/4/3,30,Cont.,二、风险上策均衡考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考
18、虑:风险上策均衡。下面就是两个例子。,9,9,8,0,0,8,7,7,L,R,博弈方2,U,D,博弈方1,风险上策均衡(D,R),5,5,3,0,0,3,3,3,鹿,兔子,猎人2,鹿,兔子,猎人1,猎鹿博弈风险上策均衡(兔子,兔子),4.5,7.5,4.5,7.5,2.5,3,2.5,3,2023/4/3,31,Cont.,三、聚点均衡利用博弈设定以外的信息和依据选择的均衡文化、习惯或者其他各种特征都可能是聚点均衡的依据城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子,2023/4/3,32,四、相关均衡(略),三个纳什均衡:(U,L)、(D,R)和混合策略均衡(1/2
19、,1/2),(1/2,1/2)结果都不理想,不如(D,L)。,可利用聚点均衡(天气,抛硬币),但仍不理想。,相关装置:1、各1/3概率A、B、C2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。,相关均衡要点:1、构成纳什均衡2、有人忽略不造成问题,2023/4/3,33,Cont.共谋和防共谋均衡,一、多人博弈中的共谋问题本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B)前者帕累托优于后者。博弈的结果会是什么呢?(U,L,A)有共谋(Coalition)问题:博弈方1和2同时偏离。,2023/4/3,34,二、防共谋均衡,如果一个博弈的某个策略组合满足下列要求:(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。称为“防共谋均衡”。前面例子中:(D,R,B)是防共谋均衡(U,L,A)不是防共谋均衡,