博弈论第四章.docx

上传人:牧羊曲112 文档编号:5077378 上传时间:2023-06-02 格式:DOCX 页数:38 大小:570.15KB
返回 下载 相关 举报
博弈论第四章.docx_第1页
第1页 / 共38页
博弈论第四章.docx_第2页
第2页 / 共38页
博弈论第四章.docx_第3页
第3页 / 共38页
博弈论第四章.docx_第4页
第4页 / 共38页
博弈论第四章.docx_第5页
第5页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《博弈论第四章.docx》由会员分享,可在线阅读,更多相关《博弈论第四章.docx(38页珍藏版)》请在三一办公上搜索。

1、4非完全信息动态博弈4.1精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。参与人2不知道t,但知道t的概率分布。博弈的时序:(1)参与人1选择行动ai eAj(2)参与人2观察a选择a2 eA2博弈的收益:u1(a? a2, t), u2(aa2, t)Nuuuuuuuu11111111uuuuuuuu22222222标准式表示参与人2LRL2,10,0参与人1 M0,20,1R1,31,3纯战略纳什均衡:L,L), R R ) 均为子博弈精炼纳什均衡任子博弈)。但是(R, R)不可信。排除不可信的纳什均衡:要求1参与人必须有一个推断(belief).要求2参与者的战略

2、必须满足序贯理性(sequentially rational).定义:处于均衡路径上(on the equilibrium path)的信息集:在均衡战略下,博弈以正的概率到达该集要求3在处于均衡路径上的信息集上推断由贝叶斯法则和参 与人的均衡战略决定。例要求3的说明参与人1的类型空间:t,t,t,t ,1234行动空间:A= L,R推断p.:观察到L后,参与人1的类型是t.的概率。推断.:观察到R后,参与人1的类型是t.的概率。P1 + P 2 + P 3 + P 4 = 191+q 2+%+ 1N如果参与人1的战略:t1选L, t2选L,t3选R, t4选R。参与人2对p.与q,的推断:P

3、1 = = 0.4, p2 = = 0.6, p3= 0,p4=0;0.2 + 0.30.2 + 0.3qi = 0,q 2= 0,q3= = 0.4,q 履0.3 = 0.6,0.2 + 0.30.2 + 0.3例3个参与人的博弈。1321子博弈精炼纳什均衡:(D, L, R,)另有战略(A, L, )和推断p = 0:-纳什均衡满足要求1-3.是均衡?定义 处于均衡路径之外(off the equilibrium path)的信息集: 在均衡战略下,博弈不会到达此集要求4在处于均衡路径之外的信息集上 可能情况下,推断由 贝叶斯法则和参与人的均衡战略决定。原文: At information

4、 sets off the equilibrium path, beliefs are determined by Bayes rule and the players equilibrium strategies where possible.精炼贝叶斯均衡(perfect Bayesian equilibrium)在一个非完全信 息的动态博弈中,满足要求1 - 4的战略与推断构成的均衡。例要求4中“不可能”的情形。如果A, Ar9 L)是均衡,则参与人3的战略要针对参与人2的L 或R。参与人3的推断必须是p = qNi + q2)但是参与人2选A: q1+q2= 0,因此无法计算p。4.2

5、信号博弈4.2.A信号博弈中的精炼贝叶斯均衡信号博弈的参与人:信号发送者,接收者R。博弈的时间顺序:自然按照概率分布为S产生一个t g TiS观察t,并选择m,gMR观察m并选择a gAk收益 Us(t,m,,ak)和 UR(fj,m,,ak)信号博弈的例T = t1, t2, M = m 1, m 2, A = a1, a2, Prt1 = p, Prt2 = 1 - p。,102发送者战略:在类型为匕时发出的信号与匕时发出的信号:m 1, m 1,伽 1, m2, m 2 m 1, m 2, m2混同(pooling)战略:所有的类型发出相同的信号:m 1, m 1, m 2, m2分离(

6、separating)战略:不同的类型发出不同的信号:m 1, m 2, m 2, m1接收者战略:在收到信号欣1时与信号m2时选择的行动: a 1, a1, a1, a 2, a, a1, a 2, a2信号要求1:接收者在观察信号m.后,必须对发送m.的类型有 jj一个推断E 屹 Im) = 1t. wT信号要求2R:对每一 m,接收者的行动a*(m)必须在给定推 jj断Mt I mJ后,最大化他的期望效甩max 贝切mJ UR(ti,十ak A 七 wT信号要求2S:对每一 t,在给定a*(m)后,发送者的信号m*(t)必须最大化他的效用U&, mj9 a*(mj)maxm jw M信号

7、要求3:对每一 mj,如果存在使得m*(t,) = mj,则接收者的推断:1其中的求和为7):发送mj的所有电精炼贝叶斯均衡:战略(m*(t), a*(mj)和推断Mpmj满足信号 要求(1), (2R), (2S)和 。为什么没有要求4?例 T = 匕,如 t3,匕, M = m f m 2, m 3如果在均衡中,发送者的战略:m*(q) = m,m*(t2) = m,m*(t3) = m2,m*(t4) = m则m3处于均衡路径以外13242若用贝叶斯公式,分母为0。,102例(Figure 4.2.2)求精炼贝叶斯均衡:对4种情况逐一分析。1.混同于L?发送者:(L, L).如果为均衡,

8、p = 0.5接收者收益分别为:3.5(a), 或 0.5(d)。将选择u。发送者发送L的收益分别为:1 (f) 2 (t)如果发送者发送R,当q + (1 - q )x0 qx0 + (1 - q)x2q 2/3接收者将选择d.发送者收益为0印利1(t2),小于发送L时分别 所得。均衡: (L, L), (u, d),p = 0.5, q w*(H) - cL, e*(H)wWLeLeH *在有冒充的情形,即w*(H) - cL, e*(H) w*(L) - cL, e*(L)1 .混同均衡只有存在冒充时,才可能有混同均衡。两种工人选择同一种教育水平,公司观察到ep后的推断为P(Hlep)

9、= q支付的工资为wp = qy (H, e) + (1 - q) y(L, e)( 4.2.2)对于不在均衡路径上的推断,可以是p (Hie) = 0e 丰 ep工资支付为w (e) = y(L, e)e 丰 ep其他的混同均衡:eo: eo e,类似给出公司的推断及工资的支付,也构成精炼贝叶斯均衡。另一种混同均衡:e,但公司对不在均衡路径上的推断不同。e = epe ee, p q公司的工资支付为w y(L, e) Ey(n e)M (HI e) = Je =epe e2 .分离均衡(1)不存在冒充的时候e(L) = e*(L), e(H) = e*(H), 公司的推断:p(HI e) =

10、 0, e e*(H) 公司支付工资w (e) = y(L, e), e e*(H)这是精炼贝叶斯均衡。(2)存在冒充的时候高能力工人选择e e*(H),低能力选择e = e*(L) s公司的推断及公司支付工资为:四(H e) = 0, e esw (e) = y(L,e), e e可以构成分离均衡。考虑e e。分离均衡:高能力工人选择时,低能力工人选择eL*o 公司的推断及工资支付为四(HI e) = 0, e ew (e) = y(L,e), e e这是精炼贝叶斯均衡。杂和均衡。一种工人以确定性选择一个教育水平,另一种随机选择前一种工 人的教育水平或另一个教育水平。考虑:高能力工人选择一个

11、教育水平,低能力工人以概物选 择q,以概率(1 -冗)选择ei。公司观察到eh和eL后的推断MHieh) = _q_hq + (1 q )兀h (He)= 0i公司对杂和教育水平的工资w = q y (H, e) + (1 q 吹 y(I, e),e enh hq + (1 q )兀q + (1 q )兀hwpw L*eLeheseww (e) = y (H, e),e I(1 + r)博弈的时间顺序:自然决定利润:L或H企业家观察冗和提出股份&投资者观察s,并选择拒绝还是接受企业家的收益:被拒绝:冗,被接受:(1-s)S+R) 投资者的收益:拒绝:I(1+ r),接受:s(冗+R)投资者对冗

12、=L的推断:q 他将接受s当且仅当sqL + (1 - q)H + R I (1 + r)I (1 + r) spL + (1 - p) H + R企业家偏好外部融资,当且仅当冗 (1- s)(冗+R),即s R兀+ R如果I(1 +r) s RpL + (1 - p) H + RH + R混同均衡存在。当p很小,上式满足。当p接近1则需满足1 (1 + r) s i(1 + r) H - L R分离均衡:当冗=L,企业家提出s = 1 (1 + r),投资者接受.L + R当冗=H,企业家提出s 1(1 +,),投资者拒绝.H + R为何不取等号?企业家用债券D融资:收益:如果不破产,冗+

13、R -D,如果破产则为0.投资者的收益:企业不破产D,破产冗+ R混同均衡:企业家提出D= I(1+r),投资者接受。例空城计诸葛亮的状态:有兵(f ),无兵(e)。选择的行动(信号):开城门(。),关城门(c)。司马懿:进攻M),撤退(r)。-11司马懿认为诸葛亮用兵谨慎:p = 0.9, q = 0.1。 确定有兵的概率为09,无兵的概率为01。1.混同于(开门,开门)?诸葛亮:(o, o).如果为均衡,p = 0.9司马懿进攻a,收益:(-1)x 0.9 + 2X0.1= - 0.7撤退的收益为0,因此选择撤退,。诸葛亮收益为0。如果诸葛亮关门c,当(-1) x q + (1 - q)

14、1/2司马懿撤退,诸葛亮收益为0,不会关门。均衡:(开门,开门),(撤退,撤退),p = 0.9, q 1/22. 混同于(关门,关门)?诸葛亮:(c, c).如果为均衡,q = 0.9司马懿进攻a,收益:(-1)x 0.9 + 1x0.1= - 0.8撤退的收益为0,因此选择撤退,。诸葛亮收益为0。如果诸葛亮开门。,当(-1) xp + 2x(1 -p) 2/3司马懿撤退,诸葛亮收益为0,不会开门。均衡:(关门,关门),(撤退,撤退),p 2/3, q = 0.9, 3. 分离于(开门,关门)?诸葛亮:(o, c).如果为均衡,p = 1 q = 0司马懿在开门时进攻a,收益为1,撤退,收益

15、为0,因此选择 撤退。诸葛亮收益为0。司马懿在关门时进攻a,收益为1,撤退,收益为0,因此选择进攻。诸葛亮收益为-1。诸葛亮在无兵时选择开门。不是均衡。4.分离于(关门,开门)?诸葛亮:(c, o).如果为均衡,p = 0,q = 1司马懿在开门时进攻a收益为-1,撤退,收益为0,因此选择 撤退。诸葛亮收益为0。司马懿在关门时进攻a收益为2,撤退,,收益为0,因此选择 进攻。诸葛亮收益为-2。诸葛亮在无兵时选择开门。不是均衡。4. 3精炼贝叶斯均衡的其它应用4. 3.A 空谈博弈(Cheap-talk)发送者的信号是口头信息-无成本,无约束,无核查。口头信息能传递信息的必要条件1 .不同的发送

16、者类型有不同的偏好;2. 接收者对不同行动的偏好依赖于发送者的类型3. 接收者与发送者对行动的偏好不是完全对立的博弈的时间顺序1. 自然按照概率分布产生S的一个状态匕T2. S观察4,选择m, eM3. R观察mj,选择akeA4. 收益为 Us(t,9ak)和 U*?a)混同均衡总是存在:接收者忽略任何信号。 接收者的最优行动a*求max Z P(t:) 岫,时akA时例:分离均衡发送者两个类型:T = tL, tH, Prob(tL) = p 接收者两个行动:A =灯,aH 收益表:第1个数字为发送者收益。x,1y, 0z,0w, 1stLtHaLaH不同的类型发送不同的信号,要求:1.

17、x与z的关系,与y与w的关系不同。2. 接收者的行动依赖于发送者类型。3. x, z, w, y的值与接收者的收益一致。分离均衡存在:x z, w y例 部分(partially)混同均衡发送者的类型空间:T = 0, 1,均匀分布接收者的行动空间:A = 0, 1收益:Us(t, a) = -a - (t + b )2UR(t, a) = - (a -1) 2分离均衡存在?部分混同均衡:考虑n个信号:0,x 1 ), xp 与),,Xn-1,1n=2:0, x ),x, 1发送者:0, x ) T 0接收者的推断:t为0,x上的均匀分布接收者选择行动a:Max E%(t,a) = Max E

18、 - (a -1)2E - (a - t ) 2 = - (a - t)2 1 dt = (a -x) 3-a3 尤3 x0解出 a(0) = x/2发送者:X, 1 T X接收者的推断:t为X, 1上的均匀分布接收者选择行动a:Max E%(t, a) = Max E - (a -1) 2E%(t, a) =E- (a - t ) 2 = J - (a - t)2 1 dt1 xx=1(a - 1) 3 - (a - x )33(1 - x)解出 a(x) = (1 + x)/2(t0 = x/2 b, q= (1+x)/2 b)类型t发送者的收益:发送 0: U (t, a(0) = (t

19、 + b)22发送 x: USx(f, a(x) = !a (t + b)2均衡结果,在x:US0(x, a(0) = Usi(r, a(x)- - (x + b)2= - 1 + - - (x + b )222x = 1 2b2必要条件:b 2 的情形:0, xi), x x 2),x”,1考虑第k个边界:电土), xk,xk+i)发送者:xk_i,矽*时接收者的推断:1/( xk - xk-i)他的行动:a(xk-i) = (xk + xk-i )/2发送者发送 x k-i 的收益:Usk-i(t, a(xk-i)=七 + 七 一1 (t + b)2发送者:x, x A x, k k+1k

20、接收者的推断:1/( xk+1-xk)他的行动 a = (xk+i + xk )/2tXXt发送者发送 xk 的收益:Usk(t, a(xk) = - L1 + xk - (t + b)22均衡结果,在x:k%侈 a (xk- = Usk (xk,a(xk)一血 + xk-i W(xk + b)2= -(% + xk V2- (xk + b)2可以解出xk+i - xk 类似可以得到xk - % 因此xk+i - xkxk - xk-i + 4bxk-1 - xk-2 + 4bxk - xk-1 + 4b xk-i-xk-2 + 2x 4b .=xi+kx4bi = (i -、i)+ (xn-

21、i-* n-2)+ + i 一 0) =xi+ (n - i)x4b + xi+ (n - 2)x4b + + x i=nxi + n(、t)x4b必要条件:n (n x 4b i2解出 1 ( i - 1 + 2 /b ) n W2时,企业接受W2工会选择w2max w 2xprob w 2 被接受 + 0x probw 2 被拒绝如果工会推断企业的利润:0冗1 ,则Prob w2被接受=兀广2兀1解出w 2 =冗1/2在第1期,企业接受*1,如果冗-w1 0;=冗*(w 1, w 2)冗-w 5(k -w )艮口 n 广&2121 8因此 冗 max 冗 *(w 1, w2), w 1=气

22、由于w1 w2,有冗 *(w1, w2) w1冗16 *(w 1, w 2)如果w 1被拒绝,企业的推断当sw 1):谖0,冗1上的均匀分第二期的提议:w 2 =冗1/2冗=w 8k / 2解出k (wi) = 2w1 12 8w2(w 1)=二2 8工会在第一期的工资提议:W1满足W1但是接受W2 ) w 1 和 w2) Max w 1 xProb(企业接受 w1) + 8 w2 (w 1) xProb(企业拒绝 + 8x0 x Prob(企 业拒绝=w kh k 1(叩 + 8w (w )121兀H解得w1*=. (2 8 )2兀H2(4 38 )气* :=(2 8 )k H4 38w *

23、2=(2 8 ):H 2(4 38 )4.3.C有限重复囚徒困境中的声誉参与人对自己的战略有私人信,鼠参与人:列,行行有两种可能的类型:投桃报李:第一次选合作,以后每次选择对方上一次的行为。概率:理性:任何可行的战略。概率:1 -三期情形1. 自然产生行的类型:投桃报李或理性2. 行和列进行囚徒困境博弈3. 行和列第二次和第三次进行囚徒困境博弈4. 双方得到收益.(各次博弈收益之和)1, 1b, aa , b0 , 0Cooperate行Fink列CooperateFinka 1, b a + b + paY = F:1+pa a(2) Y = C vs. Y = F.仅考虑X = C1+p

24、+ (1 -p)b + pa 1 + pa即 p + (1 -p)b 0如果1 a + b则由(3)和 (4), (1)成立.b= -p/(1-p)(1)(2 )(3 )(4 )如果 -(4)成立,X = C,Y= C为精炼贝叶斯均衡.4.4精炼贝叶斯均衡的再精炼Refinements of Perfect Bayesian Equilibrium31100100精炼贝叶斯均衡:(L, L, p = 1), (R,R, p 0是否合理?定义:开始于一个信息集的严格劣战略s(Strategy strictly dominated beginning at a information se):有一

25、个战略,对于i在该信息集的可能的每一个推断,与其他 参与者在其后的可能的战略组合,使得i的收益严格大于实行亨的 收益。要求5 一个信息集中,对于一个只有始于某个信息集的严格劣 战略才到达的节点,参与者的推断是概率为0。310010010,1,1,0,混同的精炼贝叶斯均衡(L, L), , p = 0.5, q 1/2t1是否会选择R?要求5表明q = 0.定义类型匕的劣信号咯:如果存在另一个信号咛使得min Ut.,m,t,a) max信号要求5如果m之后的信息集在均衡路径之外,且m.为类型t的劣信号,则接收者认为匕发送信号m,的概率为0。分离的精炼贝叶斯均衡(L,R), (u,u),p =

26、1,q =0满足信号要求5.修改R的收益:U方R, u) = 0, U聂R, d) = 1混同的精炼贝叶斯均衡(L,L), (u,d), p = 0.5, q =0满足信号要求5例啤酒与热狗混同的精炼贝叶斯均衡(Q, Q), (not, duel),p = 0.1, q 1/2满足信号要求5。如果接收者观察到啤酒,他知道发送者是软弱类型的可能不低于 是粗暴的类型.定义 类型七的均衡劣信号mj :如果匕的均衡收益U*S(t,) max Us(t, m,)信号要求6如果m,之后的信息集在均衡路径之外,且m,.为类型t的均衡劣信号,则接收者认为t.发送m.的信号为0。就业市场的信号博弈1.自然决定工

27、人的能力门,以概率q为高口,以概率1 -q为 低L。2 .工人了解自己的能力,选择一个教育水平e 0,教育的成本 为 c(H,e)或 c( L,e)。假设对于获得相同的教育,低能力工人的边际成本要高于高能力的工人的,即3.企业观察。,决定工人的工资w。工人的收益w - c( m e)工人的无差异曲线I(e,w) = w-c(m e)斜率k = -d /屁=c dI / dwe企业的收益y( m e) - wy(L, e)eLeHmaxew - c(n, e)s. t. y(n, e) = w最优解表示为e*(n),对应的工资w*(n)= yn, e*(n)低能力工人不冒充高能力工人的情形,即w

28、*(L) - cL, e*(L) w*(H) - cL, e*(H)在有冒充的情形,即w*(L) - cL, e*(L) w*(H) - cL, e*(H)假设企业是完全竞争的,即W = y(m e 具有能力n的工人选择教育水平e使得1 .混同均衡只有存在冒充时,才可能有混同均衡。两种工人选择同一种教育水平匕,公司观察到牝后的判断为P(Hlep) = q(4.2.2)支付的工资为wp = qy (H, ep) + (1 -q) y(L, e)对于不在均衡路径上的判断,可以是p (He = 0 e 丰 ep工资支付为w (e) = y(L,e) e 丰 e p其他的混同均衡:e0: ep e0

29、e,是低能力工人的劣信号,应当 有 p (HI e) = 1。另一种混同均衡:e,但公司对不在均衡路径上的判断不同。0e ep*公司的工资支付为广 y(L, e) e e这种完备贝叶斯均衡也不满足信号要求5:2 .分离均衡(1)不存在冒充的时候e(L) = e.,e(H) = e;,公司的判断:p(HI e) = 0, e eH*公司支付工资w (e) = y(L,e;),e e这是完备贝叶斯均衡。是否满足要求5与6?(2)存在冒充的时候考虑分离均衡:高能力工人选择es e*(H),低能力选择e = e*(L) 公司的判断为:四(HI e) = 0, e es公司支付工资w (e) = y(L

30、,e), e es构成分离均衡。满足信号要求5与6。Wy(H,匕)WH *考虑e e。分离均衡:高能力工人选择,低能力工人选择e L*o公司的判断及工资支付为MHI e) = 0, e ew (e) = y(L, e*), e e这是精炼贝叶斯均衡,但是不满足信号要求5o对于e: e e ehq + (1 - q )兀q + (1 - q )兀w(e) = y (H, e), e en低能力工人随机选择的混同策略8血,应当是与e;无差异的wL* - c(L, e/) = wh - c (L, eh )由此解出wh = r y (H, eh) + (1 - r) y(L, eh)r = qq + (1 - q)K

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号