第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt

上传人:牧羊曲112 文档编号:2132769 上传时间:2023-01-15 格式:PPT 页数:144 大小:975.50KB
返回 下载 相关 举报
第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt_第1页
第1页 / 共144页
第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt_第2页
第2页 / 共144页
第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt_第3页
第3页 / 共144页
第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt_第4页
第4页 / 共144页
第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt_第5页
第5页 / 共144页
点击查看更多>>
资源描述

《第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt》由会员分享,可在线阅读,更多相关《第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt(144页珍藏版)》请在三一办公上搜索。

1、第三部分:不完全信息静态博弈,第十章贝叶斯博弈与贝叶斯Nash均衡,主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释,主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释,第十章贝叶斯博弈与贝叶斯Nash均衡,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,一、贝叶斯博弈,前面两部分我们讨论了完全信息博弈问题,但在现实生活中我们遇到更多的可能是不完全信息博弈问题。,Cont

2、rol Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例如,在“新产品开发”博弈中,企业对市场的需求可能并不清楚;在连锁店博弈中,潜在的进入者可能并不知道连锁店在市场上的盈利情况,等等。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,将这种博弈开始时就存在事前不确定性的博弈问题是不完全信息博弈问题。,Control Science and Engineering,HUST All Rights Reserve

3、d,2007,Luo Yunfeng,例如:“斗鸡博弈”,考察这样的情形:假设参与人可能有这样的两种性格特征(类型)“强硬”(用s表示)或“软弱”(用w表示)。所谓“强硬”的参与人是指那些喜欢争强好胜、不达目的誓不罢休的决斗者;而“软弱”的参与人是指那些胆小怕事、遇事希望息事宁人的决斗者。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,显然,当具有不同性格特征的决斗者相遇时,所表现出来的博弈情形是不同的。令U表示冲上去;D表示退下去,则每种情况下博弈情形如下图所示。,Control Scien

4、ce and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当参与人都为强硬者时,博弈存在两个纯战略Nash均衡(U,D)和(D,U)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当参与人1为强硬者参与人2为软弱者时,博弈存在唯一的Nash均衡(U,D)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当参与人1为软弱者参与人2

5、为强硬者时,博弈存在唯一的Nash均衡(D,U)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当参与人都为软弱者时,博弈存在唯一的Nash均衡(D,D)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,(1)参与人都为强硬者,(2)参与人1为强硬者参与人2为软弱者,(3)参与人1为软弱者参与人2为强硬者,(4)参与人都为软弱者,Control Science and Engineering

6、,HUST All Rights Reserved,2007,Luo Yunfeng,在“斗鸡博弈”中,虽然在博弈开始之前每位决斗者都了解(知道)自己的性格特征,但对对手的性格特征往往不甚了解或了解不全。在这种情况下即使所有的决斗者都看到了上面的四个战略式博弈,但对决斗者来讲,仍存在着所谓的事前不确定性即博弈开始之前就不知道的信息。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于“强硬”的参与人1来讲,虽然他看到了上面的战略式博弈,但他不知道对手是“强硬”的还是“软弱”的,所以博弈开始之前

7、他无法确定博弈是根据(1)还是(2)进行。这意味着“强硬”的参与人1面临着事前无法确定的信息。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,同样,“软弱”的参与人1也会面临类似的问题。此时,“斗鸡博弈”就是一个不完全信息博弈问题。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于不完全信息博弈问题,是不可能应用前面两部分介绍的方法进行求解的。,Control Science and Eng

8、ineering,HUST All Rights Reserved,2007,Luo Yunfeng,这是因为给定参与人1为“强硬”的决斗者,如果对手是“软弱”的,那么博弈就只存在惟一的Nash均衡(U,D),参与人1有惟一的最优选择“冲上去”;如果对手是“强硬”的,则博弈就会出现两个Nash均衡(U,D)和(D,U),参与人1的最优选择取决于对手的选择。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,但由于参与人1不知道对手究竟是“强硬”的还是“软弱”的,因此,此时的参与人1就觉得自己似乎是

9、在与两个决斗者进行决斗,一个是“强硬”的,另一个是“软弱”的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当一个参与人并不知道在与谁博弈时,博弈的规则是没有定义的,如何处理不完全信息?Harsanyi提出了Harsanyi转换。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,为了分析,对“斗鸡博弈”进行简化。假设参与人1是“强硬”的决斗者,参与人2可能是“强硬”的也可能是“软弱”的,参与人

10、1不知道但参与人2清楚,而且这一假设为所有的参与人所知道。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Harsanyi转换,对于简化的“斗鸡博弈”,Harsanyi转换是这样处理的:在原博弈中引入一个“虚拟”参与人“自然”(nature,用N表示),构造一个参与人为两个决斗者和“自然”的三人博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Harsanyi转换,“自然”首先行动决定参与

11、人2的性格特征(即选择参与人2是“强硬”的还是“软弱”的),“自然”的选择参与人1不知道,但参与人2知道。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在“自然”选择后,参与人1和2再进行“斗鸡博弈”。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在新构造的三人博弈中,“自然”的支付不必考虑。参与人1和2的支付由“斗鸡博弈”决定。,Control Science and Engineeri

12、ng,HUST All Rights Reserved,2007,Luo Yunfeng,如果“自然”选择参与人2的性格特征是“强硬”的,则意味着参与人1与“强硬”的参与人2进行决斗,博弈进入决策结x1,其支付(1)决定;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果“自然”选择参与人2的性格特征是“软弱”的,则意味着参与人1与“软弱”的参与人2进行决斗,博弈进入决策结x2,其支付由(2)决定。,Control Science and Engineering,HUST All Right

13、s Reserved,2007,Luo Yunfeng,Harsanyi通过引入“虚拟”参与人,将博弈的起始点由x1(或x2)提前至x0,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性(即参与人1不知道“自然”的选择)。这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法亦称Harsanyi转换。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察不完全信息博弈问题参与人的决策,用p1表示参与人1认为“自然”选择参与人2为“强硬”的概率,v1(U)和v1(D)分别表示参与人1

14、认为自己选择行动U和D时所能得到的期望收益;用x表示“强硬”的决斗者2选择行动U的概率。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当 即 时,对参与人1来讲,其最优选择是U(即“冲上去”)。由于,所以当 即参与人1认为参与人2是“强硬”决斗者的可能性不超过1/2时,就会选择“冲上去”。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察参与人2的选择。用q1表示参与人2关于“参与人1关于

15、自然选择的推断”的推断,即q1表示参与人2认为“参与人1认为参与人2是强硬的”概率。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,由前面的分析可知:如果,则参与人2认为“U(即冲上去)是参与人1的最优选择”;与此同时,如果,则参与人1的最优选择与参与人2的预测一致。但是,如果 而,则参与人1的最优选择就可能与参与人2的预测不一致。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在Harsan

16、yi转换中规定:参与人关于“自然”选择的推断为共同知识。也就是说,两个决斗者不仅同时一起看到了“自然”随机选择参与人2的性格特征,而且同时一起看到了“自然”以一定的概率分布随机选择参与人2的性格特征。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,不完全信息博弈经Harsanyi转换之后得到的完全但不完美信息博弈。(x,y)表示参与人1的性格特征为x,参与人2的性格特征为y;pxy表示“自然”选择(x,y)的概率,这里pxy为共同知识。,Control Science and Engineer

17、ing,HUST All Rights Reserved,2007,Luo Yunfeng,在应用Harsanyi转换时,需要注意以下问题:,1)“自然”的选择。在一般的不完全信息博弈问题中,Harsanyi转换规定“自然”选择的是参与人的类型(type)。除了根据参与人的支付来划分参与人的类型以外,还可以根据参与人的行动空间,甚至根据参与人掌握信息的多少(或程度)来来划分参与人的类型。此外,需要注意的是,参与人的类型必须是其个人特征的一个完备描述。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfen

18、g,用ti表示参与人i的一个特定的类型,Ti表示参与人i所有类型的集合(亦称类型空间,type space),即,t=(t1,tn)表示一个所有参与人的类型组合,t-i=(t1,ti-1,tn)表示除参与人i之外其他参与人的类型组合。所以,t=(ti,t-i)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,2)参与人关于“自然”选择的推断。用p(t1,tn)表示定义在参与人类型组合上的一个联合分布密度函数,Harsanyi转换假定:对于一个给定的不完全信息博弈问题,存在一个参与人关于“自然”

19、选择的推断p(t1,tn),且p(t1,tn)为共同知识。也就是说,Harsanyi转换假定所有参与人关于“自然”行动的信念(belief)是相同的,并且为共同知识。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,用 表示参与人i在知道自己类型为ti的情况下,关于其他参与人类型的推断(即条件概率),则其中,为边缘密度函数。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设pss=0.2,ps

20、w=0.3,pws=0.25,pww=0.25。虽然决斗者1不知道决斗者2 的类型,但由于决斗者1知道自己的类型,因此他可以根据贝叶斯公式推知决斗者2的类型分布。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例如,根据贝叶斯规则,“强硬”的决斗者1可以推知:决斗者2是“强硬”的概率为决斗者2是“软弱”的概率为“软弱”的决斗者1可以推知:决斗者2是“强硬”的概率为决斗者2是“软弱”的概率为,Control Science and Engineering,HUST All Rights Rese

21、rved,2007,Luo Yunfeng,这里不同类型的决斗者1所形成的关于“自然”选择的推断是不同的,究其原因,Harsanyi认为:虽然理性的参与人在掌握同样的信息时对同一事件会形成相同的概率推断,但参与人各自掌握的信息不同时对同一事件就会形成不同的概率推断。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,这说明在Harsanyi转换中,参与人对包括自己在内的所有参与人的类型的联合概率推断(分布)都是一样的,但由于参与人掌握的私人信息不同,使得各自对其他参与人的类型的概率分布的推断不同。

22、,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,贝叶斯博弈(the static Bayesian game)是关于不完全信息静态博弈的一种建模方式,也是不完全信息静态博弈的标准式描述。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,贝叶斯博弈的定义,贝叶斯博弈包含以下五个要素:参与人集合;参与人的类型集T1,T2;参与人关于其他参与人类型的推断,;参与人类型相依的行动集A(t1),A(tn)

23、;参与人类型相依的支付函数,。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,参与人的推断 来源于一个共同的参与人关于“自然”选择的推断p(t1,tn),且p(t1,tn)为共同知识。所以,贝叶斯博弈中参与人所具有的关于其他参与人的类型的推断是一致的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,规定贝叶斯博弈的时间顺序如下:,“自然”选择参与人的类型组合t=(t1,tn),其中;参与人i观

24、测到“自然”关于自己类型ti的选择;虽然参与人i观测不到“自然”关于其他参与人类型t-i的选择,但参与人i具有关于其他参与人类型的推断;参与人同时选择行动,每个参与人i从行动集Ai(ti)中选择行动ai(ti);参与人i得到。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,贝叶斯博弈中的战略,在贝叶斯博弈 中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti),它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。,Control Science

25、 and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,“斗鸡博弈”的贝叶斯模型,参与人为决斗者1和2;用s表示决斗者是“强硬”的,w表示决斗者是“软弱”的,所以T1=T2=s,w。用pxy表示“自然”选择类型组合(x,y)的概率,并假设pxy为共同知识,则每位决斗者i关于其对手类型的推断pi(x|y)。每位决斗者i关于类型相依的行动空间Ai(x)=U,D。每位决斗者i的支付由前面的图决定。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfe

26、ng,在贝叶斯博弈中参与人的战略可定义为,战略“强硬”的决斗者i选择行动U,“软弱”的决斗者选择行动U,即(U,U);战略“强硬”的决斗者选择行动U,“软弱”的决斗者选择行动D,即(U,D);战略“强硬”的决斗者选择行动D,“软弱”的决斗者选择行动U,即(D,U);战略“强硬”的决斗者选择行动D,“软弱”的决斗者选择行动D,即(D,D)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解

27、释,第十章贝叶斯博弈与贝叶斯Nash均衡,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,用x表示“强硬”的决斗者2选择行动U的概率,y表示决斗者1选择行动U的概率。决斗者1选择行动U和D的期望收益分别为 和(这里p为“自然”选择决斗者2为“强硬”的概率),所以决斗者1的最优战略为:如果,则选择y=1(即选择行动U);如果,则选择y=0(即选择行动D);如果,则选择(即选择任一混合战略)。,Control Science and Engineering,HUST All Rights Reser

28、ved,2007,Luo Yunfeng,考察“强硬”决斗者2的选择。“强硬”决斗者2选择行动U和D的期望收益分别为 和 所以“强硬”决斗者2的最优战略为:如果y1/2,则选择x=0(即选择行动D);如果y=1/2,则选择(即选择任一混合战略)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,不完美信息博弈存在如下两个纯战略Nash均衡,决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D;决斗者1选择行动D,“强硬”决斗者2选择行动U,“软弱”决斗者2选择行动D。此外,

29、博弈还存在一个混合战略Nash均衡,即决斗者1以1/2的概率选择行动U,“强硬”决斗者2以的概率1/(2p)选择行动U,“软弱”决斗者2选择行动D。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,用 表示给定其他参与人的战略,类型为ti的参与人i选择行动ai时的期望效用,则其中,对,为给定t-i时由s-i所确定的其他参与人的行动组合,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,“斗鸡博弈”中

30、,“强硬”的决斗者1关于对手类型的推断为,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,所以,当决斗者2的战略为(即(U,U),则“强硬”的决斗者1选择行动U和D时的期望效用分别为,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当决斗者2的战略为(即(U,D),则“强硬”的决斗者1选择行动U和D时的期望效用分别为,Control Science and Engineering,HUST All

31、 Rights Reserved,2007,Luo Yunfeng,在贝叶斯博弈中,对于一个理性的参与人i,当他只知道自己的类型ti而不知道其他参与人的类型时,给定其他参与人的战略s-i,他将选择使自己期望效用(支付)最大化的行动,其中,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,纯战略贝叶斯Nash均衡,贝叶斯博弈 的纯战略贝叶斯Nash均衡是一个类型相依的行动组合,其中每个参与人在给定自己的类型ti和其他参与人的类型相依行动 的情况下最大化自己的期望效用。也就是,行动组合 是一个纯战略贝

32、叶斯Nash均衡,如果对,,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,存在性结论,定理 一个有限的贝叶斯博弈一定存在贝叶斯Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,贝叶斯Nash均衡的求解,先以简化的“斗鸡博弈”为例。用p表示决斗者1关于决斗者2的类型的推断。(x,(y,z):x表示当决斗者2选择该方格所对应的战略时,决斗者1选择该方格所对应的战略规定的行动所得到的期望

33、支付;y和z分别表示当决斗者1选择该方格所对应的战略时,“强硬”决斗者2和“软弱”决斗者2选择该方格所对应的战略规定的行动所得到的期望支付。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,给定决斗者1选择战略U,“软弱”决斗者2选择行动D的期望支付为0,选择行动U的期望支付为-4,行动D优于行动U;给定决斗者1选择战略D,“软弱”决斗者2选择行动D

34、的期望支付为1,选择行动U的期望支付为0,所以,行动D优于行动U。这意味着战略和为决斗者2的劣战略。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,下面根据p的大小,求解博弈的纯战略贝叶斯 Nash均衡。1)假设,无论决斗者2选择战略(U,D)还是(D,D),决斗者1的最优行动都是U。给定决斗者1的选择U,“强硬”决斗者2的最优行动为D。所以,博弈

35、存在惟一的纯战略贝叶斯Nash均衡决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,2)假设,博弈存在如下两个纯战略贝叶斯Nash均衡:(1)决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D;(2)决斗者1选择行动D,“强硬”决斗者2选择行动U,“软弱”决斗者2选择行动D。,Control Science and Engineering,HUST All Rights Reserved,2007

36、,Luo Yunfeng,求解“斗鸡博弈”的贝叶斯Nash均衡,假设“强硬”决斗者1关于决斗者2的类型推断;“软弱”决斗者1关于决斗者2的类型推断;“强硬”决斗者2关于决斗者1的类型推断;“软弱”决斗者2关于决斗者1的类型推断;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,的含义是:x1和x2分别表示当决斗者2选择该方格所对应的战略时,“强硬”决斗者1和“软弱”决斗者1选择该方格所对应的战略规定的行动所得到的期望支付;y1和y2分别表示当决斗者1选择该方格所对应的战略时,“强硬”决斗者2和“

37、软弱”决斗者2选择该方格所对应的战略规定的行动所得到的期望支付。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于“软弱”决斗者1,无论决斗者2选择什么战略,其最优行动都是D。所以,战略(U,U)和(D,U)为决斗者1的劣战略。基于同样的原因,战略(U,U)和(D,U)为决斗者2的劣战略。,Control Science and Engineer

38、ing,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于“强硬”决斗者1,无论决斗者2选择什么战略,其最优行动都是U。所以,战略(D,D)为决斗者1的劣战略。给定决斗者1选择战略(U,D),对于决斗者2战略(D,U)和(D,D)是无差异的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,所以,博弈存在如下两个

39、纯战略Nash均衡:“强硬”的决斗者1和2选择行动U,“软弱”的决斗者1和2选择行动D;“强硬”的决斗者1选择行动U,“软弱”的决斗者1选择行动D;“强硬”的决斗者2和“软弱”的决斗者2选择行动D。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,贝叶斯Nash均衡定义的另一种表示方式,在静态贝叶斯博弈 中,战略组合 是一个纯战略贝叶斯Nash均衡,如果对 及,满足即没有参与人愿意改变自己的战略,即使这种改变只涉及一种类型下的一个行动。,Control Science and Engineeri

40、ng,HUST All Rights Reserved,2007,Luo Yunfeng,简化的“斗鸡博弈”的纯战略贝叶斯Nash均衡为:如果p1/2,博弈的纯战略贝叶斯Nash均衡为(U,(D,D);如果p1/2,博弈的纯战略贝叶斯Nash均衡为(U,(D,D)和(D,(U,D)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,“斗鸡博弈”的纯战略贝叶斯Nash均衡为:(U,D),(U,D)和(U,D),(D,D)。,Control Science and Engineering,HUST

41、All Rights Reserved,2007,Luo Yunfeng,主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释,第十章贝叶斯博弈与贝叶斯Nash均衡,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,1.不完全信息古诺模型,在Cournot模型中,每一个企业对其他企业的成本和自己的成本是已知的,因而信息是完全的。然而在实际中,企业往往很难知道其他企业的成本。当Cournot模型中至少有一个企业不知道其他企业的成本时所对应的

42、模型即为不完全信息的Cournot模型。参与人类型成本函数。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设:,企业1的成本函数为共同知识:企业2的成本函数为私人信息:其中,企业1知道企业2是 的概率为p,是 的的概率是1-p,p和1-p为共同知识。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,市场需求:,Control Science and Engineering,HUST All

43、Rights Reserved,2007,Luo Yunfeng,进一步假设:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,企业2:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,令 则,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,企业2的反应函数,Control Science and

44、Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,不仅与企业1的产量有关,而且与自己的成本有关。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,企业1:企业1不知道企业2的真实成本,因而也不知道企业2的最优反应是 企业将选择使期望利润最大化的产量。,Control Science and E

45、ngineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,由最优化一阶条件得:,即企业1的反应函数。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,联立求解两个反应函数,得贝叶斯Nash均衡为:,Control Science and Engineering,HUST All Rights Reser

46、ved,2007,Luo Yunfeng,两种均衡的比较:,企业2为低成本:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,企业2为高成本:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,均衡比较示意图,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设:,共同知识,Control Scien

47、ce and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,企业1低成本类型(l),Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,企业1低成本类型(l)的反应函数,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,企业1高成本类型(H),Control Science and Engineering,HUST All Rights Re

48、served,2007,Luo Yunfeng,企业2低成本类型(l),Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,企业2 高成本类型(H),Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,联立求解(1.1)(1.4),即可得贝叶斯Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,

49、2.不完全信息下的公共产品提供,参与人类型成本函数。两个参与人1、2同时决定是否提供公共产品,每个参与人面临的是一个 01决策问题,即提供或不提供。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,公共产品博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设:,公共产品的好处(每人一个单位)为共同知识,但每人的成本只有自己知道;c1和c2具有相同的、独立定义在 上的分布函数P(),其中,P(

50、)为共同知识。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,参与人的纯战略a(ci)定义为其中,0表示不提供,1表示提供。参与人的支付为:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,两个参与人1、2同时决定是否提供公共产品,每个参与人面临的是一个 01决策问题,即提供或不提供。,Control Science and Engineering,HUST All Rights Reserve

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号