第4章 Nash均衡解的特性ppt课件.ppt

上传人:小飞机 文档编号:2133449 上传时间:2023-01-16 格式:PPT 页数:107 大小:799.50KB
返回 下载 相关 举报
第4章 Nash均衡解的特性ppt课件.ppt_第1页
第1页 / 共107页
第4章 Nash均衡解的特性ppt课件.ppt_第2页
第2页 / 共107页
第4章 Nash均衡解的特性ppt课件.ppt_第3页
第3页 / 共107页
第4章 Nash均衡解的特性ppt课件.ppt_第4页
第4页 / 共107页
第4章 Nash均衡解的特性ppt课件.ppt_第5页
第5页 / 共107页
点击查看更多>>
资源描述

《第4章 Nash均衡解的特性ppt课件.ppt》由会员分享,可在线阅读,更多相关《第4章 Nash均衡解的特性ppt课件.ppt(107页珍藏版)》请在三一办公上搜索。

1、第一部分:完全信息静态博弈,第四章 Nash均衡解的特性,主要内容:一、Nash均衡的意义二、Nash均衡解的存在性三、Nash均衡解的多重性,主要内容:一、Nash均衡的意义二、Nash均衡解的存在性三、Nash均衡解的多重性,第四章 Nash均衡解的特性,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,一、Nash均衡的意义,观点:Nash均衡是博弈的一种一致性预测如果所有参与人预测一个特定的Nash均衡会出现,那么所有参与人都不会偏离,这个Nash均衡将会出现。,Control Scien

2、ce and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,将(或)作为博弈的一致性预测,那么(或)就应具有这样的特点:对于博弈中的任一个参与人 i,如果他预测到(或)将作为博弈结果出现,那么在他预测到其他参与人的选择为(或)的情况下,自己的选择(或)必须使自己的收益最大化(否则他就不是理性的),即。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Nash均衡的特点:,对任一个参与人i,在给定其他参与人选择的情况下,均衡战略是自己的

3、最优战略。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Nash均衡具有作为博弈一致性预测的特点所有参与人的自我肯定。一个博弈结果(或)如果不是Nash均衡,那么就意味着:至少有一个参与人i,在给定其他参与人的选择(或)的情况下,会偏离(或)。因此,(或)不可能成为博弈的一致性预测。也就是说,一个非Nash均衡的预测将会被参与人(至少一个参与人)自我否定。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yu

4、nfeng,例子:斗鸡博弈,两个所谓的勇士举着长枪,准备从独木桥的两端冲上桥中央进行决斗。每位勇士都有两种选择:冲上去(用U表示),或退下来(用D表示)。若两人都冲上去,则两败俱伤;若一方上去而另一方退下来,冲上去者取得胜利(至少心理上是这样的),退下来的丢了面子;若两人都退下来,两人都丢面子。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,存在两个纯战略Nash均衡(U,D)和(D,U),也就是一个人上去,另一个就必须退下来。,Control Science and Engineering,

5、HUST All Rights Reserved,2007,Luo Yunfeng,当一个理性的参与人预测到对方将会冲上去时,明智的选择就是退下来;而当预测到对方将会选择退却时,就应该大胆地冲上去。所以,我们可以将Nash均衡作为“斗鸡博弈”的一致性预测。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,(U,U)和(D,D),也就是两人同时冲上去或同时退下来,不是Nash均衡,也不能成为博弈的一致性预测。,Control Science and Engineering,HUST All Rig

6、hts Reserved,2007,Luo Yunfeng,这是因为,如果参与人预测(U,U)会出现,那么在行动时他不会选择U,因为相对于选择 U 实现预测的结果,参与人选择 D 可以使自己的支付变好,从而导致预测的行动和实际的行动不符,这也就意味着这个预测被参与人自我否定。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,非Nash均衡的(U,U)不可能成为一个一致性预测。基于同样的原因,(D,D)也不是一个一致性预测。,Control Science and Engineering,HUST

7、 All Rights Reserved,2007,Luo Yunfeng,例子:,博弈有惟一的Nash均衡 两个参与人在均衡中的期望收益都为0。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在参与人2选择均衡战略 的情况下,纯战略是参与人1的最优反应;而在参与人1选择均衡战略 的情况下,纯战略 L是参与人2的最优反应;在参与人1选择纯战略U而参与人2选择纯战略 L的情况下,双方的收益都为0,与均衡中的期望收益相同。,Control Science and Engineering,HUST

8、All Rights Reserved,2007,Luo Yunfeng,但是,作为非Nash均衡的战略组合(U,L)却不能成为博弈的一致性预测。这是因为,如果预测到参与人2选择纯战略L的话,参与人1的最优选择又应该是D,此时,参与人1会偏离而选择D。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,给定一个博弈G,R是G中参与人如何行动的数学描述的某个值域,用 表示博弈的解。作为博弈的解,应满足如下两个条件:(1),都存在一个环境能使成为参与人在这个博弈G中将如何行动的准确预测;(2)不存在一

9、个环境能使成为参与人在这个博弈G中将如何行动的准确预测;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,任何一个满足以上两性质的解,我们称之为博弈的一个精确解(exact solution)。精确解要求对所有可能情况下参与人将如何行动进行预测,并且其对参与人在各种情况下将如何行动的预测是准确预测,也就是一致性预测。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,一般情况下,同时满足以上两条性质

10、的解难以找到。将满足第一条性质的解,称为博弈的下解(lower solution)。下解排除了所有不合理的预测,但也可能排除了合理的预测;将满足第二条性质的解,称为博弈的上解(upper solution)。上解包含了所有合理的预测,但也可能包含了不合理的预测。显然,Nash均衡是上解。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,主要内容:一、Nash均衡的意义二、Nash均衡解的存在性三、Nash均衡解的多重性,第四章 Nash均衡解的特性,Control Science and Eng

11、ineering,HUST All Rights Reserved,2007,Luo Yunfeng,Nash均衡的存在性定理,每一个有限的战略式博弈至少存在一个Nash均衡(包括纯战略和混合战略Nash均衡)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,主要内容:一、Nash均衡的意义二、Nash均衡解的存在性三、Nash均衡解的多重性,第四章 Nash均衡解的特性,Control Science and Engineering,HUST All Rights Reserved,2007

12、,Luo Yunfeng,在博弈论中Nash均衡是作为博弈的解一致性的预测而引入的。在一个博弈问题中,如果博弈只存在一个Nash均衡,那么Nash均衡作为一致性的预测,应该说是相当有效的。但是,如果博弈中存在多个Nash均衡,那么Nash均衡作为博弈解的意义也就相对弱化了。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例如,在“斗鸡博弈”中,虽然存在两个纯战略的Nash均衡(U,D)和(D,U)(即一个人冲上去,另一个人退下来),但是,如果用它们作为一致性的预测话,就会面临这样的问题:在博弈

13、中,到底谁冲上去,谁又该退下来?如果两个参与人对“两个均衡到底哪一个会出现”的预测不一致的话,就可能会出现问题。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,参与人1预测博弈的解为:自己上去,对方退下来(即均衡(U,D),而参与人2则预测博弈的解为:对方退下来,自己上去(即均衡(D,U),那么博弈真正的结果就会既不是Nash均衡(U,D)也不是(D,U)(Nash均衡,而是非Nash均衡双方都冲上去,出现两败俱伤的情形。,Control Science and Engineering,HUS

14、T All Rights Reserved,2007,Luo Yunfeng,因此,传统的博弈论研究的问题或许并不是如何找到博弈的Nash均衡(即存在性问题),而是在博弈的多个Nash均衡中选择一个合理的均衡(即多重性问题)。事实上,当在一个博弈中存在多个Nash均衡时,目前还没有一个一般的理论能证明哪个Nash均衡结果一定会出现。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于Nash均衡的多重性问题,目前解决的思路主要有两种:第一种是均衡精炼的方法;第二种解决Nash均衡多重性问题的方

15、法就是非规范式的方法。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,均衡精炼的主要思路,从博弈解的定义入手,在Nash均衡的基础上,通过定义更加精炼的博弈解如子博弈精炼Nash均衡、精炼贝叶斯Nash均衡等,剔除Nash均衡中不合理的均衡。这种解决Nash均衡多重性的思路具有普遍性,对所有的博弈问题都适用;如果均衡精炼的方法可以称为规范式的方法的话,,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfe

16、ng,非规范式方法的特点,针对一些特定情形下的特定博弈问题,给出具体的解决Nash均衡多重性问题的方法。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,非规范的方法的方式,焦点效应相关均衡,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,焦点效应,在某些存在多个Nash均衡的博弈中,往往会出现这样的现象:所有的参与人都会相互预期博弈中某一特定的均衡将会出现,从而选择执行这个特定的均衡。,Cont

17、rol Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,焦点效应,2005年诺贝尔经济学奖获得者Schelling对这种现象进行了详尽的探讨并且证明:在一个具有多重均衡的博弈中,趋向于将参与人的注意力集中到一个均衡的任何事情,都可能使参与人全都预期并随之实行这个均衡,就像一个自行应验的预言一样。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,焦点效应,Schelling将这种现象称之为“焦点效应”(focal-

18、point effect),在焦点效应中具有某种使它显著地区别于所有其它均衡之性质的均衡,被称为“焦点均衡”(focal equilibrium)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例子:“性别战”博弈,一对青年夫妻决定周末出去娱乐,可供他们娱乐的项目有或者去观看足球比赛(用表示F),或者观看芭蕾演出(用表示B)。男的喜欢看足球比赛,女的喜欢看芭蕾演出,但夫妻双方都宁愿在一起,不愿分开。假设夫妻双方同时选择娱乐项目,Control Science and Engineering,

19、HUST All Rights Reserved,2007,Luo Yunfeng,在“性别战”博弈中,存在两个纯战略Nash均衡(F,F)和(B,B)以及一个混合战略Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果我们仅对图中那个抽象的模型进行分析,那么我们没有任何理由预言到底哪一个均衡将会出现。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,事实上,在对“性别战”博弈进行

20、建模的过程中,除了保留上图所示的要素(即参与人、战略和支付)以外,其它与“性别战”博弈有关的所有信息,如夫妻双方的生活习俗、他们所遵循的文化传统等等,都被我们抛弃在模型之外。而在实际的博弈过程中,这些被模型所抽象掉的信息,往往可能会指导我们达到一个特定的均衡即焦点均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设“性别战”博弈中的青年夫妻都生活在比较传统的家庭中,在生活中妻子总是传统地服从丈夫,那么在实际的博弈中,即使这对夫妻没有感到必须遵守这个传统的压力,这个传统也会使得均衡(F,F

21、)更为聚焦并更有可能被执行。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,反过来,如果夫妻双方生活在一个比较现代的(甚至有点前卫的)家庭中,丈夫十分尊重女权,那么在实际的博弈中,(B,B)就有可能成为所谓的“焦点均衡”而被实现。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,除了社会文化习俗以及传统会对博弈均衡的实现产生影响外,夫妻双方博弈的习惯、过去博弈的历史等等也都可能成为影响博弈均衡的

22、“焦点”因素。例如,假设夫妻双方都认为周末的娱乐活动应该丰富多彩的话,那么上一次大家选择了“足球”,这一次博弈的均衡就更有可能是大家都选择“芭蕾”。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,博弈的现实状况或背景也会将博弈引向特定的均衡。例如,在“性别战”中,正好碰上周末下雨,由于足球比赛是在室外进行,不适宜观看,因此,“下雨”这样一个现实背景就可能将博弈引向“芭蕾”这样一个均衡。,Control Science and Engineering,HUST All Rights Reserv

23、ed,2007,Luo Yunfeng,此外,“焦点效应”在某些博弈中还可能由均衡战略自身的性质来确定。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例子,该博弈中,存在三个Nash均衡 和,相对于其它两个混合战略Nash均衡,纯战略Nash均衡不仅结构简单,而且均衡收益高,因而更有可能使参与人聚焦到纯战略Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,“焦点效应”不可能引导理

24、性的参与人去执行一个非Nash均衡的战略组合。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例子:,战略组合(a2,b1)所对应的支付对博弈双方来讲,是非常有吸引力的,但由于(a2,b1)不是Nash均衡,因此,参与人不可能聚焦到战略组合(a2,b1)上。也就是说,聚焦因素只有针对Nash均衡时才可能是有效的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在“性别战”博弈中,将博弈聚焦于一

25、个特定均衡的简单易行的方法,就是在博弈之前,夫妻双方进行一个简单的沟通或商议。对于一个家庭和睦、夫妻关系融洽的家庭来讲,这种沟通或商议往往是十分有效的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,廉价磋商,类似于“性别战”中这种博弈之前进行的沟通或商议,在博弈分析中称之为具有通信的博弈或“廉价磋商”(cheap talk)。在博弈分析中,将参与人在博弈开始之前,不花任何成本所达成的、对参与人没有约束力的协议称为“廉价磋商”。,Control Science and Engineering,

26、HUST All Rights Reserved,2007,Luo Yunfeng,在某些情况下,“廉价磋商”确实可以使某些Nash均衡实际上出现,就如同和睦家庭中的“性别战”一样,事前的沟通或磋商可以使夫妻双方达到一个特定的均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例子:,该博弈中,存在两个纯战略Nash均衡(A,A)和(B,B)。其中(A,A)Pareto优于(B,B)。如果在博弈开始之前,两个参与人进行一个简单的沟通,并商议在博弈中大家都选择(A,A),那么在实际的博弈中,N

27、ash均衡就很有可能出现。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,但是,“廉价磋商”这种方式并不是在任何情况下都是有效的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例子:,该博弈中,存在两个纯战略Nash均衡(A,A)和(B,B)。其中(A,A)Pareto优于(B,B)。但只要双方稍稍有点保守或者厌恶风险,博弈的均衡就很可能是(B,B),而不是双方事前确定的(A,A)。,Con

28、trol Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,以“性别战”博弈为例,给出参与人进行事前磋商或沟通的正式描述。在“性别战”博弈中,假设夫妻双方就周末的娱乐活动安排进行协商。为了简化建模,我们不妨假设协商中只有丈夫向妻子提出建议“一起去看足球”(记为f)或者“一起去看芭蕾”(记为b),妻子收到建议后,可以接受丈夫的建议,也可以不接受。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,由于双方的协商是我们所

29、定义的“廉价磋商”,因此,丈夫给出建议后,他可以按建议行事(即遵守协议),也可以不按建议行事(即不遵守协议)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,因此,妻子就有如下四个战略:(F,F)无论丈夫提出什么样的建议,都去看足球;(F,B)丈夫提出去看足球,就去看足球;丈夫提出去看芭蕾,就去看芭蕾;(B,B)无论丈夫提出什么样的建议,都去看芭蕾;(B,F)丈夫提出去看足球,却去看芭蕾;丈夫提出去看芭蕾,却去看足球。,Control Science and Engineering,HUST

30、All Rights Reserved,2007,Luo Yunfeng,由于丈夫可能提出的建议有两个,而提出建议后可能采取的行动也有两个,因此,丈夫也有如下四个战略:(f,F)提出去看足球,自己也去看足球;(f,B)提出去看足球,自己却去看芭蕾;(b,F)提出去看芭蕾,自己却去看足球;(b,B)提出去看芭蕾,自己也去看芭蕾。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,含有沟通过程的“性别战”博弈描述:,Control Science and Engineering,HUST All Ri

31、ghts Reserved,2007,Luo Yunfeng,在均衡(f,F),(F,B)中,丈夫的战略是:建议去看足球,同时自己也去看足球,而妻子的战略是:丈夫怎么建议,自己就怎么去做。因此,均衡(f,F),(F,B)的存在,说明夫妻之间相互信任,说话算数,博弈之前的沟通,就可以将博弈引向特定的均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在战略(b,B),(F,B)组合中,丈夫的战略是:建议去看芭蕾,同时自己也去看芭蕾,而妻子的战略是:丈夫怎么建议,自己就怎么去做。但(b,B),(

32、F,B)并不是Nash均衡,这是由于丈夫位于主导地位(因为只有丈夫可以提出建议),因此,理性的丈夫可以利用夫妻间的信任,将博弈引向有利于自己的均衡上。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,均衡(f,F),(F,F)和(b,F),(F,F)的存在,说明在丈夫占主导地位的家庭中,博弈可以聚焦到有利于丈夫的均衡上。在均衡(b,F),(F,F)中,丈夫虽然提出去看芭蕾,但实际上去看足球。妻子知道丈夫只是说说而已,因此,无论丈夫提出什么建议,都顺从丈夫去看足球。,Control Science

33、 and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,均衡(f,B),(B,B)和(b,B),(B,B)的存在,说明在妻子占主导地位的家庭中,博弈可以聚焦到有利于妻子的均衡上。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,均衡(b,F),(B,F)的存在,说明在夫妻互不信任的情况下,位于主导地位的丈夫可以将博弈引向有利于自己的结果。,Control Science and Engineering,HUST All Rights

34、Reserved,2007,Luo Yunfeng,非规范的方法的方式,焦点效应相关均衡,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在“性别战”博弈中,夫妻双方通过长期的共处,在周末娱乐项目的选择上可能会形成这样的习惯:双方根据周末的天气状况来选择娱乐项目。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,比如说,足球比赛在露天进行,刮风下雨的话就不宜观看,双方选择观看芭蕾;反之,如果天气晴

35、好,大家就选择观看足球。显然,夫妻之间形成的这种习惯对双方来讲都是有益的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,规范分析,假设夫妻双方根据周末的天气状况来选择娱乐项目,为了简化分析,假设未来的天气状况有两种:天气晴好(用1表示)和天气恶劣(用2表示),用=1,2表示夫妻双方可能观测到的天气状况。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设出现1(即天气晴好)的概率与出现2(即

36、天气恶劣)的概率相等,即(1)=0.5,(2)=0.5。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察含有天气观测的“性别战”博弈,每个参与人(丈夫或妻子)都有以下四个战略:(F,F)观测到1,去看足球;观测到2,去看足球;(F,B)观测到1,去看足球;观测到2,去看芭蕾;(B,F)观测到1,去看芭蕾;观测到2,去看芭蕾;(B,B)观测到1,去看芭蕾;观测到2,去看足球。,Control Science and Engineering,HUST All Rights Reserved,2

37、007,Luo Yunfeng,如果夫妻双方按照上面所说的“习惯”选择娱乐项目,就相当于大家都选择战略。含有天气观测的“性别战”博弈模型可用下图中的战略式博弈描述。,含有天气观测的“性别战”博弈(天气晴好),Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,含有天气观测的“性别战”博弈(天气恶劣),Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,关于均衡战略(F,B),(F,B)的解释,战略组合(F

38、,B),(F,B)无论是在天气晴好的情况下还是天气恶劣的情况下,都构成Nash均衡。这意味着当夫妻双方根据天气状况来选择周末的娱乐项目时,谁偏离战略(F,B)即违背双方长期形成的“习惯”,谁就会倒霉。当夫妻双方都按“习惯”办事时,双方的期望收益都为2,大于双方在混合战略Nash均衡下的期望收益。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果有人不按“习惯”办事的话(即偏离战略(F,B),会出现什么样的情况。假设妻子坚持按“习惯”办事(即保持战略(F,B)不变),丈夫偏离大家约定俗成的“习

39、惯”(即偏离战略(F,B)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果丈夫偏离战略,他在天气晴好情况下的收益不会大于选择战略(F,B)时的收益,他在天气恶劣情况下的收益也不会大于选择战略(F,B)时的收益,因此,丈夫偏离战略(F,B)并不会使自己的期望收益增加,甚至还可能使自己的收益减少。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,除了战略组合(F,B),(F,B)外,在该博弈中

40、还存在三个战略组合(F,F),(F,F)、(B,B),(B,B)和(B,F),(B,F),无论天气晴好还是恶劣,也都构成纯战略Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,关于均衡战略(F,F),(F,F)的解释,在一个比较传统的、妻子总是服从丈夫的家庭中,夫妻双方形成的一个选择娱乐项目的“习惯”。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,关于均衡战略(B,B),(B,B

41、)的解释,为在一个比较现代的、丈夫总是体贴妻子的家庭中,夫妻双方形成的一个选择娱乐项目的“习惯”。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,关于均衡战略(B,F),(B,F)的解释,在一个夫妻相亲相爱、相敬如宾的家庭中,夫妻双方形成的一个选择娱乐项目的“习惯”。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,于是便得到一种解决Nash均衡多重性问题的方式:让参与人根据某个共同观测到的信号

42、(如“性别战”中的天气状况)来选择行动。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,存在一个问题,如果没有外界的强迫,参与人为什么会根据一个共同观测到的信号来选择行动?或者说什么情况下参与人才会根据一个共同观测到的信号来选择行动?,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,相关均衡,如果参与人根据信号选择行动的规则本身能够构成一个Nash均衡,那么参与人就可能会根据某个共同观测到的信号

43、来选择行动。这种由参与人的行动规则所构成的Nash均衡,就是Aumann定义的“相关均衡”(correlated equilibrium)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,相关均衡,给定一个有限n人战略式博弈G=,其中Ai为参与人i(i=1,2,n)的行动集。用=1,m表示状态(如“性别战”中的天气状况)集,Pi为参与人i关于状态集的一个分割,即,Control Science and Engineering,HUST All Rights Reserved,2007,Luo

44、Yunfeng,()为定义在状态集上的概率测度,即出现的概率。对,参与人i的战略i为从状态集到行动集的映射,即,它满足对,若 且,则 表示参与人战略的组合。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,相关均衡的定义,一个给定的有限n人战略式博弈 的相关均衡,包括:有限概率空间();,状态集的一个分割Pi;若 为相关均衡当且仅当对 和任意的i,有,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng

45、,例如,在前面对“性别战”的分析中,令=1,2(即天气状况集),Pi=1,2(即关于天气状况集的一个分割),(1)=0.5,(2)=0.5,战略i为所定义的夫妻双方根据天气状况选择娱乐项目的行动规则,即(F,F)、(F,B)、(B,B)和(B,F)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,容易验证:在含有天气状况的“性别战”博弈中的战略组合(F,B),(F,B),就是“性别战”博弈的一个相关均衡。同样,战略组合(F,F),(F,F)、(B,B),(B,B)和(B,F),(B,F)也是“

46、性别战”博弈的相关均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,再例如:,该战略式博弈存在两个纯战略Nash均衡(a1,b1)和(a2,b2),和一个混合战略Nash均衡(0.5,0.5),(0.5,0.5),其中混和战略Nash均衡的期望支付为2.5。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设参与人通过掷骰子的方法来决定参与人的行动。此时,骰子上出现的点数就是所谓的状态,所

47、以,令=1,2,34,5,6,其中i表示骰子上的点数为“i”(i=1,6)。此时,。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设双方约定:当出现奇数时,参与人1选择行动a1,参与人2选择行动b1;当出现偶数时,参与人1选择行动a2,参与人2选择行动b2。也就是,出现奇数时(a1,b1),双方选择均衡;出现偶数时,双方选择均衡(a2,b2)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng

48、,对于参与人j(j=1,2),构造参与人j关于状态集的分割;其中,,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,所以,参与人1存在以下四个战略:(1)战略 为满足如此条件的映射:对,对;(2)战略 为满足如此条件的映射:对,对;(3)战略 为满足如此条件的映射:对,对;(4)战略 为满足如此条件的映射:对,对。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,参与人2存在以下四个战略:,战略

49、为满足如此条件的映射:对,对;战略 为满足如此条件的映射:对,对;战略 为满足如此条件的映射:对,对;战略 为满足如此条件的映射:对,对。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在参与人1的四个战略中,战略 就是参与人1根据双方约定确定的战略;在参与人2的四个战略中,战略 就是参与人2根据双方约定确定的战略。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,构造战略式博弈,其中,=1,2

50、,博弈的支付如图所示。,骰子上点数为奇数时的支付,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,骰子上点数为偶数时的支付,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,参与人的期望支付,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,战略组合 为Nash均衡。这也意味着 为战略式博弈的相关均衡。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号