《博弈论通讲》PPT课件.ppt

资源描述

《《博弈论通讲》PPT课件.ppt》由会员分享，可在线阅读，更多相关《《博弈论通讲》PPT课件.ppt（77页珍藏版）》请在三一办公上搜索。

1、目录,第一章博弈论概述第一篇非合作博弈理论第二章完全信息静态信息博弈-纳什均衡第三章完全信息动态搏弈-子博弈精炼纳什均衡第四章不完全信息静态博弈-贝叶斯纳什均衡第五章不完全信息动态博弈-精练贝叶斯纳什均衡,第一章博弈论概述-人生处处皆博弈,博弈论（game theory，又译为对策论，游戏论）定义：研究决策主体的行为在直接相互作用时，人们如何进行决策、以及这种决策如何达到均衡。开始于-冯.诺曼（Von Neumann)与摩根斯坦(Morgenstern)在1944年合作的博弈论与经济行为（The Theory of Games and Economic Behaciour)19

2、94年纳什，泽尔腾，海萨尼因研究博弈论而获得当年的诺贝尔经济学奖博弈论由此而被大家所熟知1994,1996,2001,2005年博弈论四摘诺贝尔经济学奖,1.博弈论多学科交叉领域,博弈论研究的是：当成果无法由个体完全掌握，而结局须视群体共同决策而定时，个人为了取胜，应该采取什么策略博弈论成为通用方法论，经济学、政治学、管理、军事、外交、国际关系、公共选择、犯罪学“深蓝”和“更深的蓝”使用动态博弈理论编写程序，后来战胜了无敌的卡斯帕罗夫,2.为什么会有博弈？,博弈：决策主体在互相对抗中，对抗双方(或多方)互相依存的一系列策略和行动的过程集合参与人的利益有冲突博弈是一个过程集合(参与人、策略、行动

3、、信息等)。把博弈视为集合是思维从具体到抽象的重要一步博弈的一个本质特征是策略的相互依存性博弈论：专门研究博弈如何出现均衡的规律的学问,3.博弈论概念因素,博弈论分为合作博弈和非合作博弈合作博弈是指当事人达成了彼此合作协议非合作博弈是指一种参与者不可能达成具有约束力的协议的博弈类型，这是一种具有互不相容的情形。非合作博弈研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。博弈论的基本概念包括：参与人、行动、信息、战略、支付函数、结果、均衡,4.博弈论的要素,参与人是指博弈中选择行动以最大化自身利益（效用、利润等）的决策主体（如个人、厂商、国家）。行动是指参与人的决策变量。

4、战略是指参与人选择行动的规则，它告诉参与人在什么时候选择什么行动。例如，“人不犯我、我不犯人；人若犯我、我必犯人”是一种战略。这里，“犯”与“不犯”是两种不同的行动。战略规定了什么时候选择“犯”，什么时候选择“不犯”。信息是指参与人在博弈中的知识，特别是有关其他参与人（对手）的特征和行动的知识。由于博弈是由不同特征和行为知识的人来进行的，所以博弈中要研究的主要内容是对手人。如打麻将，要判断对手有什么牌，并根据其特征判断其可能会编排什么和，以决定自己的战略对策。如果只根据自己的牌来编排怎样去和，而不考虑对手可能有什么大和正在编排之中，不做相宜的应对，则必将失去利益（必输）。,4.博弈论

5、的要素,支付函数是参与人从博弈中获得的效用水平，它是所有参与人战略或行动的函数，是每个参与人真正关心的东西。结果是指博弈者感兴趣的要素的集合。均衡是所有参与人的最优战略或行动的组合博弈分析目的是使用博弈规则（参，行，结）决定均衡。,5.博弈论的条件,1、博弈论是两个或两个以上参与者之间的对策论2、参与人具有理性人假设理性人是指一个很好定义的偏好，在面临定的约束条件下最大化自己的偏好。博弈论说起来有些绕嘴，但理解起来很好理解，那就是每个对弈者在决定采取哪种行动时，不但要根据自身的利益的利益和目的行事，而且要考虑到他的决策行为对其他人可能的影响，通过选择最佳行动计划，来寻求收益或效用的最大化。,6

6、.博弈的数学表述(标准式）,例如：在两个寡头产量博弈里，企业是参与人，产量q是战略空间，利润u是支付。战略式表述博弈为：G=q10,q20;u1(q1,q2),u2(q1,q2),7.博弈论的种类,博弈有不同的种类：从行动顺序角度：静态博弈。参与人同时选择行动非同时行动但后行动者并不知道前行动者采取了什么具体行动；动态博弈。参与人的行动有先后顺序且后行动者能够观察先行动者选择的行动。从拥有信息角度：完全信息博弈。每个参与人对所有其他参与人的特征、战略空间、支付函数有准确的知识不完全信息博弈。,8.博弈的划分：,第二章完全信息静态信息博弈-纳什均衡,一.博弈的基本模型二.占优战略均衡，重复剔除的

7、占优均衡，混合战略纳什均衡三.纳什均衡应用举例,案例1-囚徒困境-纳什均衡,囚徒困境的故事讲的是，两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人：如果两人都抵赖，各判刑1年；如果两人都坦白，各判8年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判10年。于是，每个囚徒都面临两种选择：坦白或抵赖。,案例1-囚徒困境-纳什均衡,设定条件：（1）每个局中人都知道博弈规则和博弈结果的支付矩阵；（2）每个局中人都是理性的（个人理性和个人最优决策）；（3）不能“串通”,案例1-囚徒困境-纳什均衡,有限博弈1、参与人的个数是有限的；2、每

8、个参与人可选的战略是有限的。两个人有限博弈的战略表述可以用矩阵形式表述：,案例1-囚徒困境-纳什均衡,囚徒A,囚徒 B,坦白,抵赖,坦白,抵赖,-8大于-100大于-1,对于两个囚徒总体而言，他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时，都要冒很大的风险，代价很大（坦白，坦白）是纳什均衡,囚徒困境的性质：,个人理性和集体理性的矛盾；个人的“最优策略”使整个“系统”处于不利的状态。从“纳什均衡”引出“看不见的手”（国富论）的一个悖论：从利己目的出发，结果损人不利己。“纳什均衡”提出的悖论动摇了经济学的基石。从“纳什均衡”还可以悟出：合作是有利的“利己策略”，但它必须符合

9、以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是“己所不欲勿施于人”。,完全信息静态博弈：纳什均衡,囚徒困境的几个事例：价格大战（电视机）两个寡头企业选择产量公共产品的供给军备竞赛做广告围观时踮脚尖应试教育污染。1968年，格雷特哈丁成功地将“囚徒的困境”与资源耗竭结合起来,揭示了生态环境问题与囚徒困境的相似之处。贸易自由与壁垒，地方保护主义,案例2：智猪博弈,假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的分别是9

10、个单位和1个单位；大猪小猪同时到槽边，吃到的食物分别是7个单位和3个单位；小猪先到槽边，则大猪吃6个单位小猪吃4个单位。,等待,小猪,大猪,按,等待,按,案例2-智猪博弈,智猪博弈的例子,股市大户和小户（小户跟大户）大企业与小企业（创新研发模仿）公共产品供给（富户修路，穷户不修）,划线法：横向，如果“列”选中一个策略，在我的最佳策略下划线；纵向，如果“行”选中一个策略，在我的最佳策略下划线。某个策略组合中的两个支付之下都有横线，此即较为可能的解。如果这种解只有一组，此即上策均衡。,完全信息静态博弈：纳什均衡基本分析思路和方法,四纳什均衡,寻找纳什均衡,C2,R1,R2,C1,C3,R3,参

11、与人B,参与人A,（R3，C3）是纳什均衡,例3：性别战(battle of sexes),案例3.性别站,条件：两个人都不愿意分开两个纳什均衡先动优势所形成的“解”形成的机会,案例四斗鸡博弈(chicken game)(胆小鬼博弈),有两人狭路相逢，每人有两个行动选择：一是退下来，一是进攻。如果一方退下来，而对方没有退下来，对方获得胜利，这人就很丢面子；如果对方也退下来，双方则打个平手；如果自己没退下来，而对方退下来，自己则胜利，对方则失败；如果两人都前进，那么则两败俱伤。因此，对每个人来说，最好的结果是，对方退下来，而自己不退,例4：斗鸡博弈(chicken game)(胆小鬼博弈),

12、案例四斗鸡博弈,斗鸡博弈的例子,公共产品供给：富人修路修与不修（公共产品供给可能是囚徒困境也有可能是智猪博弈更有可能是斗鸡博弈，根据现实情况）冷战期间美苏抢地盘警察与游行队伍夫妻吵架,案例五:进入阻挠(entry deterrance）,这是产业组织经济学中的一个例子设想有一个垄断企业已在市场上（称为在位者），另一个企业虎视眈眈想进入（进入者）在位者想保持自己的垄断地位，所以就要阻挠进入者进入在这个博弈中，进入者有两种战略可以选择：进入还是不进入；在位者也有两种战略：默许或斗争假定进入之前垄断利润为，进入之后寡头利润合为（各得），进入成本为各种战略组合下的支付矩阵亦可列表,例：进入阻挠(en

13、try deterrance),案例五进入阻碍,这个博弈中有两个纳什均衡，即（进入，默许），（不进入，斗争）为什么（进入，默许）是纳什均衡？因为给定进入者进入，在位者选择默许时得单位利润，选择斗争时得不到利润，所以，最优战略是默许。类似的，给定在位者选择默许，进入者的最优战略就是进入尽管在进入者选择不进入时，默许和斗争对在位者是一个意思，只有当在位者选择斗争时，不进入才是进入者的最优选择，所以，（不进入，斗争）是一个纳什均衡，而（不进入，默许）不是一个纳什均衡。,纳什均衡是完全信息静态博弈的一般概念，也是所有其他类型博弈的基本要求占优战略均衡占优战略均衡就是指所有结果中只有一个最优解如果所有

14、参与人都有占优战略存在，则占优战略均衡是可以预测到的惟一的均衡囚徒困境中，坦白坦白就是占优战略占优战略只要求自己理性，不要求自己知道对方是不是理性,1.2 纳什均衡,占优战略均衡：不论其他人采取什么策略，A之某策略的结果总是最高，即为“占优战略”(dominant-strategy)。如果一个博弈的某个策略组合中的所有策略都是各方的上策，那么这个策略组合将是所有人都愿意选择的,必然是比较稳定的结果,这是“占优战略均衡”(dominant-strategy equilibrium)。反映了所有人的绝对偏好，因此十分稳定。,占优战略均衡（Dominant-Strategy）,占优战略均衡定义：在博

15、弈的战略表达式中，如果对于所有的i，Si*是i的占优战略，下列战略组合称为占优战略均衡：,占优战略均衡（Dominant-Strategy）,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式表述,等待,小猪,大猪,按,等待,按,案例2-智猪博弈,大猪有无严格占优战略？,占优战略均衡（Dominant-Strategy）,案例1-囚徒困境,囚徒A,囚徒 B,坦白,抵赖,坦白,抵赖,-8大于-100大于-1,-8大于-100大于-1,完全信息静态信息博弈-纳什均衡,一博弈的基本概念及战略表述二占优战略均衡三

16、混合战略纳什均衡四纳什均衡应用举例,混合战略纳什均衡,纯战略：参与人在每一个给定信息的情况下只选择一个特定的行动混合战略：参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动纯战略可视为混合战略的特例步骤：1.以混合策略为对象，重新定义效用函数，即期望效用函数再定义纳什均衡“流浪汉”的纳什均衡：政府以0.5救济，流浪汉以0.2找工作,混合战略纳什均衡,纯战略可以理解为混合战略的特例，即在诸多战略中，选该纯战略si的概率为1，选其他纯战略的概率为0。,等待,小猪,大猪,按,等待,按,反面,正面,反面,正面,案例1社会福利博弈,参与人是政府和流浪汉流浪汉有两个战略：寻找工作，游荡，

17、政府有两个战略：救济，不救济。政府想帮助流浪者前提后者必须试图找工作否则不予帮助，而流浪者能偷懒则偷懒只有在政府不帮助时才会选择找工作,五混合战略纳什均衡,流浪,流浪汉,政府,救济,不救济,寻找工作,即：流浪汉以0.2的概率选择寻找工作，0.8的概率选择游荡,同样，可以根据流浪汉的期望效用函数找到政府的最优混合战略。0.5,支付最大化法,五混合战略纳什均衡,假定最优混合战略存在，给定流浪汉选择混合战略（r，1-r），政府选择纯战略救济的期望效用为：3r+（-1）（1-r）=4r-1选择纯战略不救济的效用为：-1r+0（1-r）=-r如果一个混合战略（而不是纯战略）是政府的最优选择，一定意味

18、着政府在救济与不救济之间是无差异的。4r-1=-r r=0.2,流浪,流浪汉,政府,救济,不救济,寻找工作,支付等值法,五混合战略纳什均衡,对的解释：如果流浪汉以找工作的概率小于0.2,则政府选择不救济,如果大于0.2,政府选择救济,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略.对*=0.5的解释如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于0.5,流浪汉的最优选择是寻找工作.,五混合战略纳什均衡,混合战略纳什均衡的含义：纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中，*=0.5是唯一的混合战略纳什均衡。从

19、反面来说，如果政府认为流浪汉选择寻找工作的概率严格小于0.2，那么政府的唯一最优选择是纯战略：不救济；如果政府以1的概率选择不救济，流浪汉的最优选择是寻找工作，这又将导致政府选择救济的战略，流浪汉则选择游荡。如此等等。,纳什均衡应用举例,案例1 库诺特（Cournot）寡头竞争模型案例2 公共地的悲剧案例3 普林斯顿大学的一道习题,案例1 库诺特（Cournot）寡头竞争模型,企业1,企业2,参与人：企业1、企业2战略：选择产量支付：利润，利润是两个企业产量的函数,案例1 库诺特（Cournot）寡头竞争模型,qi：第i个企业的产量Ci（qi）代表成本函数P=P（q1+q2）：价格是两个企业产

20、量的函数第i个企业的利润函数为：,案例1 库诺特（Cournot）寡头竞争模型,（q1*，q2*）是纳什均衡意味着：,找出纳什均衡的方法是对每个企业的利润函数求一阶导数，使其为0。,案例1 库诺特（Cournot）寡头竞争模型,q2,q1,每个企业的最优产量是另一个企业的产量的函数。交叉点即纳什均衡点,案例1 库诺特（Cournot）寡头竞争模型,假定每个企业有不变的单位成本：,假定需求函数为：,最优化的一阶条件是：,解反应函数得纳什均衡为：,垄断利润为：,案例1 库诺特（Cournot）寡头竞争模型,为什么说库诺特（Cournot）寡头竞争模型是典型的囚徒困境问题？垄断企业的问题：,垄断企业

21、的最优产量：,垄断利润为：,寡头竞争的总产量大于垄断产量的原因是：每个企业在选择自己的最优产量时，只考虑对本企业利润的影响，而忽视了对另外一个企业的外部负效应。,案例2 公共地的悲剧,公共地的悲剧证明：如果一种资源没有排他性的所有权，就会导致资源的过度使用。公海捕鱼小煤窑的过度发展,案例2 公共地的悲剧,有n个农民的村庄共同拥有一片草地，每个农民都有在草地上放牧的自由。每年春天，农民要决定自己养多少只羊。gi：第i个农民饲养的数量，i=1,2,n.,n个农民饲养的总量,V:代表每只羊的平均价值,v是G的函数,v=v(G),因为每只羊至少要一定数量的草才不至于饿死,有一个最大的可存活量Gmax,

22、：当G0;当G=G(x)时,v(G)=0。,案例2 公共地的悲剧,当草地上羊很少时，增加一只羊也许不会对其他羊的价值有太大影响，但随着羊的不断增加，每只羊的价值将急剧下降。,参与人：农民战略：养羊的数量支付：利润,案例2 公共地的悲剧,假设一只羊的价格为c，对于农民i来讲，其利润函数为：,最优化的一阶条件为：,上述一阶条件可以解释为：增加一只羊有正负两方面的效应，正的效应是这只羊本身的价值v，负的效应是这只羊使所有之前的羊的价值降低。,案例2 公共地的悲剧,其最优解满足边际收益等于边际成本：上述n个一阶条件定义了n个反应函数：,因为：,所以：,案例2 公共地的悲剧,第i个农民的最优饲养量随其他

23、农民的饲养量增加而递减。n个反应函数的交叉点就是纳什均衡。,尽管每个农民在决定自己增加饲养量时考虑了对现有羊价值的影响，但是他考虑的只是对自己羊的影响，而并不是对所有羊的影响，因此，最优点上的个人边际成本小于社会边际成本，纳什均衡总饲养量大于社会最优饲养量。,第三章完全信息动态博弈,案例-房地产开发项目-假设有A、B两家开发商市场需求：可能大，也可能小投入：1亿,假定市场上有两栋楼出售：需求大时，每栋售价1.4亿，需求小时，售价7千万；如果市场上只有一栋楼需求大时，可卖1.8亿需求小时，可卖1.1亿,第二章完全信息动态博弈博弈战略表述,不开发,开发商A,开发,不开发,开发,不开发,开发商B

24、,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式表述,扩展式,开发,开发,开发,不开发,不开发,开发,不开发,不开发,开发,不开发,开发商B,开发商A,战略式,开发,(开发,不开发),路径在扩展式博弈中，所有n个参与人的一个纯战略组合决定了博弈树上的一个路径。（开发，不开发，开发）决定了博弈的路径为A开发B不开发-（1，0）（不开发，开发，开发）决定了路径：？,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0

25、,8),(0,0),(0,1),(0,0),参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布,房地产开发博弈,一博弈扩展式表述,博弈的基本构造结:包括决策结和终点结两类;决策结是参与人行动的始点,终点结是决策人行动的终点.结满足传递性和非对称性x之前的所有结的集合，称为x的前列集P（x），x之后的所有结的集合称为x的后续集T（x）。枝:枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择.信息集:每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:1 每个决策结都是同一个参与人的决策结;2 该参与人知道博弈进入该集

26、合的某个决策结,但不知道自己究竟处于哪一个决策结.,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B在决策时不确切地知道自然的选择;B的决策结由4个变为2个,房地产开发博弈,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0

27、,1),(0,0),B知道自然的选择;但不知道A的选择(或A、B同时决策),房地产开发博弈,一博弈扩展式表述,只包含一个决策结的信息集称为单结信息集，如果博弈树的所有信息都是单结的，该博弈称为完美信息博弈。自然总是假定是单结的，因为自然在参与人决策之后行动等价于自然在参与人之前行动但参与人不能观测到自然的行动。不同的博弈树可以代表相同的博弈，但是有一个基本规则：一个参与人在决策之前知道的事情，必须出现在该参与人决策结之前。,A,B,坦白,抵赖,B,B,A,A,坦白,抵赖,坦白,抵赖,(-8,-8),(0，-10),(-10,0),(-1,-1),坦白,抵赖,坦白,抵赖,坦白,抵赖,(-8,-

28、8),(0，-10),(-10,0),(-1,-1),囚徒困境博弈的扩展式表述,囚徒困境博弈的扩展式表述,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,在博弈中，人们经常采用威胁策略，但其他博弈方也会采取对威胁的辨别和反威胁策略。经济学家泽尔腾就将不可置信的威胁剔除出去，解决了一个博弈中可能存在多个“纳什均衡”的问题，从而使人们能方便地预测博弈的结果。举一个通俗的例子来说，父母不同意女儿所交的男友，威胁女儿说：“如果你再同他交往，我们就与你断绝关系。”但这样的威胁往往是不可信的。对爱情执着的聪明女儿会置父母的不可置信的威胁于不顾，继续与男友交往甚至最终与之结婚，父母最后也会承认那个当

29、初他们并不喜欢的女婿。这个结果便是剔除了不可置信的威胁后的“纳什均衡”，“博弈论”中称其为“子博弈精炼纳什均衡”。,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,子博弈：是原博弈的一部分，它本身也可以作为一个独立的博弈进行分析：（1）子博弈必须从一个单结信息点开始：只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时，该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结，则这两个都不可以作为子博弈的初始结（见下页）。（2）子博弈的信息集和支付向量都直接继承自原博弈，即当x和x在原博弈中属于同一信息集时，他们在子博弈中才属于同一信息集。习惯上，任何博弈的本身称为自身的

30、一个子博弈。,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,子博弈精练纳什均衡：扩展式博弈的战略组合是一个子博弈精练纳什均衡，如果:（1）它是原博弈的纳什均衡；（2）它在每一个子博弈上给出纳什均衡。,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，这条路径称为“均衡路径”，博弈树上的其他路径称为“非均衡路径”。纳什均衡只要求均衡战略在均衡路径的决策结上是最优的；而构成子博弈精练纳什均衡不仅要求在均衡路径上策略是最优的，而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈精练纳什均衡的实质区别。

31、,第四章不完全信息静态博弈和贝叶斯纳什均衡,案例1：市场进入博弈进入者不知道在位者的成本函数，只能猜概率如果你是高成本，我就进入,预期收益40，如果你是低成本，我就不进入。到底进还是不进？,期望利润:p40+(1-p)(-10).为保证不亏,期望利润为0,则p=0.2。大于0.2会赚钱。对p的判断就是“贝叶斯理念”,第四章不完全信息静态博弈-贝叶斯纳什均衡海萨尼（1967-1968）案例二：,不接受,求爱博弈：品德优良者求爱,求爱者,进入,不进入,接受,斗争,你,求爱者,进入,不进入,默许,求爱博弈：品德恶劣者求爱,你,100 x+（-100）（1-x）=0当x大于1/2时，接受求爱,对手

32、特征、战略空间,行动,第五章不完全信息动态博弈黔驴技穷,在博弈中，人们掌握的信息经常是不完全的，这就需要在博弈进行过程(即动态博弈)中不断地收集信息、积累知识、修正判断。成语故事“黔驴技穷”实际上就包含了一个不完全信息动态博弈。毛驴刚到贵州时，老虎摸不准这个大动物究竟有多大本领，因而躲在树林里偷偷观察，这在老虎当时拥有的信息条件下是一种最优策略选择。过了一阵子，老虎走出树林，逐渐接近毛驴，就是想获得有关毛驴的进一步信息。一天，毛驴大叫一声，老虎吓了一跳，急忙逃走，这也是最优策略选择。又过了一些天，老虎又来观察，并对毛驴挨得很近，往毛驴身上挤碰，故意挑衅它。毛驴在忍无可忍的情况下，就用蹄子踢老

33、虎，除此之外，别无它法。老虎最终了解到毛驴的真实本领后，就扑过去将它吃了。在这个故事里，老虎通过观察毛驴的行为逐渐修正对毛驴的看法，直到看清它的真面目。事实上，毛驴的策略也是正确的，它知道自己的技能有限，总想掩藏自己的真实技能。老虎吃掉毛驴的策略，在“博弈论”中就是所谓的“精炼贝叶斯均衡”。,第五章不完全信息动态博弈-精练贝叶斯纳什均衡泽尔腾（1965）,成语故事：黔之驴-驴虎博弈老虎通过不断试探来修正对毛驴的看法，每一步行动都是给定它的信念下最优的。最终将毛驴吃掉。,对手特征、支付函数、战略空间未知,行动,有先后,博弈论的一个例子,比如说政治参选，有左翼党和右翼党，两位参选人A、B，有立

34、场1、2、3、4、5、6、7、8、9，1代表极端左翼，9代表极端右翼，而选民成开口向下的二次函数分布（数据统计），每个选民会投自己所代表的立场，若没有参选人选择该立场，则投给相近立场的参选人。博弈的利益就是取得最大票数赢得选举。这个模型在美国尼克松和肯尼迪的时候利用过。肯尼迪通过较为中立的政治观点在1960年的大选中打败了尼克松，而尼克松也用了相似的办法在1968年获得了大选的胜利。同样，1997年，布莱尔总统也以较为保守的工党形象出场，扭转了工党连续几届大选失利的状况,博弈论在计算机科学学科的应用基于博弈论的传感器网络功率控制算法模型基于博弈论的C2C电子商务中诚信分析博弈论框架下P2P实时

35、流的合作模型研究基于博弈论的综合赋权法的信息安全风险评估基于博弈论的电子商务团购信任问题研究电子商务中企业行为的演化博弈论分析信息检索中博弈论方法的使用基于博弈论的隐私保护分布式数据挖掘博弈论在管理学方面的应用基于博弈思想的优化算法研究基于博弈论的ERP发展趋势研究基于博弈论的ERP发展趋势研究基于博弈论的交通控制与诱导一体化模型的研究基于博弈论的网格资源管理一种基于博弈论的智能QoS静态通信量疏导模式博弈论在ERP选型中的应用农产品物流企业的市场博弈分析与发展策略研究基于博弈论的流程再造实施策略研究“智猪博弈”与中小企业的创新基于博弈论的物联网语义社区演化模型博弈论在经济学中的应用从博弈论的视角来看待养老金入市问题基于博弈论的利率市场化条件下商业银行贷款定价行为研究博弈论视角下的物流金融信用风险管理上市公司股票期权激励制度的博弈论分析中国证券市场监管：基于博弈论视角的分析,

展开阅读全文