《第二章写在前面的话2》ppt课件.ppt

资源描述

《《第二章写在前面的话2》ppt课件.ppt》由会员分享，可在线阅读，更多相关《《第二章写在前面的话2》ppt课件.ppt（48页珍藏版）》请在三一办公上搜索。

1、1,东北财经大学数量经济系刘德海,博弈论前沿专题（Advances in Game Theory),2,第二章预备知识（2）,上一章主要内容：第一节博弈论学科的产生、发展和演变过程第二节博弈论与“理性”概念；本章主要内容：第一节博弈论的一些重要概念：经验主义,均衡,合作,信息第二节博弈的基本要素；第三节博弈模型的三种正规表述。,3,复习：作为一种数学分析方法，传统博弈对参与者的“理性”要求非常苛刻目标理性(主观理性):参与者追求自身利益的最大化(经济学理性的内涵)过程理性（具有理性的能力）：给定参与者对外部环境的信念后最大化自己的报酬，即“前后一致的”做出选择.可以分为两个

2、推理步骤：认知理性（cognitive）参与者对相关环境可获得的信息与形成的信念之间的一致性，即参与者具有对相关环境形成信念的能力；具体要求：参与者了解博弈的结构和规则、以及理性的“共同知识”（递推归纳法的基础）、作为不完全信息博弈均衡求解基础的贝叶斯理性（参与者对不确定性事物具有事前概率分布的判断，在动态过程中进行更新的贝叶斯决策）。工具理性（instrumental）参与者对外部给定的机遇与固定的偏好之间的一致性，即参与者具有从既定的信念推导出采取相应策略的能力。具体要求：参与者具有计算推理、预见、记忆、分析判断的能力（例：求解动态博弈均衡的递推归纳法），不会犯错误（例：颤抖手均衡要求犯错

3、误时仍具有稳健性）等。,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息,4,王国维人间词话三种境界：古今之成大事业、大学问者，必经过三种之境界：“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境也。“众里寻他千百度，回头蓦见，那人正在，灯火阑珊处。”此第三境也。,5,理论分析,实验检验,理性主义均衡分析传统博弈,演化主义均衡分析,机制设计理论、信息经济学,实验博弈,演化博弈,非合作博弈,合作博弈,不完全或不完美信息博弈,完全完美信息博弈,博弈论的理论体系:,经验主义,均衡,合作,信息,第二章预备知识（2）第一节

4、博弈论的一些重要概念：经验主义、均衡、合作、信息,静态博弈、动态博弈、重复博弈,6,博弈论与经验主义：博弈论并不是仅用于示意性说明的智力游戏，而是来源于社会现实中的矛盾冲突与合作。博弈模型需要经验证明：或者实验室进行；或者实地检验。(1)实验博弈：在可控的实验条件下进行有关策略相互作用的经验性研究。(2)通过分析经济社会的历史数据分析，可以对博弈模型的“理性”行为加以检验即计量革命。,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息1 经验主义,7,博弈中均衡（纳什均衡）的不同理解：观点1：参与者们采取的最佳应对策略一致同意达到的结果，其具有“可自我实施”（sel

5、f-enforcement）的特征（即：独自偏离均衡策略不会带来更好结果）。该观点认为，均衡是一种结果。观点2：博弈均衡，当且仅当每一个参与者对所有参与者的行为有正确的预期。该观点认为，均衡是一种信念。观点3：该观点认为，均衡是一种规则。因此，在理性假设下，三种观点是等价的（化蝶）。,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息2 均衡,8,均衡的存在性：纳什定理（1950，利用不动点定理证明）均衡的唯一性：非常不幸，经常面临的一个苦恼就是多个均衡同时存在（世界的多样性）非合作博弈理论的主要研究问题：多重均衡的精练问题选择（selection）与精练（perf

6、ection）选择问题：在非合作博弈中，一些威胁和承诺是不可信的（三马食槽故事、96军演威胁），如何选择那些能够实现一致预期的均衡结果；精练问题：对于博弈存在多重均衡的情况，如何判断哪些均衡更有可能实现。多重均衡的意义,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息2 均衡,9,资料夹三马食槽承诺的可信性：,明帝托孤托给曹爽与司马懿。曹爽党羽李胜要到荆州任刺史，临行前去拜望司马懿。司马懿假装病重，耳聋并且胡涂，曹爽等从此不再防备司马懿。魏帝曹芳离开洛阳去祭扫魏明帝的坟墓高平陵，曹爽兄弟均跟从。司马懿乘机上奏永宁太后，请废曹爽兄弟，史称“高平陵事变”。司马懿自己率

7、太尉等勒兵出迎天子，驻扎在洛水浮桥。桓范劝曹爽挟持皇帝到许昌去，发文书征调天下兵马勤王。曹爽优柔寡断，夜里遣人见司马懿，探听动静。司马懿乘机劝诱，朝廷只是免他的官职罢了，并以洛水为誓。顾及城中家小，欲信其言。桓范等人援引古今，百般劝谏无效。曹爽请皇帝下诏免去自己官职，随皇帝进入京城。曹爽兄弟一回府，即被司马懿派兵包围。不久，司马懿以谋反的罪名，杀曹爽及其党羽，并灭三族。后阮籍“天下无英雄，使竖子成名”思考：曹真的理性选择？（勤王）,10,96军演威胁威胁的不可信 96李登辉访美，抛出“两国论”。在台湾当局“总统”大选前大陆举行军事演习，预定落弹点台湾东部，美国出动航母战斗群。由于大陆高层军事将

8、领叛国提前泄露情报，李登辉指出导弹是空弹壳，叫嚣不怕。大选支持率反而上升。大陆放弃武力犯台，台湾以不独立回应承诺不可信这是典型的动态不一致的例子。因为给定大陆已经同意不武力防独的情况下，台湾没有必要再保持不独立的承诺，到那时，最佳的策略是独立。所以大陆先放弃武力犯台的威胁，台湾再以不独立回应大陆的善意不可能是一个子博弈均衡（Subgame perfect equilibrium).,资料夹台海局势中威胁与承诺的可信性：,11,经济学，报酬递增产生多重均衡多重均衡产生“路径依赖”现象，“锁定（lock-in）”在低效率的均衡：其中的一种均衡状态比另一种均衡状态有着更高的劳动分工和生产率水平，

9、但由于生产者之间的“协调失灵”，经济无法由低分工水平均衡跃迁到高分工水平均衡。举例：计算机键盘沿袭打字机,为防止机械机构纠缠故意设计别扭；现代类人猿锁定在进化死胡同中。比较优势理论的局限性：单一均衡，可以发挥比较优势，尽快收敛到工业化国家均衡点；对于多重均衡，农业技术运用上可能导致“传统农业技术陷阱”；国际分工当中可能导致“贸易陷阱”，被锁定在国际产业分工链的低端。,资料夹多重均衡的意义：,S,D,Q,P,供给S增加，同时价格P下降,12,博弈均衡是如何形成的？Nash在其博士论文“Non-cooperative games”（1950年）给出Nash均衡的两种解释，一种是“理性主义”的、内省

10、的、演绎的传统解说均衡是通过理性的参与者进行严密的逻辑演绎推理得到的，对参与者的理性能力有较高要求（传统博弈分析，顿悟）。一种是学习的、归纳的、演化的解说当时没有很好的方法构建数学模型（国际上90年代兴起演化博弈理论，渐悟）。,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息2 均衡,13,资料夹佛教禅宗六祖慧能“顿悟”：,六祖慧能原在一家小旅馆里打杂，有一天在给客人收拾东西的时候听客人在念金刚经。六祖慧能听罢便觉其中奥义博大，于是决心出家为僧。他投在五祖弘忍门下，每日做些杂务。有一日，五祖要门下众人将自己领悟的佛法写做一偈，大弟子神秀在门前徘徊许久，又返回居所。

11、后来在墙上写的是：身若菩提树，心如明镜台。时时勤拂拭，莫使惹尘埃（渐悟）。弟子们看见了十分钦佩。五祖看了，却说他还没有领悟佛法的真谛。众弟子自然不明白其中的道理。又一日，有游客入寺。慧能请求游客帮忙，游客问他你为什么不自己写呢？慧能说我不识得字。游客笑他说：你连字都不识还能领悟佛法？慧能说我能否领悟，你看偈语便知道了。游客笑道：那好，你若能领悟，别忘记引我入法门啊！于是，慧能说，那游客写道：菩提本无树，明镜亦非台。本来无一物，何处惹尘埃？（顿悟）众人看后大惊，才知慧能果然领悟了佛法真谛！就这样，五祖将衣钵传与六祖慧能。而神秀则是北派佛教一代宗师！,14,理性主义的均衡实现：均衡形成的“理性主义

12、”的传统博弈观点，认为均衡形成纯粹是一个高度理性的智力游戏，并在瞬间实现了均衡。思考：该实现途径是否合理？实验检验分钱博弈：两个参与者对100美圆协商进行分配，如果无法达成一致意见，则都得不到。理论分析结果：在0，100之间的连续集合上有无限多均衡。实际结果将是50：50因为这一均衡具有符合公平的社会原则特点，成为吸引注意力的焦点。解决方法：Schelling（1960）提出焦点理论（focal-point）多重均衡中考虑公平、效率、对等原则等社会和文化习俗因素。解读：该观点是在个体“冰冷的”理性选择中（经济学规范），引入了社会准则的伦理道德（社会学规范）。,第二章预备知识（2）第一节博弈

13、论的一些重要概念：经验主义、均衡、合作、信息2 均衡,15,演化主义的均衡实现：真实世界中，有限理性的人们，行为具有模仿、经验主义的、惯例特征，从错误和尝试中进行学习。（80年代改革“摸石头过河”）由于实际中会发生重复，时间弥补了较弱的理性。在学习过程中，有限理性的参与者在观察对手的行动后，根据一些实用主义的修正原则（各种动态调整过程），修改关于对手未来采取行动的预期。一个有意思的结果：如果动态的过程是收敛的，则将趋向于传统博弈的均衡点。即使参与者行为是有限理性的，群体行为的演化最终也学会达到理性均衡。（真实世界里的市场经济图景）根据进化论的均衡观点，传统博弈对多重均衡进行精练没有太大意义，因

14、为真实世界中的均衡来自于历史演化的初始条件和演化过程中引起突变的一些随机事件。,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息2 均衡,16,Maynard Smith(1982)等研究鹰鸽博弈等生物种群竞争现象，构造了基本分析框架。每个参与者代表一个种群，随机组合匹配，进行预先规定好收益的要素博弈；少部分参与者的策略产生突变（试错法）；大部分参与者根据不同的学习规则进行模仿，其中最有效率的参与者经选择过程得以大量复制；（物演天择，适者生存）演化主义基于群体行为的均衡判断标准：当群体发生少部分突变策略产生入侵，造成不同策略的分布构成发生一个很小的变化后，仍能维

15、持原稳定构成。演化博弈理论成为90年代以来博弈论最为活跃的一个领域之一，并应用在经济社会体制的起源和多样性、互补性演化研究中。,资料夹演化主义均衡形成观的生物学起源：,17,非合作博弈：除了规则允许的协议以外，参与者之间无法达成有约束力的协议，作出的威胁、许诺是无法强制实施的，因此参与者只能根据“可察觉到的自我利益（perceived self-interest）”决策.例子：一次性囚徒困境博弈中攻守同盟的瓦解在非合作博弈中，仍可以出现内生的合作行为：1 无名氏定理揭示出，无限次重复博弈可摆脱“囚徒困境”；2 考虑声誉效应后，可以在有限次重复博弈中实现合作 3 互惠机制 4 复杂网络上的演化博

16、弈,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息3 合作,18,合作博弈：参与者之间的协议是有完全约束力并能够实施的，即外生给定的。合作博弈研究的主要问题：如何实现有约束力的协议的参与者之间无冲突的串谋？不同于非合作博弈主要分析个人行为，合作博弈分析的是参与者形成什么样的联盟？如何瓜分合作的收益？如果合作能够带来收益，但不是所有参与者都接受分配方案，则假定存在强制实施协议的外在机制（制度、仲裁者等）举例：我国汽车行业的串谋,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息3 合作,19,思考：人类进入信息社会，什么是信息？1948

17、年，信息论奠基人之一香农（Shanon,美国数学家）第一个以信息公式的方式定义“信息是熵的减少”，这里用到的“熵”是不确定性的度量。实际上该定义是说，信息是“用来消除不确定的东西”。控制论的奠基人维纳（Wiener）1948年指出：“信息就是信息，不是物质，也不是能量”。专门指出了信息是区别于物质与能量的第三类资源。知识管理中，信息是用语言、文字、数字、符号、图象、声音、表情、状态等方式传递的内容。思考：信息知识智慧？,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息4 信息,20,博弈论中的两种信息特性:完美信息（perfective information）参

18、与者在选择行动时了解以前的历史，并且双方没有同时行动。“纵有千古”少年中国说举例：玩跳棋时的信息？喝酒猜拳的信息？完备信息（complete information）参与者对博弈的信息是否完全了解，又称完全信息。当各个要素（参与者、规则、得益、策略）都是共同知识时，为完备信息。“横有八荒”少年中国说根据博弈的信息特征，传统博弈理论分为：完全完美信息博弈、不完全或不完美信息博弈,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息4 信息,21,信息问题在传统博弈理论中占据着核心地位：由于私人信息的存在造成不完全信息小典故：庄子与惠子游于濠梁之上。庄子曰：“儵鱼出游从容

19、，是鱼之乐也？”惠子曰：“子非鱼，安知鱼之乐？”庄子曰：“子非吾，安知吾不知鱼之乐？”庄子。秋水产生了参与者的道德风险行为和逆向选择行为，导致效率损失（人民公社后期低效率）。为此，要设计一种激励相容的机制（博弈规则），机制设计理论信息经济学,第二章预备知识（2）第一节博弈论的一些重要概念：经验主义、均衡、合作、信息4 信息,22,初期50、60年代合作化高效率数据，“傻子”雷锋原因：共产党人的革命理想主义和群众的热情，不符合经济学的“自私”人性假设。（当今河南的南街村）后期70年代人民公社低效率由于集体行动中私人信息的存在，造成考核时信息不完全，计时制道德风险行为：走后门，偷懒；逆向选择行

20、为：出工高的反而是笨手，前苏联发起反酗酒运动80年代大包干的激励机制分散劳动，交足国家的，剩下都是自己的。农民的劳动和自身利益直接挂钩，激励相容问题：分散劳动与农业机械化大生产的矛盾、水利设施等建设、勤劳能致富吗？,资料夹人民公社后期低效率一个信息问题的例子：,23,参与者（player）：可以是个体（包括自然人和企业、国家、国家集团等团体）、群体（演化博弈）；包括自然（此时为决策问题）；自然：指决定外生的随机变量的机制。为分析方便引入，自然作为虚拟参与人没有自己的支付和目标函数（即所有结果对它是无差异的）；参与人决策的后果依赖于自然的选择。在不完全信息博弈中，自然选择参与人的类型。,第二章

21、预备知识（2）第二节博弈的基本要素,24,行动（action）：参与者在某个时点的决策变量，用Ai表示第i个参与人的一个特定行动；行动的顺序：行动的顺序对于博弈的结果是非常重要的，事实上，不同的行动顺序意味着不同的博弈。一般假设参与者的行动空间和行动顺序是所有参与者的共同知识，但是对参与者采用某一具体行动的信息可以是不完备的。静态博弈（static game），又称同时行动博弈（simultaneous-move game）：参与者们同时行动（或秘密行动），且独立行动（参与者做出决策前无法获得其他人的决策信息）。思考：此时的信息特征？（不完美信息）动态博弈（dynamic game），又称序

22、贯行动博弈：不同参与者具有先后行动顺序，并能够为对方观察到。,第二章预备知识（2）第二节博弈的基本要素,25,策略（strategy）：参与者在给定信息集的情况下选择行动的规则，它规定参与者在什么情况下选择什么行动，是参与者的“相机行动方案”，包括参与者采取行动的完整描述。对于静态博弈，策略等于行动；对于动态博弈，策略针对不同情况由一系列不同阶段分别采取的行动构成。“敌不犯我，我不犯敌；敌若犯我，我必犯敌”理解：策略可以理解成指示参与人进行博弈的一系列指令，必须毫无遗漏；参与人按照指令参与博弈，本身没有任何主观的直觉判断意图。相当于计算机按照既定程序运行，从而简化了行为的分析思考：理性限制

23、使得参与者的思考过程机械化,从而实现数学建模,第二章预备知识（2）第二节博弈的基本要素,26,收益（或者支付，payoff）：参与者采取某一策略所对应的结果；假定支付代表了参与者对博弈结果的主观评价，此时等价于效用(utility),直接反映了参与者对风险的评价（决策理论中期望效用函数的凹凸程度代表对风险态度，凹的表示风险规避的）;如果实验博弈等研究参与者对风险态度时，支付不同于效用。规则（rule）：外生规则：行动结果；内生规则：即均衡规则的学习（rule learning）博弈的外部环境（environoment）：外部环境的改变将影响博弈均衡,第二章预备知识（2）第二节博弈的基本

24、要素,27,讨论：效用函数=支付函数？,对公平分配规则的感受：“In addition to purely selfish subjects,there are subjects who dislike inequitable outcomes”.见Fehr和Schmidt(1999)A theory of fairness,competition,and cooperation,刘德海群体性突发事件产生根源的多阶段动态博弈分析，运筹与管理2011,互惠模型：Dufwenberg和Kirchsteiger(2004)在扩展式博弈中分析，参与者i的效用是物质支付与心理互惠支付的加总,28,对弈：

25、,第二章预备知识（2）第三节博弈模型的三种正规表述,仙人对弈图（局部放大图，作者：陈玉圃）,29,“策略式”模型(Shapley,1973采用这一术语，最初采用“标准式”)策略式表述模型是把每一可行的策略向量与支付向量相联系的函数（X1,X n；u1,u n）。“策略式”表述模型必须说明：（1）参与者集合A,B；（2）每个参与者的可行策略集合N,NP；（3）每个参与者采取某一可行的行动组合时，所获得的支付。策略式博弈的均衡求解方法：划线法其中，均划线的组合即为双方一致同意的结果：纳什均衡,第二章预备知识（2）第三节博弈模型的三种正规表述,30,“策略式”模型的几点说明：混合策略：

26、参与者随机地在所有可行策略集中选出要采取的策略。其中，p j 为参与者选择纯策略 x j的概率：不确定性来源：（1）一个外部的偶然行动介入博弈；（2）参与者对策略进行随机化。策略式表述模型用于双人、有限博弈比较方便（表示为双矩阵,by-matrix）；策略式模型中所有参与者一次性选择策略，仅适用于静态博弈问题。,第二章预备知识（2）第三节博弈模型的三种正规表述,31,静态混合策略的示例：守卫与小偷博弈均衡点计算：假设小偷采取偷窃策略的概率为pA，则采取不偷策略的概率为(1-pA)；守卫采取睡觉和不睡觉的收益相等：分析：小偷偷窃的均衡概率p*A与守卫疲劳程度S成正比，与守卫失窃后惩罚D成反比

27、。小作业：求守卫睡觉的混合均衡概率？（试一试）,睡觉,不睡觉,守卫,小偷,32,小作业：求守卫睡觉的混合均衡概率？,第二章预备知识（2）第三节博弈模型的三种正规表述,睡觉,不睡觉,守卫,小偷,分析：守卫睡觉的均衡概率p*B与小偷被抓体罚P成正比，与看管物品价值V成反比,33,动态决策（序贯决策）问题：决策树是由决策点、事件点和结果构成的树图；采用逆序解法；决策准则常为最大收益期望值准则EMV。决策问题是博弈的一种特例，其中一方是自然参与者。,第二章预备知识（2）第三节博弈模型的三种正规表述,34,“扩展式”模型(Von Neumann和O.Morgenstern，1944)扩展式表述模

28、型描述参与者的行动顺序和采取行动时拥有的信息“扩展式”表述模型必须说明：（1）参与者集合；（2）该轮到谁采取行动；（3）在他（她）的每个信息集中，可以选择什么；（4）在他（她）做出决策时，知道什么；（5）每个参与者采取某一可行的行动组合时，所获得的支付。思考：静态博弈是否可采用扩展式表述模型？,35,扩展式博弈用博弈树（game tree）表示：结点：包括初始结点、决策结点(作出决策)、终结点(对应参与者报酬)；若结点是有限的，则称有限次博弈。枝：从一个决策结到它的直接后续结的连线,每一个枝代表参与者的一个行动选择；信息集：一个参与者无法作出区分的最大决策点集合（如图，囚徒B无法判断A的行动，

29、因此其信息集为虚线连接）。,第二章预备知识（2）第三节博弈模型的三种正规表述,36,“扩展式”模型的几点说明：当事件中有偶然因素介入时，在初始结点引入“自然”参与者，因为偶然因素等价于“自然”在参与人之前行动但参与人不能观测到。完美回忆（perfect recall）通俗描述：当轮到某个参与者行动时，从不会忘记过去知道什么，做了些什么。标准描述：在博弈树的每个信息集处，每个参与者知道以前的所有信息集，和在那些信息集所做的决策完美信息：参与者在选择行动时了解以前的历史（即完美回忆），并且没有同时行动。如果博弈树的所有信息都是单结的，该博弈称为完美信息博弈。,第二章预备知识（2）第三节博弈

30、模型的三种正规表述,37,2006-3-7,37,扩展式博弈的子博弈定义：（1）开始于博弈树一个结点，该节点对应一个单独信息集；（2）包含从节点开始的博弈树整个部分；（3）从不分割一个信息集(如不完全信息时要全部包括)子博弈完美均衡的定义：一个纳什均衡是子博弈完美纳什均衡，当且仅当该策略的每一个子博弈都产生一个纳什均衡，无论实际中是否能到达。理解：不仅博弈在整体上是纳什均衡，而且每一个小步骤都是纳什均衡。子博弈完美均衡存在性定理（Selten,1965）：每个扩展式、完美信息博弈至少有一个纯策略子博弈完美纳什均衡。,动态博弈的求解：子博弈完美均衡,38,2006-3-7,38,动态博弈的求解：

31、子博弈完美均衡,大陆,(2,2)(3,1)(0,0),台独分子,r维持现状 l推动台独,k口头抗议 h台海战争,子博弈完美纳什均衡的求解过程：根据“共同知识”假设，参与者能够预见最后一期行动，因此采取后退归纳法分析；子博弈完美纳什均衡概念包含了后退归纳法的思想，即从最后一个子博弈的结点出发，分析最佳策略（纳什均衡）；依此类推，直至博弈开始阶段，得解。例子：最后子博弈中，大陆收益比较:10，发动台海战争；最初的子博弈中，台独收益比较:32，(推动台独，口头抗议),39,2006-3-7,39,应用（动态博弈）：低碳政策设计,低碳减排政策可分为两类：（1）惩罚性政策。如，政府推出实行排污权有偿取得

32、、提高排污收费标准、征收碳税等。（2）激励性政策。如，政府提供低息贷款、技术扶持、产品优先采购、税收优惠等政策，鼓励企业进行节能减排；政府如何针对高能耗企业设计合适的减排政策？,40,动态博弈的求解：子博弈完美均衡,政府面临着三个策略减排补贴;中性政策;征收碳税；企业面临着两个策略减排;保持现状；减排的社会收益r，企业减排成本为c,政府补贴为s,碳税为t假设：政府提供补贴s过低，不足于弥补减排成本c，c s，同时政府征收较高碳税，t c求解：子博弈完美纳什均衡？,41,动态博弈的求解：子博弈完美均衡,企业j,保持现状M,政府i,减排R,减排补贴S,征收碳税T,保持现状M,减排R,保持现状M,减

33、排R,中性N,(r-s,s-c)(0,0),(r,-c)(0,0),(r,-c)(t,-t),已知：政府提供补贴s小于减排成本c：c s，政府征收较高碳税c大于减排成本：t c逆推归纳法：最后一阶段，企业分别选择：保持现状，保持现状，减排；第一阶段，政府选择：征收碳税。均衡路径征收碳税，减排，均衡结果（r，-c）,42,练习1：“扩展式”表述模型的一个例子双人博弈中，每人都有两种行动，参与者1先行。,a 参与者2知道1的行动；b 参与者2不知道1的行动；c 有偶然行动，且2不知道1的行动,N是否下雨,1,2,第二章预备知识（2）第三节博弈模型的三种正规表述,43,练习2：剪刀-石头-布：双

34、人博弈中，同时行动，每人有三个策略（石头Rock、剪刀Scissors、布Cloths）,思考：如何用扩展式表述模型？,1,2,C,第二章预备知识（2）第三节博弈模型的三种正规表述,44,CSSCI核心期刊,文献阅读：,45,高速公路交通管理部门与稽查人员存在小偷与门卫的博弈。假定交管部门监督（supervise）需要一定的花费成本C，其支付给稽查工作人员的薪水为s。如果交管部门进行有效监督，发现稽查人员舞弊（malpractices）则采取惩罚措施p，如开除公职，促使稽查人员努力敬业（law-abiding）。如果交管部门不进行有效监督，敬业人员收益为0；舞弊人员产生贿赂收益b。如此长期

35、下去，导致高速公路一直遭受超载超限运输以致于发生一个巨大的成本花费M去维修，这远远超过了交管部门监督所花费的成本，即MC。,46,存在着混合纳什均衡策略：交管部门以概率 b/(p+b)进行监管；稽查人员以概率(p+M-C)/(p+M)敬业。,47,图4.高速公路超载问题治理过程的动态博弈模型分析图4中交管部门、稽查人员和运输业主等各利益相关方不同策略的均衡路径选择,48,本章总结：,博弈论各个分支的构成；形成博弈均衡的两种解释理性主义和演化主义；博弈的基本要素参与者,行动,策略,支付,规则,环境；三种博弈表述模型适用范围策略式；扩展式；联盟式;几个重要的概念：（1）选择与精炼；（2）同时行动博弈和序贯行动博弈；（3）完美回忆和完美信息；（4）参与者决策不确定的来源；（5）合作博弈的特征函数；课后阅读（一些相关资料可从网络课程中下载）：我国医药价格过高的行业串谋行为。,

展开阅读全文