重复博弈同样结构的博弈重复多次课件.pptx

资源描述

《重复博弈同样结构的博弈重复多次课件.pptx》由会员分享，可在线阅读，更多相关《重复博弈同样结构的博弈重复多次课件.pptx（24页珍藏版）》请在三一办公上搜索。

1、第一节概述,一、含义1.含义：同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”（stage game）阶段博弈既可以是静态博弈，也可以是动态博弈。 “同样结构”的博弈是指相同的局中人集合、相同的可行行为空间或策略空间、相同的效用函数。若在每一阶段博弈的末期，局中人的行为可被观察到，那么局中人就有可能在对手过去行为的基础上，在下一阶段博弈采取相应的策略，由此可能导致的均衡结局与一次博弈的均衡不同。,2.重复博弈与序贯博弈的区别（123） “序贯博弈”（se-quential game）:参与人在前一个阶段的行动选择决定随后的子博弈的结构;从后一个决策结开始的子博弈不同于从前一个决策结开

2、始的子博弈，也即是，同样结构的子博弈只出现一次。重复博弈则是同样结构的博弈重复多次。重复博弈分为有限次重复博弈和无限次重复博弈。,3.重复博弈的基本特征：（1)阶段博弈之间没有“物质上”的联系（no physical links)，也就是说，前一阶段的博弈不改变后一阶段博弈的结构（对比之下，序贯博弈涉及物质上的联系）；（2)所有参与人都观测到博弈过去的历史（如在每一个新的阶段博弈，两个囚徒都知道同伙在过去的每次博弈中选择了抵赖还是坦白）；（3）参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。,由于其他参与人过去行动的历史是观测得到的，一个参与人可以使自己在某个阶段博弈的选择依赖于其

3、他参与人过去的行动历史，因此，参与人在重复博弈中的战略空间远远大于且复杂于在每一个阶段博弈中的战略空间，从而使重复博弈可能带来一些“额外的”均衡结果，这些均衡结果在一次博弈中是从来不会出现的。这正是分析重复博弈的意义所在。,4.影响重复博弈均衡结果的主要因素是:博弈重复的次数和信息的完备性（com-pleteness)。重复次数的重要性：来自于参与人在短期利益和长远利益之间的权衡。当博弈只进行一次时，每个参与人只关心一次性的支付；但如果博弈重复多次，参与人可能会为了长远利益而牺牲眼前利益从而选择不同的均衡战略。,信息的完备性的重要性：当一个参与人的支付函数（特征）不为其他参与人所知时，该参与

4、人可能有积极性建立一个“好”的声誉（reputation）以换取长远利益。本节我们只讨论重复次数对均衡结果的影响，有关信息的完备性的影响将在不完全信息动态博弈部分讨论。,二、几个基本概念,1.重复博弈的策略、子博弈和均衡路径在重复博弈中，博弈方的一个策略就是在每一阶段（即每次重复）针对每种情况（以前阶段的结果）如何行动的计划。重复博弈的子博弈是从某个阶段（不包括第一阶段）开始，包括此后所有阶段的重复博弈部分。动态博弈中各博弈方的策略组合对应一条路径，均衡策略组合对应一条均衡路径，这些路径由各个阶段轮到行动的博弈方的行为依次连接而成。重复博弈的路径即是由每个阶段博弈方的行为组合串联而成的。,2

5、.重复博弈博弈方的得益：要考虑整个重复博弈过程得益的总体情况。当重复次数较多，每次重复间隔时间又较长时，需考虑得益的时间先后。一般是将每一阶段的得益折算成当前阶段的得益（即现在值）的贴现值。贴现系数=1/（1+），为以一阶段为期限的市场利率。,方法1：计算重复博弈的“总得益”，即博弈方各次重复博弈的得益的总和；方法2：计算重复博弈各阶段的“平均得益”,第二节有限次重复博弈,一、有限次重复博弈的含义定理：给定一个基本博弈G（可以是静态博弈，也可以是动态博弈），重复进行T次，且在每次重复G之前各博弈方都能观测到以前博弈的结果，这样的博弈过程称为“G的T次重复博弈”，记为G（T）， G称为

6、G（T）的原博弈或阶段博弈， G（T）中的每次重复称为G（T）的一个“阶段”。,二、有限次重复博弈类型1.两人零和博弈的有限次重复博弈博弈方的最佳策略都是每一次博弈都重复原博弈的混合策略NE策略。2.存在唯一纯策略NE博弈的有限次重复博弈例：有限次重复的囚徒困境博弈有限次重复削价竞争博弈连锁店悖论（泽尔腾1978年提出）（124）,定理：设G是阶段博弈， G(T)是G 重复T次的重复博弈（T），那么，如果G有唯一的NE，则重复博弈G(T)的唯一子博弈精炼NE结果是阶段博弈G的NE重复T次，即每个阶段博弈出现的都是一次性博弈的均衡结果。,3.存在多个纯策略NE博弈的有限次重复博弈（1）存

7、在两个纯战略纳什均衡的有限次重复博弈（课本）三价博弈设一市场有两个生产同质产品的厂商，他们对产品的定价有高、中、低三种可能。,设高价时市场总利润为10单位中价时市场总利润为6单位低价时市场总利润为2单位。再假设两厂商同时决定价格，价格不等时价格低者独享利润，价格相等时双方平分利润。由此，两厂商对价格的选择就构成了一个静态博弈问题。,原博弈有两个纯策略NE：（M,M），(L,L)一次博弈结果不会出现效率最高的（H,H）在两次博弈中，则存在第一阶段采用（H,H）的SPNE。双方策略：对厂商1 ，第一次选择H；若第一次结果为（H,H），则第二次选择M;若第一次结果为其他，则第二次选择

8、L。厂商2的选择同厂商1 。,在上述双方策略组合下，两次重复博弈的路径为：第一阶段选择（H,H），第二阶段选择（M,M），这是一个SPNE路径。若重复N次，结论也相似，SPNE路径是：每次都选择（H,H），最后一次选择原博弈的NE（M,M）。,触发机制：首先试探合作，一旦发觉对方不合作，也用不合作相报复。触发机制是重复博弈中实现合作和提高均衡效率的关键机制。,第三节无限次重复博弈,与有限次重复博弈相比：一是是否存在最后一次博弈：对有限次重复博弈，存在最后一次重复是破坏重复博弈中博弈方和行为的相互制约关系，使重复博弈无法实现更高效率均衡的关键问题。二是无限次重复博弈必须考虑得益的贴现问

9、题，将每一期的得益折算成现值。对博弈方行为选择和博弈均衡的分析必须以平均得益或总得益的现值为根据。三是触发机制也是无限次重复博弈实现理想均衡的关键。,一、两人零和博弈的无限次重复博弈在这种无限次重复博弈中，博弈方仍是每次都采用原博弈的混合策略NE。,二、存在唯一纯策略NE博弈的无限次重复博弈如囚徒困境(课本)触发机制：第一阶段采取抵赖，在第t阶段，如果前t-1阶段的结果都是（抵赖，抵赖），则继续采取抵赖；否则，采取坦白。可以证明，当足够大时，双方采用上述触发机制构成一个无限次重复博弈的SPNE。,三、无限次重复古诺模型四、无限次重复博弈的无名氏定理无名氏定理（Friedman，1971）

10、：令G为一个n人阶段博弈，G(,)为以G为阶段博弈的无限次重复博弈，a*是一个NE（纯战略或混合战略），e=(e1,e2,.en)是a*决定的支付向量，U=(u1,u2,un)是一个任意可行的支付向量，V是可行支付向量集合。那么，对于任何满足uiei的uV(对任意i）,存在一个贴现因子(*)1，使得对于所有的 (*)，v=(v1,v2,.vn)是一个特定的子博弈精炼NE结果。,几个概念：1.纳什威胁点2.可行支付与可行支付集合3.保留支付或最小最大支付4.个人理性支付和个人理性可行支付集合,Fudenberg and Maskin 于1986年证明：无名氏定理中的均衡收益e=(e1,e2,.en)可以用保留收益来代替，结论仍成立。,

展开阅读全文