重复博弈和无名氏定理.ppt

资源描述

《重复博弈和无名氏定理.ppt》由会员分享，可在线阅读，更多相关《重复博弈和无名氏定理.ppt（17页珍藏版）》请在三一办公上搜索。

1、重复博弈和无名氏定理,动态博弈的另一种特殊但是非常重要的类型就是所谓的“重复博弈”。顾名思义，重复博弈是指同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”,有限次重复博弈：连锁店悖论,考虑市场进入阻挠博弈,现在假定同样的市场有20个（可以理解为在位者有20个连锁店），进入者每次进入一个市场，博弈就变成了20次重复博弈。假定进入者先进入第一个市场，在位者应该如何反应？大家可能会猜想，尽管从一个市场上看，在位者的最优选择是默认，但因为现在有20个市场要保护，为了阻止进入者进入其他19个市场，在位者应该选择斗争。,在这个博弈中，在位者选择斗争的惟一原因是希望斗争能起到一种威摄力量，使进入者不敢

2、进入。但在有限次重复博弈中，斗争并不是一个值得置信的威胁。该博弈的惟一子博弈精炼均衡是：在位者在每一个市场上都选择默许，进入者在每一个市场上选择进入。,囚徒困境与市场进入阻挠博弈类似。只要博弈重复的次数是有限的，最后阶段的惟一纳什均衡就是两个囚徒都选择坦白；逆向归纳法意味着“总是坦白”是惟一的子博弈精炼均衡。上述结果表明：只要博弈的重复次数是有限的，重复本身并不改变囚徒困境的结果。,无限次重复博弈和无名氏定理,当博弈重复无穷次而不是有限次时，存在着完全不同于一次博弈的子博弈精炼均衡。,考虑囚徒困境博弈，假定博弈重复无穷次。,考虑下列所谓的“冷酷战略”：（1）开始选择沉默；（2）选择沉默直到有一

3、方选择坦白，然后永远选择坦白。根据这个战略，一旦一个囚徒在某个阶段博弈中选择了坦白，之后他将永远选择坦白。,我们首先证明冷酷战略是一个纳什均衡。我们将证明不论囚徒j是否选择冷酷战略，冷酷战略始终是i的最优战略。假定囚徒j选择上述冷酷战略，冷酷战略是不是囚徒i的最优战略呢？令为贴现因子（假定两人的贴现因子相同）。如果i在博弈的某个阶段首先选择了坦白，他在该阶段得到0单位的支付。但他的这种行为将触发囚徒j的“永远坦白”的惩罚，因此，i随后每个阶段的支付都是-6。因此如果给定下列条件满足，假设j没有选择坦白，i将不会选择坦白：,或,解上述条件得：,也就是说，如果,，给定j坚持冷酷战略并且j没有,首先

4、坦白，i不会选择首先坦白。,现在假定j首先选择了坦白，那么i是否有积极性坚持冷酷战略惩罚j的不合作行为呢？假定j坚持冷酷战略，j一旦坦白将永远坦白；如果i坚持冷酷战略，他随后每阶段的支付是6，但如果他选择任何其它战略，他在任何阶段的支付不会大于6，因此不论为多少，i有积极性坚持冷酷战略。类似的，假定j坚持冷酷战略，即使i自己首先选择了坦白，坚持冷酷战略也是最优的。,这样，我们就证明了冷酷战略是一个纳什均衡。接下来的任务是证明这个纳什均衡是一个子博弈精炼纳什均衡，即在每一个子博弈上构成纳什均衡。因为博弈重复无限次，从任何一个阶段开始的子博弈与这个博弈的结构相同。在冷酷战略纳什下，子博弈可以划分为两类：A类，没有任何人曾经坦白；B类，至少一人曾经坦白。我们已经证明，冷酷战略在A类子博弈中构成纳什均衡。在B类，根据冷酷战略，参与人只是重复单阶段博弈的纳什均衡，它自然也是整个子博弈的纳什均衡。,由此我们证明，如果=1/6，冷酷战略是无限次重复博弈的一个子博弈精炼纳什均衡，帕雷托最优（沉默，沉默）是每一个阶段的均衡结果，囚徒走出了一次性博弈的困境。,实际上，也存在一些其它的战略使得当事人之间实现合作。大众定理：存在无穷多对战略，可以成为无限次重复博弈的平衡点，并同时实现双方的合作。,其他的战略,恕道战略恶棍战略流氓战略傻客战略,

展开阅读全文