第四章进化博弈论ppt课件.ppt

资源描述

《第四章进化博弈论ppt课件.ppt》由会员分享，可在线阅读，更多相关《第四章进化博弈论ppt课件.ppt（26页珍藏版）》请在三一办公上搜索。

1、4.1 有限理性与进化博弈论,然而，完全理性在现实中很难满足，当社会经济环境和决策问题较复杂时，人们必须存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响，有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。进化博弈分析是有限理性博弈分析的基本框架。,4.1.1 进化博弈的基础假设有限理性,传统的博弈均衡，例如Nash均衡及其精炼是以完全理性都是共同知识(common knowledge)为前提的。,第四章进化博弈论,4.1.2 有限理性及其对博弈的影响,有限理性局中人：不满足完全理性假设的局中人有限理性意味着一般至少有部分局中人不会采用完全理性博弈的均衡策略有限理性意味着

2、均衡是不断调整和改进而不是一次性选择的结果，而且即使到达了均衡也可能再次偏离有限理性局中人会在博弈过程中学习博弈通过试错寻找较好的策略,4.1.3 合作的行为生态,动物的适应性是在和生存环境的相互作用中形成的。在竞争中，动物最终选择进化稳定策略（Evolutionary Stable Strategy，简称ESS）该策略是被种群大多数成员所采取的，而且不会受到其它对策的侵蚀。一种ESS一旦确立，社会稳定下来，偏离的行为将会受到自然的惩罚。有利它主义和合作行为在动物界普遍存在。该行为也可能发生在没有亲缘关系的情况：如共生现象。,在有限理性博弈中具有真正稳定性和较强预测能力的均衡，必须是能够通

3、过博弈方的模仿、学习的调整过程达到的，具有能经受错误偏离的干扰的均衡，是在受到少量干扰后仍然能够“恢复”的均衡。,4.1.4 有限理性博弈的分析框架,4.1.4 有限理性博弈的分析框架,最优反应动态：有快速学习能力的小群体成员的反复博弈复制动态：学习速度很慢的成员组成的大群体随机配对的反复博弈进化稳定策略（ESS）,4.2 最优反应动态,4.2.1 协调博弈的有限博弈方快速学习模型4.2.2 古诺调整过程,4.2.1 协调博弈的有限博弈方快速学习模型,两个NASH均衡，但考虑到对对方理性的信任问题，风险态度等因素，可能选(A,A)。,考虑5个有限理性

4、的局中人之间，相邻局中人相互博弈，快速学习并动态调整。,反应、策略调整规则推导,最优反应动态模拟：初次博弈1个A,初次博弈相邻2个A,初次博弈相连3个A,5.2.2 古诺调整过程,古诺模型反应函数,1 2 3 4博弈方1 2.5 1.5 2.125 1.875博弈方2 3 1.75 2.25 1.9375,问题：两寡头始终假设对方产量不变,最优反应动态模拟,收敛条件,4.3 复制动态和进化稳定性：两人对称博弈,设某一群体进行随机配对重复博弈，且该博弈为对称博弈，即群体中个体无角色区分，所有个体均具有相同的战略空间。,这时博弈分析的核心不是博弈方的最优策略的选择，而是有限理性的博弈方组成的群体成

5、员的策略调整过程、趋势和稳定性，这里的稳定性是指采用特定策略的成员的比例不变，而非某个博弈方的策略不变。,引例：签协议博弈的复制动态和进化稳定策略,签协议博弈：,在有限理性的前提下，并非所有的局中人开始就能找到最佳策略（y,y）。下面分析（y,y）是ESS。假设群体中采用“同意”比例为 x，则不同策略期望得益和总平均得益为：,所以，除x=0外，有：,在不断的重复博弈过程中，只要局中人有基本的判断能力，早晚会发现该差异。于是，得益较差的局中人会或早或迟模仿另一方。这意味着两种类型局中人的比例x和1-x不是固定不变的，而是时间的函数：x(t)和1-x(t)。,局中人策略类型比例的动态变化是进化博弈

6、分析的核心。,上述比例动态变化的速度取决于模仿的速度。该速度取决于两个因素：（1）被模仿对象的数量大小（可用x表示）；（2）被模仿对象的成功程度（可用模仿对象的期望得益超过平均得益的幅度表示，即）。,所以，上述比例动态变化的速度可以表示为下列微分方程：,以采用“同意”策略类型局中人的比例为例，其动态变化速度可用下列微分方程反映：,动态微分方程的相位图,稳定状态、不动点：x*=0,x*=1,结论：（1）当x=0时，dx/dt=0，是稳定状态。其意义为，开始没有人采用“同意”策略，就没有学习模仿的榜样，因此所有的局中人不会有意识的改变策略。（2）当x0时，dx/dt 0，则x呈增加趋势，直至x=1

7、达到稳态。其意义为，只要开始有人采用“同意”策略，最终所有的局中人都趋于采用“同意”策略。,进化稳定策略的检验,虽然x*=0,x*=1均为稳态，但不一定都是ESS。验证如下：,结论：（1）一个稳定状态必须对微小扰动具有稳健性才能称为进化稳定策略（ESS）。即，作为稳定策略的x*，除了本身必须是稳定状态以外，还必须具有这样的性质，那就是如果某些局中人由于偶然的错误偏离了它们，复制动态仍然会使x恢复到x*。（2）在数学上，ESS相当于要求：,或：,所以，从复制动态方程的相位图来看，ESS为与水平轴相交且交点切线斜率为负的点。,例如，签协议博弈中，只有x=1，即（同意，同意）是ESS。,一般两人对称

8、博弈复制动态和进化稳定策略,一般模型,进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。基本模型是两个局中人之间的对称博弈。含义是两个博弈位置是无差异的。其中abcd可以是任何得益，根据问题设定。,复制动态分析,复制动态的进化规则是生物学中生物特征进化规则设x为采用策略1的比例,复制动态相位图,稳态为：,x*=0，x*=1，,x*=(d-b)/(a-b-c+d),例：鹰鸽博弈的复制动态和进化稳定策略,v代表双方争夺的利益c是争夺失败一方的损失,复制动态方程和相位图,设v=2，c=12，则方程为：,因为F(0)0,F(1)0,F(1/6)0所以只有x*=1/6是ESS。即采用攻击性策略

9、的博弈方的数量常常稳定在1/6左右的水平。,练习：,求猎鹿博弈的ESS古代的村庄有两个猎人。当地的猎物主要有两种：鹿和兔子。如果一个猎人单兵优作战，一天最多只能打到3只兔子。只有两个一起去才能猎获一只鹿。从填饱肚子的角度来说，3只兔子能保证一个人3天不挨饿，而一只鹿却能让两个人吃上5天。,4.4 生物间合作的机制：亲缘效应和互惠式的合作行为,问题：如何得到帕累托（Pareto）改进？,汉密尔顿法则：通过亲缘选择促进利他行为的条件是,其中，c为利他者付出的代价，b为受益者获得的好处，r为亲缘系数。,例如，上述合作博弈中，若局中人I选择利他行为，收益组合由(1,1)变为(0,5),故c=1,b=4，所以，当亲缘系数r1/4时，“利他基因在种群基因库中的频率才会增加”。,思考：囚犯困境中，当亲缘系数多大时，囚犯会选择利他行为？,

展开阅读全文