《第五章有限理性和进化博弈ppt课件.ppt》由会员分享,可在线阅读,更多相关《第五章有限理性和进化博弈ppt课件.ppt(73页珍藏版)》请在三一办公上搜索。
1、第五章 有限理性和进化博弈,完全理性在现实中很难满足,当社会经济环境和决策问题较复杂时,人们必须存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响.,有限理性(bounded rationality)的概念最初是阿罗提出.一是环境是复杂的,在非个人交换形式中,人们面临的是一个复杂的、不确定的世界,而且交易越多,不确定性就越大,信息也就越不完全;二是人对环境的计算能力和认识能力是有限的,人不可能无所不知;,20世纪40年代,西蒙详尽而深刻地指出了新古典经济学理论的不现实之处,分析了它的两个致命弱点:(1)假定目前状况与未来变化具有必然的一致性;(2)假定全部可供选择的“备选方案”和
2、“策略”的可能结果都是已知的。而事实上这些都是不可能的。西蒙的分析结论使整个新古典经济学理论和管理学理论失去了存在的基础。,西蒙指出传统经济理论假定了一种“经济人”。他们具有一个很有条理的、稳定的偏好体系,并拥有很强的计算能力,靠此能计算出在他们的备选行动方案中,哪个可以达到尺寸上的最高点。西蒙认为人们在决定过程中寻找的并非是“最大”或“最优”的标准,而只是“满意”的标准。,本章分四节,5.1有限理性博弈及其分析框架5.2最优反应动态5.3复制动态和进化稳定性: 两人对称博弈5.4复制动态和进化稳定性: 两人非对称博弈,5.1 有限理性博弈及其分析框架,5.1.1 有限理性及其对博弈的影响5.
3、1.2 有限理性博弈分析框架,5.1.1 有限理性及其对博弈的影响,有限理性意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略有限理性意味着均衡是不断调整和改进而不是一次性选择的结果,而且即使到达了均衡也可能再次偏离有限理性博弈方会在博弈过程中学习博弈通过试错寻找较好的策略,5.1.2 有限理性博弈分析框架,最优反应动态:有快速学习能力的小群体成员的反复博弈复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈进化稳定策略(ESS),5.2 最优反应动态,5.2.1 协调博弈的有限博弈方 快速学习模型5.2.2 古诺调整过程,5.2.1 协调博弈的有限博弈方快速学习模型,模型:,反应
4、、策略调整规则推导,最优反应动态模拟:初次博弈1个A,初次博弈相邻2个A,初次博弈相连3个A,5.2.2 古诺调整过程,古诺模型反应函数,1 2 3 4博弈方1 2.5 1.5 2.125 1.875博弈方2 3 1.75 2.25 1.9375,问题:两寡头始终假设对方产量不变,最优反应动态模拟,收敛条件,5.3 复制动态和进化稳定性: 两人对称博弈,5.3.1 签协议博弈的复制动态和进化稳定策略5.3.2一般两人对称博弈复制动态和进化稳定策略5.3.3 协调博弈的复制动态和进化稳定博弈,经济学与生物学,经济学和生物学的历史从来就交织在一起。二者研究的都是个体在给定环境下的最优策略。它们包含
5、的内在逻辑相当一致:所有生命体的行为看上去总好像设法使其基因的遗传频率最大化,正如企业最大化其利润一样。,经济学与生物学,自然界中的博弈,吸血蝙蝠夜间去大型哺乳动物那里吸血,有些个体偶尔会空腹而归,此时吸饱血的个体就会吐出胃内的血液喂给饥饿的个体,尽管它们之间并没有直接血缘关系。吸血蝙蝠更有可能回吐血液给以前曾经回吐过血液的蝙蝠,而骗子(拒绝分享的蝙蝠)将被蝙蝠群体记住,并且被排除在这种协作之外。,自然界中的博弈,白色念珠菌(Monilia albican 或 canidia Albicans),是一种真菌,通常存在于正常人口腔和消化道粘膜中,一般在正常机体中数量少,不引起疾病。当机体免疫功能
6、或一般防御力下降,则本菌大量繁殖并改变生长形式(芽生菌丝相)侵入细胞引起疾病。,演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将参与人模型化为超级理性的博弈方,认为参与人通常是通过试错的方法达到博弈均衡的,与生物演化具有共性。,在演化博弈中,认为参与人的选择行为可以依据前人的经验、学习与模仿他人行为、受遗传因素的决定等。因而演化博弈把具有主观选择行为的参与人扩展为包括动物、植物在内的有机体,动植物参与者的支付可被理解为为某种适应程度。,把博弈论的分析与应用从研究人类的竞争行为扩展为研究有机体的策略互动关系。这个领域的开创性工作是由
7、英国生物学家约翰梅纳德史密斯(John Maynard Smith)和G.R.普莱斯(G.R.Price)1973年进行的。演化博弈现在正逐渐被广泛应用于社会经济学领域。,演化博弈的关注内容,演化博弈强调经济变迁过程中以个体多样性变异机制和偏好选择机制为代表的种群研究。它探讨种群选择的策略是否获得最佳的收益,并消除任何小的突变群体的扰动。,一个例子:对称博弈演化博弈,首先假定群体中的参与人都是完全相同的(对称博弈) 。其次,假定每个参与人只能机械地选择某种策略(而无法改变自己的策略)。如果某种策略获得了成功,采用这种策略的参与人将越来越多,反之如果某种策略不成功,采用这种策略的参与人就越来越少
8、。,演化稳定策略(ESS),演化稳定策略,是指如果占群体绝大多数的个体选择演化稳定策略,那么小的突变者群体就不可能侵入到这个群体。或者说,在自然选择压力下,突变者要么改变策略而选择演化稳定策略,要么退出系统而在进化过程中消失。,例1:囚徒困境博弈,C代表合作,D代表背叛。合作是否是一种演化稳定策略?,分析:,假定一个群体由合作者构成,由于基因变异出现了比例为的背叛者。此时合作者的收益为:(1-)*2+*0=2-2 背叛者的收益为:(1-)*3+*1=3-2由于背叛者的收益高于合作者的收益,背叛者不仅不会消亡,反而会越来越多。因此,合作不是一个演化稳定策略。,演化稳定策略是什么呢?,假定一个群体
9、由背叛者构成,由于基因变异出现了比例为的合作者。此时背叛者的收益为:(1-)*1+*3=1+2 合作者的收益为:(1-)*0+*2=2由于合作者的收益低于背叛者的收益,合作者会逐渐消亡,因此背叛是一个演化稳定策略。,结论:,严格劣策略不可能是演化稳定策略。,纳什均衡与演化稳定策略,博弈的纳什均衡(A,A)和(B,B)。B是否是一个演化稳定策略?结论:1. 纳什均衡并不意味着演化稳定策略;2. 严格纳什均衡意味着演化稳定策略。,纯策略下演化稳定策略的定义1(Maynard Smith, 1972),纯策略下演化稳定策略的定义2,例2:找出ESS,U(A,A)=U(B,A)U(A,B)U(B,B)
10、因此A是演化稳定策略,另一个例子问题1:此博弈对应现实生活中的什么情况问题2:此博弈是否存在演化稳定策略,混合策略下演化稳定策略的定义,找出以下博弈的混合策略ESS,(1)找出博弈的混合策略纳什均衡。由于博弈的对称性,双方的混合策略纳什均衡必然是相同的,设为(p,1-p)给定局中人1的策略(p,1-p)局中人2选择A的收益:p*0+(1-p)*2=2-2p局中人2选择B的收益:p*1+(1-p)*0=p根据2-p=p,解出p=2/3(2)(2/3,1/3)是否是一个严格纳什均衡?(3)(2/3,1/3)是否是ESS?,鹰鸽博弈,博弈的演化稳定策略是什么?当vc时,(H,H)是严格纳什均衡,因此
11、H是演化稳定策略。当v=c时,(H,H)是弱纳什均衡,因为U(H,D)U(D,D),因此H是演化稳定策略当vc时,不存在纯策略演化稳定策略。此时是否存在混合策略ESS?首先找出混合策略纳什均衡(v/c,1-v/c),其次验证其是否为ESS。,蜥蜴的生存策略,动态演化,复制者(replicator)能够大致精确地复制自身的个体。例如基因、生物体或是弥母(meme)动态演化的复制者系统不同复制者的所占比例随时间的变化过程,其中不同策略复制的速度与他们的收益呈正相关。,复制者的策略,考虑一个n人演化博弈(i=1,2,.n),博弈在每个时间点t上进行(t=1,2,.).设pit为在t期中采用策略si的
12、局中人的比例,此时si的收益为it=i(pt),其中p=(p1,.,pn)。不妨设1t2tnt假定在每个时期dt,每个个体i都以 dt的概率发现某个随机个体j的收益,如果i发现j的收益比自己高,就以pijt的概率转变为j的策略。,此时在t+dt期使用si策略的局中人所占比例的期望值Epit+dt为:,如果个体数量很多,则Epit+dtpit+dt,这个式子称为复制者动态(replicator dynamic)方程,5.3.1 签协议博弈的复制动态和进化稳定策略,签协议博弈:,假设群体中采用“同意”比例x(t)则不同策略期望得益和平均得益为:,博弈方策略类型比例动态变化是有限理性博弈分析的核心,
13、其关键是动态变化的速度以采用“同意”策略类型博弈方的比例为例,其动态变化速度可用下列微分方程反映(复制动态方程),动态微分方程的相位图,稳定状态、不动点:x*=0, x*=1,进化稳定策略的检验,5.3.2一般两人对称博弈复制动态 和进化稳定策略,一般模型,进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置是无差异的。其中abcd可以是任何得益,根据问题设定。,复制动态分析,复制动态的进化规则是生物学中生物特征进化规则设x为采用策略1的比例,复制动态相位图,5.3.3 协调博弈的复制动态 和进化稳定博弈,dx/dt,复制动态进化博弈
14、的结果常常取决与带有很大偶然性的初始状态。,5.3.4 鹰鸽博弈的复制动态 和进化稳定策略,复制动态方程和相位图,dx/dt,5.4 复制动态和进化稳定性: 两人非对称博弈,5.4.1 市场阻入博弈的复制动态 和进化稳定策略5.4.2 非对称鹰鸽博弈的进化分析,5.4.1 市场阻入博弈的复制动态和进化稳定策略,博弈方1位置博弈群体复制动态相位图,dx/dt,博弈方2位置博弈群体复制动态相位图,两群体复制动态的关系和稳定性,5.4.2 非对称鹰鸽博弈的进化分析,非对称鹰鸽博弈博弈方1群体复制动态相位图,非对称鹰鸽博弈博弈方2群体复制动态相位图,两群体复制动态关系和稳定性,非对称博弈演化均衡判断方
15、法之二,再论 非对称鹰鸽博弈,两个博弈方的复制动态方程为:稳定点为(0,0),(0,1),(1,0),(1,1) (1/6,5/6),如何判断这5个点哪些是进化稳定均衡?,动态过程究竟会趋向于哪个均衡点,取决于博弈方采用策略比例的初始状态和动态微分方程在相应区间的正负情况,需要根据具体情况加以判断。按照Hirshleifer的概念,若从使得动态系统的某平衡点的任意小邻域内出发的轨线最终都演化趋向于该平衡点,则称该平衡点是局部渐近稳定的。,这样的动态稳定平衡点就是演化均衡点。下面根据该系统相应的雅可比(Jakobian)矩阵的局部稳定性来分析系统在这些均衡点的局部稳定性。分别对两个复制动态求关于x和y的偏导数,可得雅克比矩阵为:,复制动态的雅克比矩阵为:,对于离散系统,当且仅当det(J)0、tr(J)0时,该均衡点为ESS稳定因为雅克比矩阵的特征值为:,所以(1,0),(0,1)为演化稳定均衡,什么是鞍点?,鞍点(Saddle point)在微分方程中,沿着某一方向是稳定的,另一条方向是不稳定的奇点,叫做鞍点。,