演化博弈论初探.doc

上传人:仙人指路1688 文档编号:3824657 上传时间:2023-03-23 格式:DOC 页数:15 大小:483KB
返回 下载 相关 举报
演化博弈论初探.doc_第1页
第1页 / 共15页
演化博弈论初探.doc_第2页
第2页 / 共15页
演化博弈论初探.doc_第3页
第3页 / 共15页
演化博弈论初探.doc_第4页
第4页 / 共15页
演化博弈论初探.doc_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《演化博弈论初探.doc》由会员分享,可在线阅读,更多相关《演化博弈论初探.doc(15页珍藏版)》请在三一办公上搜索。

1、目录摘要:1Abstract:1第一章 引言31.1课题背景31.2本课题研究意义31.3本课题研究方法3第二章 演化博弈概述42.1博弈论简述42.2演化博弈论的定义42.3演化博弈论策略4第三章 囚徒困境及演化博弈策略43.1 囚徒困境43.2 囚徒困境求解及演化博弈策略5第四章 详细设计及算法模拟64.1 运行环境64.2 程序基本设计思想64.3程序详细代码64.4 使用手册9第五章 运行结果105.1 程序运行平台105.2 运行结果11第六章 结论14致 谢14参考文献14演化博弈论初探摘要:演化博弈论(evoluti onary game theory)以达尔文生物进化论和拉马克

2、的遗传基因理论为思想基础,将博弈理论与动态演化过程分析结合起来,分析从个体到群体行为的形成机制,研究种群的进化趋势及稳定性。演化博弈论整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。演化博弈是一个新兴的学科,在理论应符合现实意义上,该理论对于生物学,经济学以及各学科均大有用场。本文在对演化博弈理论研究的基础上,选取囚徒困境作为范例阐述演化博弈的思想,用“牛吃草”、“牛群的发展状态”来模拟自然界中的

3、种群演化以及种群中个体的博弈,对演化博弈进行基本研究。关键词:博弈,演化博弈,囚徒困境,种群中演化博弈Abstract: Evolutionary game theory is based on Darwins theory of evolution and Lamarckian genetic theory, it contains the evolution of game theory and dynamic analysis of combined analysis of group behaviors from the individual to the formation mech

4、anism of population of Evolutionary trends and stability. Integration of rational game theory, evolutionary economics and evolution of biological thought, no longer human model into the game super-rational side, it is believed human beings always through trial and error method to achieve Equilibrium

5、, and biological evolution are common, the choice of the balance is to achieve a balanced equilibrium function of the process, so , historical, institutional factors and the balancing process are some of the details of the game affect the choice of multiple equilibria. evolutionary game is a new sub

6、ject, in theory should be realistic sense, the theory in biology, economics, and the subjects were much useful, In this thesis , we will disscuss the evolutionary game theory based on the research, and take Prisoners Dilemma game for an example for describeding the idea of cows eat grass, cows state

7、 of development to simulate the natural evolution of species and populations in the individual game, disscuss what is evolutionary game . Key words: game theory, evolutionary game, prisoners dilemma, evolutionary game populations第一章 引言1.1课题背景2 0世纪 8 0年代, 随着对演化博弈论研究的深入, 许多经济学家把演化博弈理论引入到经济学领域,演化博弈已不再局

8、限于生物学科的范畴, 同时对演化博弈理论的研究也开始进一步的深入发展,尤其2 0世纪9 0年代以来, 演化博弈理论的发展又再进入了一个新的阶段。就现阶段来说,不止经济学和生物学在研究演化博弈论,各学科都在研究这一理论,并在各自的领域都取得了一定的成果,计算机软件理论也有关于演化博弈理论的研究,且由于计算计算软件的飞速发张,现今已经可以用软件平台模拟出各种情况下的进化博弈类型,更加便于课题的研究和交流。不难想象,演化博弈这一当前热门的论题还将继续下去,将会成为经典且永久的纯理论的论题。1.2本课题研究意义经济演化思想很早就存在于经济理论中。近年来,演化博弈论的理论研究已成为学术界最热门的研究领域

9、之一。演化博弈论还是经济学中的一个新领域, 可以预见,在未来相当长的一段时期内, 演化博弈论仍将是经济研究中最具发展潜力的前沿领域之一。研究本课题对可以用于分析社会制度变迁研究中人类个体在社会生产生活中对于个体利益记集体利益的选择,可以用于分析产业演化中垄断企业价格协议或商家之间的价格竞争,可以用于分析国际贸易中各国对其他国家贸易壁垒的设置及关税多寡的设定,亦可以用于分析股票市场及其他方面等等。1.3本课题研究方法演化博弈首先必须存在一个博弈框架,这个博弈框架主要指博弈的结构和规则。本文首先介绍著名的“囚徒困境”用以更好的阐述何为博弈,何为演化博弈,就“囚徒困境”探讨演化博弈论的思想,并根据演

10、化博弈的思想写出“演化博弈算法”,解释种群中同时存在合作的个体和贪婪的个体时整个种群如何演化。要求程序能流畅运行并能在输出界面中形象、直观地表示种群的进化,结合本次毕业设计的有关要求写出详细求解过程及详尽算法,保存详尽文档。演化博弈理论认为,由于参与博弈的个体的有限理性,其博弈的最优均衡不能在初始时就找到,必须通过大量反复的博弈过程去修正和改进个体策略。第二章 演化博弈概述2.1博弈论简述在中文中,博弈意即下象棋,象棋有一定的规则,两个棋手必须依据规则走棋,互相揣摩对方的走棋路线并尽量使自己棋高一着而赢得比赛。引申的博弈可以理解为两个对手之间智力及计谋的较量,从这个方面上来说,所谓博弈论是指某

11、个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程。2.2演化博弈论的定义演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种新理论,最初产生于行为生态学。它从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。演化博弈理论主要研究某一群体随着时间变化的动态过程,解释为何群体将达到目前的这一状态以及如何达到。2.3演化博弈论策略演化理论是一种生命科学理论,该理论以达尔文的生物进化论和拉马克的遗传基因理论为思想基

12、础。在生物演化过程中,只有在竞争中能够获得较高繁殖成活率的种群才能生存下来,获得较低繁殖成活率的种群在竞争中会淘汰。生物界中的许多演化参与者都无意识的,但是它们的行为最终却趋于纳什均衡水平,也就是说,它们的行为可以用纳什均衡概念来解释。所谓纳什均衡,即非合作博弈均衡:在给定他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化,纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。生物演化遵循优胜劣汰的原则,在这种原则下它们的行为趋于纳什均衡,这就为演化论与博

13、弈论相结合用于解释人的群体行为提供了一种可能。利用演化博弈理论研究参与人群体行为时,只要求参与人知道什么是成功行为,什么是不成功行为,而不必知道成功与不成功行为的原因,从而最大限度地降低了对理性的要求,能够更接近于现实。第三章 囚徒困境及演化博弈策略3.1 囚徒困境囚徒困境的原文为thePrisonersDilemma.所谓囚徒困境可简要地叙述如下:警方逮捕A、B两名嫌疑犯,但没有足够证据指控二人。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监8年。 若二人都保持沉默(相关术

14、语称互相“合作”),则二人同样判监5年。若二人都互相检举(相关术语称互相“背叛”),则二人同样判监5年。判刑 B 合作(不招) P B 背叛(招供)TA 合作(不招)P P&P: A = 2,B = 2 P&T: A = 8,B = 0A 背叛(招供)T T&P: A = 0,b = 8 T&T: A = 5,B = 5图1 囚徒困境博弈结果支付矩阵3.2 囚徒困境求解及演化博弈策略在囚徒困境的分析和推论中有以下的前提性设定:首先,两个囚徒都知道“博弈的规则”和“博弈的结果”;其次,这两个囚徒都是理性的,而这里的所谓“理性”是指只要给出两种备择策略,他将总是选择其中对他更有利的那种策略以取得个

15、体利益最优;再次,不允许两个囚徒串供。从A的“立场”来看,共有两种可能情况:第一种可能情况是B采取坦白的策略。这时,如果他也坦白则要入狱5年,如果他抵赖,则要入狱10年;两相比较,结论是他应以坦白“对付”B的坦白策略。第二种可能情况是B采取抵赖的策略。这时他若也抵赖,要入狱1年,如果他坦白,则可获得自由;两相比较,结论是他也应以坦白对付B的抵赖策略。结论是无论B坦白还是抵赖,A都以采取坦白策略为更“佳”的对策,所以,A要采取坦白策略。显然,以上推理对于B也适用。这样,两个囚徒在衡量了自身利益之后都采取了坦白策略,结局是两人都被判5年徒刑。还有另一种对大家都更好的策略,就是选择互相合作。这其实是

16、出于对他人利益考虑的一种更为“道德”的策略。在以上颇为“理性”的单次博弈中,二人只考虑自己的利益,不顾他人的死活,从理论上来说,的确取得了个体的利益最优,但这并不是实际上的利益最大化,局中人在损害他人的利益的同时,也损害自己的利益。如果从为他人着想的目的出发,双方都选择合作时,反而共同取得“双赢”。从生物学的角度来说,在多次博弈中,正是这种“合作”的个体推动了整个种群的发展。事实上我们在生活中经常处于“囚徒困境”的状态。比如现阶段最热门议题的房价,买房子的人就处于“囚徒”的两难境地,到底现在买还是将来买,如果买,要买哪里的房,等等,显然,如果大家都不买,开发商为了销量不得不降价,如此一来大家又

17、抢着买,开发商为了利益又提高房价,这属于开发商与买房者之间的博弈;比如在国际贸易中,各国为了保护自己国家的企业的利益,对其他国家进口的货物施行高关税,设置贸易壁垒等手段,为了“报复”这种行为,其他国家也会对该国报以相应的“惩罚”,以保护己方的利益和限制对方的利益,这也是陷入“囚徒困境”体现。演化博弈理论就可以用于解释此类问题。生活中的许多方面都可以用演化博弈理论来解释。在生物种群演化的“囚徒困境”中,博弈双方为“自私自利”的个体和“为集体着想”的个体。可以预见,在“自私”个体占多数的情况下,“为集体着想”的个体由于损失惨重将会快速走向灭亡,而当“自私”个体占据整个种群时,由于资源消耗过快整个种

18、群离灭亡也不远了。本文中设定的种群为牛群,资源为草(grass)。牛群中分为合作的牛(cooperative-cow)和贪婪的牛(greedy_cow),抱合作态度的牛在草消耗到一定量时,为了草的生长将不再继续吃这一片草,贪婪的牛只要还有草就一直在吃,当牛到达一定能量时,不管何种牛,都将繁衍出一个新的个体。当这一片区没有更多的草时,限于牛群的移动速度,将有部分牛被饿死。本文以这一范例编写算法,模拟生物种群进化繁衍过程中“合作”的个体和“背叛”个体的发展情况,对演化博弈理论进行基本研究。第四章 详细设计及算法模拟4.1 运行环境 本程序模拟运行环境如下程序运行平台:Net logo 4.0操作系

19、统:Windows XP硬件配置:2.66 GHz CPU、512 MB RAM、1024x768 显示器、7200 RPM 或更高转速的硬盘;4.2 程序基本设计思想本设计研究种群中有合作习性的个体的进化,进一步学习演变的复杂性。要求编写程序建立一个进化生物学模型,在该模型中,代理人(牛)之间互相争夺自然资源(草)。牛得到足够的资源时进行繁殖,草得到足够的休养生息时草增长,则整个种群获得进化上的成功。该模型包括两种牛,贪婪的牛与合作的牛。该程序运行平台为netlogo 4.0,程序输出中应能显示出两种牛的繁殖程度,以及在做这两种不同的策略相互竞争时,每一个个体随着时间的推移如何演变,也能够显

20、示整个种群中两种牛的数量的变化。程序中,无论如何,牛是要吃草的,否则过了一定时间牛将被饿死。贪婪的牛不会理会草的增长情况,只要周围有草,它就吃;在青草低于一定高度时合作的牛停止吃草。重要的是,当草低于一定的高度(称为“增长门槛”),它的生长率会急速变慢。程序中设置合作的牛至少会留给群体多于 1 的草料,使得整个种群不致没有粮食,而贪婪的牛则不顾种群中其他个体的死活,只要周围有草就吃光为止。 4.3程序详细代码 turtles-own energy patches-own grass breed cooperative-cows cooperative-cow breed greedy-cows

21、 greedy-cow to setup ca setup-cows ask patches set grass max-grass-height color-grass do-plottingendto setup-cows set-default-shape turtles cow ; applies to both breeds crt initial-cows setxy random-xcor random-ycor set energy metabolism * 4 ifelse (random-float 1.0 reproduction-threshold) set energ

22、y energy - reproduction-cost hatch 1 endto grow-grass ; patch procedure ifelse ( grass = low-high-threshold) if (high-growth-chance = (random-float 100) set grass grass + 1 if (low-growth-chance = (random-float 100) set grass grass + 1 if (grass max-grass-height) set grass max-grass-height endto col

23、or-grass ; patch procedure set pcolor scale-color green grass 0 (2 * max-grass-height)endto move ; turtle procedure rt random-float 360 fd stride-length set energy energy - metabolism if (energy low-high-threshold) set grass grass - 1 set energy energy + grass-energy endto eat-greedy ; turtle proced

24、ure if (grass 0) set grass grass - 1 set energy energy + grass-energy endto do-plotting set-current-plot Cows over time set-current-plot-pen cooperative plot count cooperative-cows set-current-plot-pen greedy plot count greedy-cowsend4.4 使用手册程序运行主界面如下图(图 2)所示。左边的框中表示随时间变化的两种牛的数量。程序预设粉红色为合作的牛,蓝色为贪婪的牛

25、。右边的框在程序开始运行后将直观的表现出牛群的演化情况,同样的,蓝色代表的是贪婪的牛,粉红色的合作的牛,绿色代表草。图中各按钮功能及参数设置为:GO: 开始和停止模拟 SETUP: 复位 INITIAL-COWS: 设置牛的初始数量COOPERATIVE-PROBABILITY:合作的概率STRIDE-LENGTH: 此参数为牛的迁移的速度,当周围没有草可以吃的时候,单位时间内牛的迁移速度为STRIDE-LENGTH GRASS-ENERGY:草的增长速率,增加GRASS-ENERGY滑块的值则草的增长变快 METABOLISM: 牛群的新陈代谢。该滑块控制每只牛的能量的增加和损失的速率。如果

26、牛的能量减少到0,牛就死亡。每个牛的初始能量值都为50,表示它在(50 /metabolism)的情况下不吃草REPRODUCTION-THRESHOLD:当某头牛的能量达到REPRODUCTION-THRESHOLD则生出一头新的牛REPRODUCTION-COST: 当一头牛复制出新的个体的时候,它将会失去值为REPRODUCTION-COST 的能量LOW-GROWTH-CHANCE:草的最低生长速率 HIGH-GROWTH-CHANCE: 草的最高生长速率MAX-GRASS-HEIGHT: 草的最高高度值LOW-HIGH-THRESHOLD: 它控制草的生长速率。如果它大于或等于草的最

27、高生长速率,则草将以最高的生长速率恢复,否则,草以最低生长速率恢复图2 程序运行主界面第五章 运行结果5.1 程序运行平台本次设计运行平台为netlogo 4.0 。NetLogo是一个用于模拟自然和社会现象的可编程建模平台。它于1999年由UriWilensky开发,并由网络学习和计算机建模中心不断完善和更新。Netlogo是一个由美国西北大学开发的跨平台多元素可编程的建模软件。可方便的建立传染病传播模型。可以通过共享模型文档进行合作开发和交流。本软件完全免费。NetLogo尤其适合于复杂性系统的仿真开发。开发者可以对成百上千个相互依赖且并行运行的Agent发实时指令。这样有助于研究者去探究

28、个体微观行为与源于微观行为的宏观模式之间的联系。程序开始运行时需初始化,下图显示参数为打开netlogo时的默认设置,牛群移动速度stride-lenth为0.08,牛的新陈代谢速度metabolism为6, 草的生长速度grass-energy 为51,NetLogo模拟的界面如图 3 . 蓝色为贪婪的牛,粉红色为合作的牛,绿色为草。图3 NetLogo种群演化模拟界面5.2 运行结果本次模拟中程序运行默认的参数。图中显示开始时合作的牛与贪婪的牛总数都成上升的形式,但到了一定的时间,贪婪的牛总数还在上升,而合作的牛数量已经到达最多,呈现往下降的趋势。由于程序预设,贪婪牛只要周围还有草就会吃草

29、,而合作的牛发现草的数量低于禁戒的数量(low-high-threshold 5),就停止吃草。开始的时候由于草很丰盛,合作的牛数量急剧增多,贪婪的牛吃光了身边的草,可以想象有一小部分牛将会被饿死,贪婪的牛数量开始下降,但随着时间的增加,草的数量也在增长,整个牛群的总数都在增加。一段时间后,草被消耗了大部分,草的增长速度不是无限的,实际上限于牛的移动速度,此时贪婪的牛会吃光合作的牛周围的草,合作牛却无法一下子全部转移到草丰盛的地方,不可避免的,合作的牛由于饿死一部分所以总量开始下降(图4),此时,合作的牛数量仍多于贪婪的牛。图4 合作的牛与贪婪的牛数量关系图贪婪的牛数量不断增加,不断的消耗了周

30、围的草,而合作牛由于草的数量不多时停止了吃草,数量开始下降。一段时间过后,贪婪的牛数量与合作的牛数量相等,并开始呈现出超过合作的牛的数量的态势(如图 5 )。贪婪的牛不会停止吃草直到没有草,而合作牛即使有草的情况下只要草的数量低于禁戒的数量就停止吃草,这样,再过一段时间,贪婪的牛占据了整个种群,合作的牛灭亡了(图 6)。图 5 贪婪的牛数量开始超过合作的牛图 6 贪婪的牛占据了整个种群本次模拟中贪婪的牛占了上风。可以预见,如果草的生长速度大于牛群的新陈代谢速度,牛就不会灭亡,合作的牛也不会灭亡,因为草会很快生长出来,所有的牛都有富足的草,而现实中草的生长速度不可能快于牛吃掉草的速度,一束草的成

31、长也许要10天,而牛吃掉这一束草甚至只要一分钟。在其他参数设置与上述参数相同时,降低草的生长速度进行模拟时可以发现,草的生长速度越慢,整个牛群中贪婪的牛灭亡的速度越快(图 7),这与生物学中种群的演化相符合。图 7 降低草的生长速度时贪婪的牛迅速走向灭亡第六章 结论本程序直观的反映了一个种群中抱合作态度的个体与贪婪个体之间的进化情况。事实上,这也是一个“囚徒困境”, 不难想象,如果草的生长速度够快,合作的牛与贪婪的牛都不会灭亡,因为草的补给总是充足的。基于实际中草的生长速度以及牛群迁移的速度,当种群中贪婪的牛增多时,每头牛都为了吃到草而吃光身边所有的草,而合作的牛出于对整个种群生存的考虑,会给

32、草休养生息的时间。如果种群中贪婪的牛不断增多,最后的结果一定是吃光所有的草,导致全部个体都没有草吃而种群灭亡。当合作的牛不断增多时,每头牛为了群体的利益都不会吃光所有的草,此时群体的利益得到最大化,由于草永不灭亡,整个种群将只会随着草的多寡而变化,永不灭亡。通过本次设计,使我了解到有时候看似“理性”且“对自己最有利”的决策,也许是最不好的策略,一心只为自己的利益着想,到头来可能损人不利己,甚至有可能损人又损己。而“道德”地为他人的利益着想,为集体的利益着想,反而能得到对自己最为有利的局面。在本次设计中,我深切地体会到,各个学科之间其实是融会贯通的,演化博弈正是多学科融会贯通的一个课题,本次设计

33、加深了我对各学科的理解,通过查阅的一些资料,也让我意识到“演化博弈”并不只是“象牙塔”中的纯理论,并不是只存在于程序的模拟之中,在实际生活的许多方面,也照样能够得到验证。致 谢本文是在-老师的热情关心和指导下完成的。他渊博的知识和严谨的治学作风使我获益匪浅,他严肃的教学态度,严谨的治学精神,精益求精的工作作风深深地感染和激励着我。在此,谨向郑老师致以我最诚挚的谢意和崇高的敬意。最后向在百忙之中评审本文的各位专家、老师表示衷心的感谢!参考文献1汪丁丁.在经济学与哲学之间C.北京:中国社会科学出版社,19962张维迎.博弈论与信息经济学M.上海:三联书店,上海人民出版社,1996.48-503谢识

34、予.有限理性条件下的进化博弈理论J.上海财经大学学报,2001,3(5):3-94H A 西蒙.人工科学M.武夷山译.北京:商务印书馆, 1987.29-555L C Thmas.对策论及其应用M.靳敏,等译.北京:解放军出版社,1988.230-2426 Kando r i M.Evo lut ionary game theo ry in econom ics A. Krep s D,Wallis K.A dvances in Econom ics and Economet r ics:Theo ry and App licat ion (Vo l.2) C.Cambr idge:Cambr

35、 idge U niversity Press, 1997.243-2777陈学彬.博弈学习理论M.上海:上海财经大学出版社,1999.71-798盛昭瀚,蒋德鹏.演化经济学M.上海:上海三联书店,2002.281-3269孙庆文.经济均衡稳定性分析及应用D.上海:上海理工大学系统工程与系统科学院,1997. 31-4810孙庆文,严广乐,车宏安.经济均衡稳定性分析及应用J.上海理工大学报,1998,20(增刊):55-5811H irschM W,Smale S.微分方程,动力系统和线性代数(下册)M.黄杰译.北京:高教育出版社,1987.78-7912Jack son E A.Perspe

36、ct ives of nonlinear Dynam ics (Vo l.1) M. Cambr idge:Cambridge University Press,1989.409-41313方福康.复杂经济系统的演化分析A.许国志.系统研究C.杭州:浙江教育出版社,1997. 239-25414P A 萨谬尔森.经济分析基础M.费方域译.北京:商务印书馆,1992.2-7215车宏安.软科学方法论研究M.上海:上海科技文献出版社,1995.19-34.16 P A 萨谬尔森. 经济分析基础.费方域译.北京:商务印书馆,1992.2-7216 NewmanM E J.The structure

37、and functi on of complex net worksJ.Siam Review,2003,45 (2) : 167-256 17 Boccaletti S, Lat ora V,Moreno Y, etal .Comp lex net works : structure and dynamicsJ.Physics Reports2 Review Secti on of Physics Letters,2006,424 (4-5) :175-308 18 Vukov J,Szabo G,SzolnokiA.Cooperati on in the noisy case: pris

38、oner s dilemma game on t wo types of regular random graphsJ.Physical Review E,2006,73(6) :067103 19 Guan J Y,Wu Z X,Huang Z G,et al.Promoti on of cooperati on induced by nonlinear attractive effect in spatial pris oners di2lemma gameJ.Eur ophysics Letters,2006,76(6):1214-1220 20 Wu Z X, Xu X J,Huang Z G,et al.Evoluti onary prisoners dilemma game with dynamic preferential selecti onJ. Physical Review E,2006,74(2):021107

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号