《博弈与决策1导论.ppt》由会员分享,可在线阅读,更多相关《博弈与决策1导论.ppt(40页珍藏版)》请在三一办公上搜索。
1、博弈与决策game theory,河北经贸大学商学院,Game Theory-Lecture 1,2,课前小问题:,博弈论之英雄(美人)救美人(英雄)记背景:有一座城堡,仅有南、北两个城门可以入内,城堡内驻扎了三个排的士兵看守城门。事件:你的心上人被关押在城堡内,攻入城堡就可营救出他(她)。条件:1、你只拥有两个排的兵力。2、通往南北城门各自只有一条道路,去往两城门的道路不相通(你只能一条道走到底)3、你方兵力少于或相同于对方时你肯定失败(所谓守易攻难),你方兵力超过对方则能成功破城,兵力调度只能以排为单位。4、两兵相接时就不能再变动兵力布置。问题:你有多大的概率救出你的心上人?,河北经贸大学
2、商学院,Game Theory-Lecture 1,3,教材:,经济博弈论(第三版)复旦大学出版社,2007年1月经济博弈论习题指南 复旦大学出版社,2003年1月,河北经贸大学商学院,Game Theory-Lecture 1,4,学习要求:,任何课程的知识都具有连贯性,所以不要经常逃课,更不能让教材“一尘不染”。听课时要多作笔记,笔记是知识的框架,教材是对知识的充实。二者缺一不可。对于老师布置的习题,要认真完成,以巩固所学的知识。学习时要搞清理论,特别要注意结论成立的条件。,河北经贸大学商学院,Game Theory-Lecture 1,5,课程安排,第一章 导论第二章 完全信息静态博弈第
3、三章 完全且完美信息动态博弈第四章 重复博弈第五章 完全但不完美信息动态博弈第六章 不完全信息静态博弈第七章 不完全信息动态博弈第八章 有限理性和进化博弈,河北经贸大学商学院,Game Theory-Lecture 1,6,第一章 导论,本章介绍博弈论的基本概念,包括什么是博弈和博弈论,给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论,对博弈论的发展历史等作简单介绍。目标是让读对博弈论的内容和博弈模型有更直观的概念和印象,本教材的基本内容,以及博弈分析的基本思想方法等形成初步的认识,为后面各章展开详细分析作好铺垫和准备。,河北经贸大学商学院,Game Theory-Lecture 1
4、,7,1.1什么是博弈论,一、从游戏到博弈1、Game theory博弈就是策略对抗,或策略有关键作用的游戏游戏特征:(1)规则(2)结果(3)策略(4)策略与利益相互依存,河北经贸大学商学院,Game Theory-Lecture 1,8,2、身边的博弈例子,(1)无谓竞争如果本门课程按比例来给分,无论卷面分数是多少,只有40%的人能获得优秀,40%的人能获得良好。学生的反应:所有学生都达成一个协议:大家都不要太用功,如何?想法不错,但无法实施。,河北经贸大学商学院,Game Theory-Lecture 1,9,稍加努力就可胜过他人,诱惑太大了问题是:所有人都这么做。结果:所有人的成绩都不
5、比大家遵守协议来得高;而且,大家还付出了更多的功夫。(囚徒困境)还有其它什么例子?占座/军备竞争,河北经贸大学商学院,Game Theory-Lecture 1,10,2、身边的博弈例子,(2)两职员上午开车外出办事,因处理了些许私人事件而耽误了下午及时返回公司工作,遂向老板谎称轮胎漏气去修理厂修理而耽误时间。老伴分别向他们提问:“哪个轮胎漏气了?该如何应答?聚(焦)点(focal point)博弈,河北经贸大学商学院,Game Theory-Lecture 1,11,2、身边的博弈例子,(3)为何教授如此严厉许多教授强硬规定:不许补考,不允许迟交作业或论文教授为何如此苛刻?如果允许某种迟交,
6、而教授又无法辨别真伪,则学生总是会迟交。期限本身就没意义了为避免此现象,只有一种策略:没有例外的策略,河北经贸大学商学院,Game Theory-Lecture 1,12,问题:一个好心肠的教授如何来维持铁石心肠的承诺?找到是拒绝变得强硬和可信的方法:拿行政程序或学校政策做挡箭牌;在课程开始时作出明确和严格的宣布;通过严打几次获得“冷面杀手”的声誉,河北经贸大学商学院,Game Theory-Lecture 1,13,2、身边的博弈例子,(4)“濒危”舍友宿舍饮用水告罄,需要打开水了。自己亲自动手还是寄希望于别人僵持一阵子,有人失去耐心而选择让步争吵胆小鬼博弈(game of chicken)
7、消耗战(war of attrition),河北经贸大学商学院,Game Theory-Lecture 1,14,2、身边的博弈例子,(5)约会博弈(the dating game)他(她)真的是个好男孩(女孩)吗?他(她)真心爱我吗?燕赵晚报上的八卦新闻:女孩在情人节谎称被绑架,要男孩往一银行卡上打5000元。女孩使用的是筛选策略,男孩要么照办(真心爱她);要么拒绝(缺乏真心),河北经贸大学商学院,Game Theory-Lecture 1,15,此类博弈中真正的策略是信息的批露传递关于自己好信息的策略称为“信号”(signals)例子:教育诱使他人采取行动,以可靠显示其私人信息(好或坏)的
8、策略,称为“筛选”(screening)例子:数量折扣,河北经贸大学商学院,Game Theory-Lecture 1,16,二、一个非技术性的定义,博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。1、博弈的参加者(players)2、各博弈方各自可选择的全部策略(strategies)或行动(actions)的集合3、进行博弈的次序(orders)4、博弈方的得益(payoffs),河北经贸大学商学院,Game Theory-Lecture 1,17,1.2 几类经典的博弈模型
9、,一、囚徒困境1950年图克提出的,用于研究经济效率问题博弈方:两小偷(囚徒)策略:坦白、抵赖次序:同时收益:都坦白,各关押5个月;都抵赖,各关押1个月;一方坦白一方抵赖,坦白方释放,抵赖方关押8个月可以用得益矩阵的方式表示,河北经贸大学商学院,Game Theory-Lecture 1,18,1.2 几类经典的博弈模型,得益矩阵表示形式,得益,囚徒1:坦白囚徒2:坦白,河北经贸大学商学院,Game Theory-Lecture 1,19,1.2 几类经典的博弈模型,二、赌胜博弈特点:一方所得等于另一方所失,不可能双赢,属于零和博弈博弈方:两玩家:一方盖,一方猜策略:正面朝上、反面朝上次序:同
10、时收益:对方猜错赢1元钱,对方猜中输1元钱;猜中赢1元钱,猜错输1元钱,不让对方猜出自己的策略而自己尽可能猜出对方策略,河北经贸大学商学院,Game Theory-Lecture 1,20,1.2 几类经典的博弈模型,三、产量决策的古诺模型博弈方:n个厂商策略:生产及投放市场的产量(无数个)次序:同时收益:利润无法用得益矩阵的方式表示,利用得益函数方式表述策略和得益的依存关系i=Ri-Ci=P(Q)qi-cqi=P(qi-cqi),河北经贸大学商学院,Game Theory-Lecture 1,21,1.3 博弈结构和博弈分类,研究问题不同博弈模型各异(博弈结构不同一、博弈中的博弈方(play
11、ers)博弈方:独立决策、独立承担博弈结果的个人或组织博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈,河北经贸大学商学院,Game Theory-Lecture 1,22,一、博弈中的博弈方,(一)单人博弈一般的最优化问题例:商人运货(价值9万)水路运费7千,陆路运费1万,但水路有风险好天气(概率75%)时可平安抵达,坏天气(概率25%)时货物损失10%。如何决策?分析:引入一个博弈方0(自然 nature)博弈方:商人、自然策略:商人:水路/陆路;自然:好
12、天气/坏天气次序:同时得益:博弈方0的得益不考虑,仅商人的得益要考虑,信息拥有越多决策准确性越高,河北经贸大学商学院,Game Theory-Lecture 1,23,一、博弈中的博弈方,(二)两人博弈两人博弈即有两个博弈方的博弈两人博弈最常见,研究最多,是最基本和有用的博弈类型囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致,河北经贸大学商学院,Game Theory-Lecture 1,24,一、博弈中的博弈方,(二)多人博弈三个博弈方之间的博弈可能存在“破坏者”:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的
13、,有时甚至是决定性的影响。多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法,河北经贸大学商学院,Game Theory-Lecture 1,25,1.3 博弈结构和博弈分类,二、博弈中的策略(strategies)策略:博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同有限博弈:每个博弈方的策略数都是有限的无限博弈:至少有某些博弈方的策略有无限多个,河北经贸大学商学院,Game Theory-Lecture 1,26,1.3 博弈结构和博弈分类,三、博弈中的得益(payoffs)得益:各博弈方从博弈中所获得的利益得益
14、对应博弈的结果,也就是各博弈方策略的组合得益是各博弈方追求的根本目标及行为和判断的主要依据数量、利润、收入、量化的效用、社会效益、福利等根据得益的博弈分类:零和博弈、常和博弈、变和博弈,河北经贸大学商学院,Game Theory-Lecture 1,27,三、博弈中的得益,(一)零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同 猜硬币,田忌赛马,石头-剪刀-布(二)常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系 分配固定数额的奖金、利润,遗产官司(三)变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。囚徒困境、产量博
15、弈等,河北经贸大学商学院,Game Theory-Lecture 1,28,1.3 博弈结构和博弈分类,四、博弈的过程博弈过程:博弈方选择、行为的次序,包括是否多次重复选择、行为。博弈过程对博弈结果也有重要影响。根据博弈的过程,博弈可分为静态博弈、动态博弈(包含重复博弈)。(一)静态博弈:所有博弈方同时或可看作同时选择策略的博弈 田忌赛马、猜硬币、古诺模型(二)动态博弈:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 弈棋、市场进入、领导追随型市场结构(三)重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能 长
16、期客户、长期合同、信誉问题1、有限次重复博弈2、无限次重复博弈,河北经贸大学商学院,Game Theory-Lecture 1,29,1.3 博弈结构和博弈分类,五、博弈的信息结构信息差异决策行为差异博弈结果不同(一)关于得益的信息完全信息(complete information)博弈:各博弈方都完全了解所有博弈方各种情况下的得益不完全信息(incomplete information)博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈”(二)关于博弈过程的信息(动态博弈中)完美信息(perfect information)博弈:每个轮到行为的博弈方对博弈的进程
17、完全了解的博弈不完美信息(inperfect information)博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈,河北经贸大学商学院,Game Theory-Lecture 1,30,1.3 博弈结构和博弈分类,六、博弈方的能力和理性理性能力博弈方的行为逻辑完全理性和有限理性完全理性:有完美的分析判断能力和不会犯选择行为的错误有限理性:博弈方的判断选择能力有缺陷个体理性和集体理性个体理性:一个体利益最大为目标集体理性:追求集体利益最大化合作博弈:允许存在有约束力协议的博弈非合作博弈:不允许存在有约束力协议的博弈,河北经贸大学商学院,Game Theory-Lecture
18、 1,31,1.3 博弈结构和博弈分类,七、博弈的分类(1)合作博弈 有限理性 完全信息 非合作博弈 静态 不完全信息 完全理性 完全信息 完美信息 动态 不完美信息(重复)不完全信息,河北经贸大学商学院,Game Theory-Lecture 1,32,七、博弈的分类(2),河北经贸大学商学院,Game Theory-Lecture 1,33,1.4博弈论历史和发展简述,一、早期研究对具有策略依存特点决策问题的研究可上溯到18世纪初甚至更早博弈论真正的发展在本世纪,博弈论总体上仍然是发展中的学科2000年前我国古代的“齐威王田忌赛马”1838年古诺寡头模型。1883年伯特兰德寡头竞争模型。1
19、913年齐默罗象棋博弈定理、“逆推归纳法”1921-1927年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的极小化极大解 1928年诺伊曼和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果,河北经贸大学商学院,Game Theory-Lecture 1,34,1.4博弈论历史和发展简述,二、博弈论的形成冯.诺伊曼和摩根斯坦博弈论和经济行为Theory of Games and Economic Behavior 1944引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形(matrix form)表示提
20、出稳定集(stable sets)解概念正式提出创造博弈论一般理论的主意给出博弈论研究的一般框架、概念术语和表述方法,河北经贸大学商学院,Game Theory-Lecture 1,35,1.4博弈论历史和发展简述,三、博弈论的成长和发展1、第一个研究高潮(20世纪40年代末50年代初)1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳什定理,发展非合作博弈的基础理论。1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军)“囚徒的困境”(Prisons dilemma)博弈实验,(Howard Raiffa)独立进行这个博弈实验;1
21、952-1953年期间(L.S.Shapley)和(D.B.Gillies)提出“核”(Core)作为合作博弈的一般解概念Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。奥曼(R.J.Aumann)“40年代末50年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。”,河北经贸大学商学院,Game Theory-Lecture 1,36,1.4博弈论历史和发展简述,三、博弈论的成长和发展2、迅速发展期(20世纪50年代后期70年代)1954-1955年提出了“微分博弈”(Differential games)的概念。
22、奥曼则在1959年提出了“强均衡”(Strong equilibrium)的概念。“重复博弈”(Repeated games)也是在50年代末开始研究的,这自然引出了关于重复博弈的“民间定理”(Folk theorem)。1960年(Thomas C.Schelling)引进了“焦点”(Focal point)的概念。博弈论在进化生物学(Evolutionary Biology)中的公开应用也是在60年代初出现的。,河北经贸大学商学院,Game Theory-Lecture 1,37,塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(subgame perfect Nash equil
23、ibrium)1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium)海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文,“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。海萨尼1973年提出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(Strict Nash equilibrium)。70年代“进化博弈论”(Evolutionary game theory)的重要发展,(John Maynard Smith)1972年引进“进化稳定策略”(Evolutionarily stable
24、strategy,ESS)等。“共同知识”(Common knowledge)的重要性,因为奥曼1976年的文章引起广泛的重视。,河北经贸大学商学院,Game Theory-Lecture 1,38,1.4博弈论历史和发展简述,四、博弈论的成熟与主流经济学的融合1、成熟期(20世纪80年代-90年代)1981(Elon Kohlberg)“顺推归纳法”(Forward induction)克瑞泼斯(David M.kreps)和威尔孙(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria)1982年斯密(John Maynard Smith)出版了
25、进化和博弈论()1984年由伯恩海姆(B.D.Bernheim)和皮尔斯(D.G.Pearce)提出“可理性化性”(Rationalizability)海萨尼和塞尔腾1988年提出了在非合作和合作博弈中均衡选择的一般理论和标准,1991年弗得伯格(D.Fudenberg)和泰勒尔(J.Tirole)首先提出了“完美贝叶斯均衡”(Perfext Bayesian equilibrium)的概念,河北经贸大学商学院,Game Theory-Lecture 1,39,1.4博弈论历史和发展简述,四、博弈论的成熟与主流经济学的融合2、博弈论与诺贝尔经济学奖1994:非合作博弈:纳什(Nash)、海萨尼
26、(Harsanyi)、塞尔顿(Selten)1996:不对称信息激励理论:莫里斯(Mirrlees)和维克瑞(Vickrey)2001:不完全信息市场博弈:阿克罗夫(Akerlof)(商品市场)、斯潘塞(Spence)(教育市场)、斯蒂格里兹(Stiglitze)(保险市场)2002:实验经济学:史密斯(Smith),心理经济学:卡尼曼(Kahneman),河北经贸大学商学院,Game Theory-Lecture 1,40,博弈论之英雄(美人)救美人(英雄)记 守 方 南(3)北(0)南(2)北(1)南(1)北(2)南(0)北(3)你 南(2)北(0)-1,1-1,1 1,-1 1,-1 南(1)北(1)1,-1-1,1-1,1 1,-1方 南(0)北(2)1,-1 1,-1-1,1-1,112种情况,可能获胜的是6种 概率:50%,