《《囚徒困境》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《囚徒困境》PPT课件.ppt(42页珍藏版)》请在三一办公上搜索。
1、经济博弈论 第一章 导论,1950年7月美军第24师到达朝鲜大田火车站,朝鲜战争于1950年6月25日爆发,美国出兵干涉,美侵朝战争失败后,艾森豪威尔是如何评价那场战争?,艾将军说,他们对朝鲜的战争是在错误的时间、错误的地点、所进行的一场错误的战争,我们来自不同的地区,为了一个共同的目标走到了一起,我真诚地希望,我们在今后这一段特定的时间、特定的地点、能进行特别真诚的合作,结成友好的朋友,冯海荣,教育经历:,联系方式:,QQ:1047823588,TEL:,1.1.1 什么是“博弈”?,博弈,Game(游戏),围棋等棋类比赛、桥牌拱猪等扑克游戏,以及田径、球类等各种体育比赛,人们在一定规则下进
2、行竞赛 在竞赛中,策略,或者说计谋,有举足轻重的作用。,Game(游戏),博弈起源于游戏中的策略对抗,博弈是策略起关键作用的游戏,博弈,根据辞海的解释,就是在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为。,博弈就是决策行为,“石头-剪子-布”游戏,游戏特点,有一定的规则,规定游戏的参加者,游戏者可以做什么,不可以做什么。,都有结果,如一方赢、一方输、平局等,策略至关重要,每一个游戏者所得结果的好坏,不仅取决于自身的策略选择,也取决于其他参加者的策略选择。,游戏特点,在游戏中,也规定了游戏参加者出招的顺序,是同时做出选择还是先后做出选择
3、等。,1.1.2 博弈的非技术性定义,博弈就是一些个人、对组或其它组织,面对一定的环境条件、在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。,1.1.2 博弈的非技术性定义,博弈论就是系统研究可以用上述方法定义的各种博弈问题,寻求在各博弈方具有充分或者有限理性能力的条件下,合理的策略选择和合理策略选择时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。,囚徒困境,有2个涉嫌共同作案偷窃的嫌疑人A和B被带进警察局。假定警方对2名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到对方的选择。,有2个涉嫌共同作案偷窃
4、的嫌疑人A和B被带进警察局。假定警方对2名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到对方的选择。,警方怀疑他们作案,但并没有掌握他们作案的确凿证据,于是明确地分别告诉2名嫌疑人:对他们犯罪事实的认定及相应的量刑,完全取决于他们自己供认与否。如果一方与警方合作,坦白所做违法之事,而另一方抵赖,招认方将无罪释放,另一方则会被判重刑8年;如果双方都与警方合作共同招认,各被判刑5年;而如果双方均不认罪,因为警察找不到其他证明他们违法的证据,则判刑1年。他们面临的选择和带来的后果组合,可以用下面的表格来表示。,请问,他们会选择什么呢?,坦白or,不坦白,坦白or,不坦白,从上面的表中我
5、们可以知道:每个嫌疑人都有两种可供选择的策略:坦白不坦白。如果A选择抵赖,那么就可能会出现两种情况,如果B选择坦白,那么A将被加重惩罚,判刑8年,而B则无罪释放;如果B也同样选择抵赖,那么他们将判刑1年。但是,因为警方没有把两名嫌疑人放在一间囚房里,彼此不知道对方的想法,也无法串供,因而这种合作难以顺利进行,使得选择合作的风险性大大增加。,实际上,如果两人都抵赖,会无罪释放,显然这个结果是最好的。但人的理性算计排除了这一结果。每个人从自己收益最大化的角度出发来考虑问题,最终往往落得两败俱伤的结果。,因此,基于人是理性的这一前提,无论同伙是否坦白,自己坦白总是比不坦白好。两个人这样一算计,最好的
6、结果都是选择坦白,各判刑5年。,这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒的困境”。,每个人从自己收益最大化出发来考虑问题,最终往往落得两败俱伤的结果。个人的理性算计,往往导致集体的非理性结局。,囚徒的困境对社会利益来说是非常理想的结果,因为罪犯受到了应有的惩罚,(坦白,坦白)是囚徒困境的纳什均衡。,纳什均衡是什么呢?,假设有n人参与博弈,每个人选择自己的最优战略,所有参与人选择的战略构成一个战略组合。,纳什均衡是这样一个战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有任何人有积极性打破这种均衡,纳什
7、均衡是一种“僵局”,给定别人不动的情况下,没有人有兴趣动,这个故事最早是1950年,数学家塔克任斯坦福大学客座教授给心理学家作讲演时提出的。时至今日,这个故事广为流传,在哲学、伦理学、政治学、经济学等学科中获得了极为广泛的应用。,rtgrQ,囚徒困境的应用,在荷兰召开了一次“合作及社会两难困境研讨会”,与会者都是博弈论的专家。当大会结束后,有两个学者,麦息克和路特提议大家玩一个游戏。他们将一个大信封拿出来,请在场的43位学者专家拿出金钱装到这个信封里。如果到最后这个信封里的钱超过250元,麦息克和路特将自己掏腰包,退还每人10元。不过,如果信封内的钱不足250元,就统统没收,大家拿不到半毛钱。
8、,请问,你会出多少钱呢?,每个人应该要放入的数目:250/43=5.81。,如果每人放进去7元钱,应该就可以超过目标250元了。等到最后退还10元钱时,每人都还可以净赚3元呢。,不过,这游戏特别要求大家不准讨论,也不能偷看别人把多少钱放进信封里。,最后,等到大信封传回来的时候,两位主持人打开一数,里面的钱总共是245.59元,离目标250元就差那么一点点。,看到这种结果,这些学者们群情哗然,一副不敢相信的样子。这种事情怎么可能发生?他们统统都是德高望重的学者,而且才刚刚结束了两天的“合作研讨会”啊!他们的合作结果居然比目标还少了近5元钱,这下子,大家统统拿不回来半毛钱了。,有些人抱怨只要再多一
9、个有良心的人放进去7块钱就好了;,有些人后悔自己应该再多放一点点的;,更有一些人说:“早知道这样,我宁可那时候放十几块钱,最后让每个人有钱赚,让主持人付账。”,但问题是:事先根本不可能有人真的奉献超过10元,因为我们都预期别人会拿出他们所该奉献的那部分。,如果真是那样,那么我就没有必要比别人多出一点,反正拿出来的部分就是浪费。,另一方面,如果我一个人少付一点点,最后也会超过目标嘛,让自己多赚一点点大概没啥关系吧。,如果每人都付7元,而你不付钱,你可以不冒风险就白白赚10元,如果别人没有付足够的钱,你也没付,最坏的情况只是赚不到钱,你并没有损失什么。,因此你的优势策略就是:根本不要放进去半毛钱。
10、,每个人都基于这样想法的话,最后的结果总是令人失望的。造成这种结果同样是因为每个人都预期别人会拿出他们的本该奉献的部分,而自己又想尽可能地多“捞”一点,因此才会产生每个人都那不回钱的结果。,2.1.3 划线法 求纳什均衡,2.2.1 纳什均衡的定义,策略空间:博弈方 的第 个策略:博弈方 的得益:博弈:纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡,2.3 无限策略分析和反应函数,2.3.1 古诺的寡头模型2.3.2 反应函数2.3.3 伯特兰德寡头模型2.3.4 公共资源问题2.3.5 反应函数的问题和局限性,寡头产量竞争以两厂商产量竞争为例,古诺的寡头模型,4.5,4.5,5,3.75,3.75,5,4,4,不突破,突破,厂商2,不突破,突破,厂商1,以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5,两寡头间的囚徒困境博弈,2.3.2 反应函数,古诺模型的反应函数 划线法在无限策略上的应用,理性局限和古诺调整,Thank You!,