《第三章破解和利用囚徒困境ppt课件.ppt》由会员分享,可在线阅读,更多相关《第三章破解和利用囚徒困境ppt课件.ppt(80页珍藏版)》请在三一办公上搜索。
1、第三章 破解和利用囚徒困境,赵国洪,课件邮箱:密码:123456,一、如何走出“囚徒困境”二、如何利用“囚徒困境”,本章内容,一、如何走出“囚徒困境 ”合作是可能的吗?,价格联盟能否走出囚徒困境?,2007年夏,中国食品行业普遍刮起了涨价风。6月21日,光明、蒙牛、伊利、三鹿等14家国内外乳品企业聚集南京签署“乳品企业自律南京宣言”。约定取消特价、降价销售等促销方式,这被认为是一种变相的联合涨价。,价格联盟能否走出囚徒困境?,2007年7月26日,统一、康师傅、日清、今麦郎、华龙等方便面生产企业宣布集体涨价,幅度为20至40。,对于联合涨价,厂商们给出的统一理由是:遏制低价竞争,维护行业长远发
2、展。,价格联盟能否走出囚徒困境?,但是结果怎样呢?不到两个月,康师傅的葱爆羊肉方便面就搞起了促销活动买两包方便面即可获赠一副扑克牌;而有的超市中,统一品牌方便面则是买五连包送一个酱罐;还有方便面展开了“买五送一”的活动。再看牛奶,“买一箱伊利纯牛奶送3袋250毫升牛奶”、“光明利乐枕原价22元,现价18元”、“原价3元特浓纯牛奶现仅售2.6元”“蒙牛买一箱送一袋”乳制品业的知名品牌无一例外,全部参加了促销活动。,价格联盟能否走出囚徒困境?,霍布斯对合作协议的观点是: “不带剑的契约不过是一纸空文。它毫无保障的力量。”,理论上,几乎所有的卡特尔(类似于“同盟”)都会遭到失败,原因就在于卡特尔的协
3、定不是一个纳什均衡,没有成员有兴趣遵守。,1996年,为抗衡洋彩电对中国市场的侵入,长虹举起降价大旗,彩电全面降价18%,由此也引发了彩电行业连绵不断的价格大战。,2000年中国彩电“限价联盟”,1996年以来,彩电业大规模的价格战就有8次之多。,2000年和2001年,彩电价格频频跳水,不但没有激活整体市场,却导致销量不振,利润锐减,彩电业呈现出难掩的疲态,价格战成了整个家电业的“家常便饭”。,2000年中国彩电“限价联盟”,创维集团董事局主席黄宏生感慨地说:“卖台电视机利润不到10元钱。”,2000年中国彩电“限价联盟”,2000年6月2日,康佳、TCL、创维、海信、乐华、厦华、熊猫、西湖
4、、金星国内九大彩电企业齐聚深圳发起首届中国彩电峰会。会议决定:制定6、7月份彩电最低零售限价,各彩电企业全国各地市场执行零售成交价不得跌破此限价。中国彩电巨头们信誓旦旦扬言绝不降价。,中国彩电巨头们厌倦了连年价格战,树起价格联盟大旗。,但事与愿违,7月中旬,厦华、熊猫的29英寸超平彩电在国美以低于2000元的价格销售,低于峰会限价600多元。协议成为一纸空文,家电价格大战重又燃起。,2007年洗车行 “联手涨价”,2007年4月,重庆市600多家洗车行联合签订一份重庆汽车服务业商会诚信公约,约定将洗车价格从单次10元涨到20元,月卡不低于6折。,这是继2005年10月和2006年10月之后洗车
5、行第三次“联手涨价”。但是,三个月后,这场轰轰烈烈的“涨价联盟”最终悄然瓦解,以失败告终。,2004年中国民航业“限价联盟”,民航总局 2004年4月20日推出了运价改革方案,规定所有国内航线的机票票价下浮幅度不得超过45,以期限制国内航空公司由于“价格战”导致的恶性竞争,但实际上,2折、3折的机票频频出现,一纸公文早已被各航空公司抛于脑后。,不用协议的价格联盟,百佳超市打出低价口号,“我们的价格是全市最低的。”沃尔玛超市也打出低价保证,“我们的价格保证全市最低,否则差价双倍赔偿。”,思考:沃尔玛为什么敢作此保证?,(1)让未来相对于现在更重要些;(2)改变对策者的四个可能的收益值;(3)教给
6、对策者那些促进合作的准则、事实和技能。,走出囚徒困境的三大途径,让未来相对于现在更重要些,地摊、车站、旅游点,不但商品和服务质量最差,而且假货横行,因为在商家和顾客之间“没有明天”一个旅客不大可能因为你的饭菜可口而再次光临,一锤子买卖,不赚白不赚。,对未来的预期,是影响我们行为的重要因素。一种是预期收益:我这样做,将来有什么好处;一种是预期风险:这样做可能面临的问题。这些将影响个人的策略。在公共汽车上,两个陌生人会为一个坐位争吵,可如果他们认识,就会相互谦让。为什么?,让未来相对于现在更重要些,两个原始人见面,一个拿着兽皮,一个拿着野果,他们都想把对方的东西据为己有。如果他们的见面是偶然的,结
7、果会如何?可如果他们都知道对方生活在附近,结果又会如何?,让未来相对于现在更重要些,在农村比在大城市容易出现合作便是因为人与人的接触更频繁。,让未来相对于现在更重要些,频繁接触可增大未来的影响,分解是促进稳定合作的有效方法,让未来相对于现在更重要些,将军备控制和裁军条约分解成多个阶段。有许多小的步骤比只有少数大的步骤更有助于促进合作。在商业上,商人们喜欢一个大订单分别按每次发货时间付款,而不愿等到最后付总账。使得当前步骤的背叛相对于整个未来的接触过程来说不是那么有诱惑力,这是促进合作的好方法。,重复博弈能否促进合作?,重复博弈:是指同一个博弈被重复进行。在无限期重复博弈中,对于任何一个参与者的
8、欺骗和违约行为,其他参与者总会有机会给予报复。有限重复博弈:是指重复次数是有限的且有确定终点的博弈。无限重复博弈:是指重复次数是无限的或者对双方而言不知道哪一次是尽头的博弈。,博弈游戏6:囚徒困境,请2位同学拿纸和笔上来,扮演囚徒困境中的囚徒,比赛:5次定输赢。两名玩家不得交换意见,同时做出选择。玩家可以选择“招”或者“不招”。按所判年期计分(1年为1分)。被判年数最少者获胜。胜者加4分,其余加2分。,乙,重复博弈,博弈专家已经用数学证明,在无限次重复博弈的情况下,合作可能是稳固的。因为任何一次背叛都会招致对方在下一次博弈时的报复;而双方都取合作态度会带来合作收益。如果是一次性博弈或有限次博弈
9、呢?双方是否会从互相背叛走向互相合作?,供应商合作还是背叛?,华南农业大学采购粉笔,每年招标,在众多的供应商中只挑选两个供应商。每个月采购一次,两个供应商每个月报价。实行“价低者得”原则,如两供应商报价相同,则订单分为均等的两半,两供应商各得50%。如报价不同,则全部订单给价低者。这两个供应商应如何报价?如果两个供应商合谋,你该怎么办?并非有未来就必定能合作。,蜈蚣博弈,蜈蚣博弈:一场颠前倒后的博弈。蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略。它使得未来的计划明晰化,使你不再徘徊。蜈蚣博弈也有一个致命的悖论,仍旧是个人利益和集体利益的冲突,因为最后一次的背叛收益始终优于合作。可
10、悲的是,这一次背叛将由于人性的理智,穿越时光隧道,回到原始的地点:人们将从开始就拒绝合作。还是感谢我们这个不完美的世界吧,事实上人们很少这样做。当然合作到最后的也很少。,(1)使得未来相对于现在更重要些;(2)改变对策者的四个可能的结果的收益值;(3)教给对策者那些促进合作的准则、事实和技能。,走出囚徒困境的三大途径,改变对策者的四个可能的收益值,思考:如何促使“囚徒困境”中的两个囚徒合作而非背叛?,改变对策者的四个可能的收益值,烟草商为何不反对禁止烟草广告 ?,1971年,在“禁烟运动”的声势下,美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是,这一回财大气粗的烟草公司反应相当平
11、静,并没有动用其庞大的社会资源和影响力阻止这个法律的通过。后来的统计资料表明:尽管烟草广告因受到限制而减少,可是烟草公司的利润却提高了。,企业广告战的“囚徒困境”,(做广告,做广告)是双方决策的纳什均衡,因为禁令使他们从“囚徒困境”中解放出来。 烟草行业竞争激烈,为争夺市场,各大烟草公司每年都要花费巨额广告费用,这无疑降低了它们的利润水平。也就是说,如果烟草公司都不做广告,它们的利润更高。烟草公司能否达成都不做广告的协议呢?不能,因为谁遵守协议,就很可能被对手耍弄。烟草公司做不到的,国家为它做了:法律起到了协议的作用,而政府承担了监督的成本。,烟草商为何不反对禁止烟草广告 ?,改变对策者的四个
12、可能的收益值,A公司与B公司是合作伙伴, A公司经常向B公司购买原材料,由于两家公司在不同的城市,于是两个公司谈判后签定合同:合同签订一周之后的那一天,在公司A将现金打入公司B的银行帐户,公司B则发货到公司A,若违约则处于2-5倍罚款。,改变对策者的四个可能的收益值,在没有法律背景的条件下,双方选择不合作(逃款或逃货)是自然的纳什均衡点。然而引入强制性的法律则不同,这时他们所签合同具有法律效应,一旦有一方违约,另一方有权罚款,并且法院可以强制实行。在这种情况下,两个“囚徒”公司自然都会采取合作策略,完成合同。简单说来,就是法律改变了两个公司博弈的均衡结果。,改变对策者的四个可能的收益值,法律(
13、作弊与惩罚),霍布斯认为,国家以法律形式规定对某种行为如“违约”采取惩罚措施,如果惩罚措施不力,即使扣除惩罚的成本,行动者从“违约”策略中获取的好处大于他采取“守信”策略所带来的好处,那么国家的法律措施是无效率的或者说是低效率的。,因此国家法律的制定应以抑制对他人的危害行动为原则。这就是法律制定的第一条原则:效率原则。效率原则是从对社会的整体考虑分析得出的,从这个意义上讲,法律越严格越好,越严格越有效率。,法律(作弊与惩罚),强制性有效率的法律之重要性还可从冷战时期美苏两个超级大国40多年的军备竞赛中得出反证。尽管他们双方签定一些制止军备竞赛的协议,但是由于缺乏一个世界性的公平合理又具有强制性
14、的法律环境,其结果仍然是陷入无法解脱的囚徒困境。法律制定的第二条原则是,法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则,这就是公平原则。用简单的一句话说,法律惩罚太重对犯法者不公平,惩罚太轻则对社会或他人不公平。,法律(作弊与惩罚),大唐电信虚增利润再暴诚信劣迹 证监会处罚太轻凸显制度缺陷,案例:,ST大唐于2007年8月20日收到证监会下达的行政处罚事先告知书,指称ST大唐存在“所披露的信息有虚假记载”和“重大遗漏”的行为,2006年虚增利润总额共计3719万元。证监会由此拟决定对ST大唐处以30万元罚款。,法律(作弊与惩罚),不过,这一处罚过轻,虚增利润3719万元,被罚却
15、只有区区30万元,这不仅无法震慑ST大唐,对其他上市公司也难起到以儆效尤的作用。,ST大唐近年来一直负面新闻不断。2007年5月,ST大唐出尔反尔的“阴阳公告”: 在2006年前3季度盈利2761万元的情况下,ST大唐竟然全年巨亏7.19亿元,并且被戴上ST帽子。巨大的反差,让人瞠目。,法律(作弊与惩罚),过去几年,大唐电信已多次遭到主管部门的公开谴责和警告,不诚信行为早被记录在案。ST大唐2008年7月3日公布的大唐电信科技股份有限公司治理自查报告和整改计划披露,在过去4年里,公司曾经3次因信息披露不规范而被上海证券交易所批评、谴责和惩戒。2003年8月27日,大唐电信被上海证券交易所内部批
16、评,因为其“在关联交易及决策方面存在问题”。2006年6月24日,又被内部通报“从2001年12月到2003年4月,年报披露方面存在违规行为”。其间,还有4次接收到监管部门的调查通知书,有“资金占用与担保”以及“虚假信息披露”等多个不同原因。2003年、2004年还两次被证监会要求对年报责令整改。ST大唐为何频频出尔反尔?作为上市公司的诚信在哪里?,法律(作弊与惩罚),安然公司是一家美国大型能源公司,其排名曾居美国上市公司第七位。2001年12月,该公司申请破产保护,成为当时美国历史上最大的破产案。当年,安然已连续年被评为美国最具创新精神公司。然而,这个拥有上千亿美元资产的公司却在几周内破产。
17、破产原因是被发现,该公司长期通过复杂的财务合伙形式掩盖巨额债务并虚报盈余。为安然其做假账的安达信会计师事务所(世界五大会计师事务所之一)也随之破产。,“安然事件”及“安达信事务所倒闭”,安然公司办公大厦图,法律(作弊与惩罚),美国安然公司案主角可能面临数十年监禁,美国安然公司前首席执行官斯基林(左),已自杀的安然公司前副董事长克利夫巴克斯特,2006年10月23日,美国休斯敦联邦地区法院作出判决,安然公司前首席执行官因犯有欺诈、共谋、内部交易等一系列罪行被判处年又个月徒刑。,在重复型的囚徒困境中,并不是签订合作协议很困难,困难的是这个协议对博弈各方是否具有很强的约束力。一个合作契约建立的困难在
18、于任何协议签订之后,博弈参与者都有作弊的动机,因为至少在作弊的这一局博弈中,作弊者可以得到更大的收益。(没有法律约束的情况下,作弊是纳什均衡点),法律(作弊与惩罚),法律(作弊与惩罚),霍布斯对合作协议的观点是: “不带剑的契约不过是一纸空文。它毫无力量去保障一个人的安全。”,道德有助打破囚徒困境,与法律一样,道德也是对某些不合作行动的惩罚机制,有助人类从囚徒困境中走出来。道德感自然地使人们对不道德的或不正义的行为谴责或者对不道德的人不采取合作,从而使得不道德的人遭受损失。这样,社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道德,或者正义或非正义的观念,就自动地产生了调节作用。人天
19、生是自私的,他努力使自己的利益最大化(当然这不是对现实的人的看法,而是一个抽象的假定)。但现实中的人为什么有道德呢?从自私的假定中怎么推出道德的人?,猴群博弈与道德的产生,鲁国之法,鲁人为人臣妾于诸侯,有能赎之者,取其金于府。子贡赎鲁人于诸侯,来而让不取其金。孔子曰:“赐失之矣。自今以往,鲁人不赎人矣。取其金则无损于行,不取其金则不复赎人矣。”孔子认为子贡坏了规矩,破坏了公平的机制。这种有违公平的道德行为反而不利于道德的形成,因为大多数人是不会也不一定有能力学子贡的做法。,道德与博弈,子路拯溺者,其人拜之以牛,子路受之。孔子曰:“鲁人必拯溺者矣。”孔子见之以细,观化远也。有人就说子路贪心。孔子
20、却表扬他做对了。因为这一行为向社会表明了:只要冒着危险救了人,就可以心安理得地得到回报,就可以鼓励更多的人去救人。,良好道德风尚的形成,并不主要依靠于道德教育,而在于公平的社会机制和相应道德规则的建立。在缺乏公平的前提下,不可能建立起一个真正具有内生力的道德社会,不可能使道德制度化和自觉化。,道德与博弈,道德约束的局限性,儿歌:“我在马路边捡到一分钱,把它交给警察叔叔手里边,叔叔拿着钱,对我把头点,我高兴的说了声叔叔再见。”,如果不是1分钱,而是100元、1000元、10000000元呢?我们还交给警察叔叔吗?,诚信,大学饭堂自行收拾餐盘(大家为什么会自觉?),某大学饭堂汤勺被偷500多个,打
21、孔标记。,诚信,美国美国麦当劳餐厅,付款后给客人一个可乐杯,客人自行到自动机前倒可乐。就餐完后客人自行收拾餐盘。,常言道:“婚姻是走向爱情的坟墓”,但从博弈论的角度来看,婚姻恰恰是男女双方签订的一种协议,具有一定约束力的协议,因为一旦对方背叛婚姻,就会受到家庭的压力与社会舆论的谴责。婚礼就是一个用来庆祝和促进持续关系的公共行为,对婚姻的稳定有促进作用。,维持婚姻稳定的方法,维持婚姻稳定的方法,现在有的情侣在结婚前,约定婚后对感情不忠的一方“净身出户”,财产全部归对方所有。这种在最初博弈之时就讲好惩罚机制的做法,其目的就是为了减少背信弃义行为的发生。,(1)使得未来相对于现在更重要些;(2)改变
22、对策者的四个可能的结果的收益值;(3)教给对策者那些促进合作的准则、事实和技能。,走出囚徒困境的三大途径,走出囚徒困境的三大途径,一艘军舰在夜航中,舰长发现前方航线上出现了灯光。 舰长马上呼叫:“对面船只,右转30度。” 对方回答:“请对面船只左转30度。” “我是美国海军上校,右转30度。” “我是加拿大海军二等兵,请左转30度。” 舰长生气了:“听着,我是列克星顿号战列舰舰长,这是美国海军最强大的武装力量,右转30度!” “我是灯塔管理员,请左转30度。”,视频:美国海军与灯塔,触发策略,如果没有外部强制力,囚徒困境的两个参与者采取什么策略才可维持合作的稳定性呢?对重复博奕的研究结果证明有
23、一种最好的策略:只需将一个原则贯穿始终,即“以牙还牙”(Tit-for-tat)。以牙还牙策略在博弈论里面称为触发策略(Trigger strategy),或称冷酷策略。,圣经旧约:以眼还眼以牙还牙,触发策略,以牙还牙策略的获胜有一个十分重要的条件,即博弈是无限次重复的。 以牙还牙策略是指如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略。如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。,触发策略,思考:对待自己的恋人/爱人是否可以用“触发策略”
24、?,触发策略,好的策略必须具有的一个特点是“清晰性”,太复杂的对策不见得好。在博弈中过分复杂的策略使得对手难于理解,无所适从,因而难以建立稳定的合作关系,明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。针锋相对策略就有很好的清晰性,从而让对方不得不采取合作的态度。触发策略是一个不怕曝光的策略,而且恰恰需要别人知道你的基本原则,这样才能更好地实现合作双赢。针锋相对策略的优越性充分展示了一个纯粹自利的人何以会选择善,只因为合作是自我利益最大化的一种必要手段。,恋爱时期的誓言人生发誓最多的莫过于恋爱时期。非你不娶,非你不嫁,海枯石烂情不变之类的誓言。为什么向恋人发誓呢?,触发策略不怕曝光的策略,触
25、发策略不怕曝光的策略,婚姻时期对爱人的“侵权行为”如果你发现丈夫有婚外情,你提出抗议,他不知悔改反扇了你一耳光,你该怎么办?,触发策略,在爱情中的博弈原则应该是:善意而不是恶意地对待恋人;宽容而不是尖刻地对待恋人,关键是能够彼此宽容,既宽容对方的缺点;强硬而不是软弱地对待恋人,就是要在我永远爱你的善意的前提下,做到有爱必报,有恨也必报。,比如对恋人与其他异性的亲热行为,要有极其强烈的敏感与斩钉截铁地回报;简单明了而不是山环水绕地对待恋人。,触发策略,当你受到朋友的欺骗时,你知道即便报复也不能消除已对你造成的伤害,而且你还希望两人的关系能够继续,那么你最好是宽恕他。但是,若他知道即便伤害了你也会
26、获得宽恕的时候,他就可能一直有意无意地不停伤害你。,心地善良却遇人不淑的女子,一次又一次原谅背叛她的丈夫,希望用真情感动他回心转意;但结果丈夫反而得寸进尺,因为他知道,只要一些花言巧语、再摆出一副要痛改前非的可怜相,就会轻易地获得宽恕。,我错了,以后一定改!,合伙者为什么多以拆伙告终?触发策略通常都会竭尽全力促成合作,同时避免相互背叛。不过,尽管如此,我们仍然认为以牙还牙策略是一个有缺陷的策略。如果双方存在误解,不管出现误会的几率怎样微乎其微(即使万亿分之一),一旦出现误会,双方无论是将问题复杂化,还是澄清误会,合作便有了危机,甚至土崩瓦解。即使对方真的背叛了你,你通过行动或者不行动来显示你对
27、此介意,你自己觉得是相称的“警告”,但对方很可能认为你反应过度,小题大做。,触发策略,触发策略,一旦将以牙还牙策略用于解决现实世界的问题,误解就难以避免,结局就可能是灾难性的。以牙还牙策略缺少的是一个宣布“到此为止”的方法。一方对另一方的背叛行为进行惩罚,从而引发连锁反应(冤冤相报何时了)。对手受到惩罚之后,不甘示弱,进行反击。这一反击又招致第二次惩罚。无论什么时候,这一策略都不会只接受惩罚而不作任何反击。,二、如何利用“囚徒困境”,迫使对手进入“囚徒困境”,利用囚徒困境模型,通过巧妙的布局设计,人为创造出一种囚徒困境,迫使对方做出对自己有利的行动。,杜克大学化学系两位学生平时成绩甚优,都是A
28、。在期末考试前的周末,他们非常自信,于是去参加弗吉尼亚大学的一场聚会。聚会太尽兴,睡过了头,结果没赶上周一上午的化学期末考试。他们向教授撒了个谎,说往回赶时途中轮胎爆了。由于没有备用胎,他们只好整夜呆在路边等待救援。现在请求教授允许他们隔天补考。教授想了想,同意了。两人胸有成竹地来参加补考。教授安排他们分别在两间教室作答。第一页只有一条题目,占10分,非常简单。两人都写出了正确答案,心情舒畅地翻到第二页。第二页只有一个问题,占90分:“请问破的是哪只轮胎?”结果不言而喻,两个学生只好乖乖地向教授认错。,如何利用“囚徒困境”,如何破解迟到困局,王老师组织全班同学集体活动(比如郊游)时,遇到一个棘
29、手问题。王老师通知全班同学早上8:00到校门口集合,结果有几个同学拖拖拉拉,导致大家8:15才出发。此后,王老师改变策略,虽然真实的集合时间仍是8:00,但他通知大家7:45集合,结果最晚的几个同学也在8:00赶到,从而准时出发。王老师对自己的策略很满意。,然而好景不长。时间久了,同学们都发现了王老师的策略,并可根据王老师的通知猜测真实的集合时间。因此,每当王老师通知7:45集合时,大家仍然按8:00来做安排。从而导致几个同学在8:00之后才赶来。而哪些准时即7:45到达的同学都开始抱怨,也慢慢变得不那么守时了。那么王老师应制定怎样的策略,才能使活动准时开始,并使大家都满意呢?,如何破解迟到困
30、局,这是一个老师与学生、学生与学生之间的博弈,即多人的囚徒困境。每个学生都知道,其他学生的优势策略是即不能太早到达以免浪费等待时间,又不能太晚,以免承担耽误大家时间的责任。,如何破解迟到困局,要破解这个困境,王老师有两个策略选择:一、只要过了集合时间,就不再等下去,让迟到的同学独自承担责任。这种责任和相应的惩罚对同学会造成很大的损失,他们就不会再迟到了。二、如果迟到的学生比较多,那么等某个数量的学生到齐后马上出发,而让迟到时间过长的那些同学承担责任。,如何破解迟到困局,如何利用“囚徒困境”,利用囚徒困境模型,设计改变博弈参与者的格局,造成一种压力,促使他们合作。最常用也最为有效的一种策略,就是
31、有意制造信息的不对称。,如何利用“囚徒困境”,战国策伍子胥的故事楚平王怀疑太子“外交诸侯,将为人乱”,遂迁怒于伍子胥的父亲太子太傅伍奢,将其杀害。伍子胥只身逃往吴国。在逃亡中,伍子胥在边境被守关的斥侯抓信了。斥侯对他说:“你是逃犯,我必须将你抓去面见楚王!”伍子胥说:“你知道楚王为什么抓我吗?是国为有人跟楚王说,我有一颗宝珠。楚王一心想得到我的宝珠,可我的宝珠已经丢失了。楚王不信,以为我欺骗他。我没有办法,只好逃跑。现在你抓我去见楚王,那我将告诉楚王是你夺去了我的宝珠,并吞到肚子里去了。楚王为了得到宝珠就一定会先把你杀掉,并剖开你的肚子,把你的肠子一寸一寸地剪断来寻找宝珠。这样我活不成,而你会
32、死得更惨。”斥侯信以为真,非常恐惧,赶紧把伍子胥放了。,伍子胥被抓后,处于一种绝对的劣势地位。于是伍子胥采取威协策略,抢先宣布自己将无条件地进行报复。伍子胥故意利用信息不对称,把斥侯置于类似囚徒困境的局面。,如何利用“囚徒困境”,伍子胥将“囚徒困境”中的同时出招抢先改变为相继出招,并告知斥侯自己的招数(如被押送,则将会诬陷)。对于伍子胥而言,在斥侯采用“押送”的策略下,无论是否采用“诬陷”策略,结局均是“处死”。斥侯也十分清楚这一结局,因此伍子胥的威胁是可信的。面对可能出现的潜在危机,人们总是抱着“宁可信其有,不可信其无”的态度,这是一种预期的支付,以保证自己免于陷入困境。这种预期支付心理,恰
33、恰给了处于显性困境以机会。创造一种困境,使对主陷入与你一样无法全身而退的困境。,如何利用“囚徒困境”,空城计:诸葛亮与司马懿的博弈,诸葛亮拥有比司马懿更多的信息,他知道自己兵力微薄,但是司马懿并不知道。而且,为了让司马懿无从了解、判断,诸葛亮还偃旗息鼓,大开城门,打起了心理战。因此这是一个信息不对称的博弈。,弃城,守城,攻城,退兵,司马懿,诸葛亮,孔明可以选择的策略是,“弃城”或“守城”。无论是“弃”还是“守”,只要司马懿明确知道他自己的收益,那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿知道他自己的策略结果。他的空城计是降低司马懿进攻的可能收益,使得司马懿认为,后退比进攻要好。,败,空城
34、计:诸葛亮与司马懿的博弈,在“空城计”博弈中,孔明了解双方的局势,制造空城假象的目的就是让司马懿感到进攻有较大的失败的可能。用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时,在司马懿看来,进攻失败的可能性较大,而退兵的期望效用大于进攻的期望效用。,在信息不充分的情况下,博弈参与者不是使自己的支付或效用最大,而是使自己的“期望效用”最大。,明史的故事崇祯元年,朱由检初登帝位,发出“官员不爱钱”的号召。户科给事中韩一良对这种号召不以为然,上疏奏曰:“如今何处不花钱?哪个官员不爱钱?本来就是用钱买来的官位,不爱钱如何赚回来?我这两个月辞却了别人送我的出书费五百两银子,我交往少尚
35、且如此,其余的可以推想了。伏请陛下严加惩处贪官。”崇祯召见群臣,让韩一良当众念其奏疏。读罢,崇祯升韩一良为佥都御史。这时,史部尚书王永光请求皇帝,让韩一良点出具体人名,哪些是贪官,是谁送他银子。韩一良吞吞吐吐,不愿告发。崇祯准其密奏,可是等了五天,韩一良谁也没告发。崇祯再次召见群臣,当面追问韩一良。然而韩一良就是不肯点名,最后推说风闻有人要送。崇祯大怒,撤其官职。,用道德来保持均衡,明史的故事韩一良宁可皇帝撤其官职,断送前程,甚至顶着被治罪的风险,硬是不肯告发行贿他的人。是什么力量让他这样做?是怕得罪人?作为给事中,检举起诉和得罪人乃其分内事。其实,是一种外在规则的压力,或者说外在规则在其内心
36、形成的“道德”在起作用,使其坚决不肯背叛行贿他的人。,用道德来保持均衡,假装不知道有尽头,你到菜场去买菜,当你担心上当受骗而犹豫不决时,卖菜的摊主便会对你说:“你放心好了,我天天在这里卖菜,不会骗你的,如果菜不好你回来找我!”他强调自己“天天”在这里卖菜,翻译博弈论的语言就是“我跟你是重复博弈”。,总结,如何促进合作:(1)要建立持久的关系,即使爱情也需要建立婚姻契约以维持双方的合作;一次性的或有限次的博弈中,对策者是没有合作动机的;(2)对对方的行为要做出回报,一个永远合作的对策者不会有人跟他合作。要维持声誉,说要报复就一定要做到,人家才知道你是不好欺负的,才不敢不与你合作;不仅对背叛要回报,对合作也要作出回报。(3)不要首先背叛,以免担上罪魁祸首的道德压力;不要耍小聪明,占人家便宜。(4)能够分步完成的对局不要一次完成,以维持长久关系,比如,贸易、谈判都要分步进行,以促使对方采取合作态度;,总结,爱克斯罗德合作的进化提出:友谊不是合作的必要条件,即使是敌人,只要满足了关系持续,互相回报的条件,也有可能合作。比如,第一次世界大战期间,德英两军在战壕战中遇上了三个月的雨季,双方在这三个月中达成了默契,互相不攻击对方的粮车给养,到大反攻时再你死我活地打。这个例子说明,友谊不是合作的前提。,总结,“当人们处于从恶能得到好处的制度之下,要劝人从善是徒劳的。” 乔治霍兰萨拜因政治学说史,