《第三章完全且完美信息动态博弈ppt课件.ppt》由会员分享,可在线阅读,更多相关《第三章完全且完美信息动态博弈ppt课件.ppt(86页珍藏版)》请在三一办公上搜索。
1、第三章 完全且完美信息动态博弈,本章讨论所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。,本章主要内容,3.1 动态博弈的表示法和特点3.2 可信性和纳什均衡的问题3.3 子博弈和子博弈完美纳什均衡3.4 几个经典动态博弈模型3.5 有同时选择的动态博弈模型3.6 动态博弈分析的问题和扩展讨论,3.1 动态博弈的表示法和
2、特点,3.1.1 阶段和扩展性表示3.1.2 动态博弈的基本特点,3.1.1 阶段和扩展性表示,阶段:动态博弈中一个博弈方的一次选择行为,节点或信息集终点,例子:仿冒和反仿冒博弈,3.1.2 动态博弈的基本特点,策略是博弈方在整个博弈中轮到选择的每个阶段,针对前面阶段的各种情况作相应选择和行为的完整计划以及由不同博弈方的这种计划构成的组合。结果包括双方(或多方)采用的策略组合、实现的博弈路径以及各博弈方的得益。得益对应每条路径,而不是对应每步选择、行为。动态博弈的非对称性先后次序决定动态博弈必然是非对称的。后行为的博弈方有更多的信息,处于较为有利的地位,但是,有时先选择、行为的博弈方反而有利,
3、有“先行优势”。,案例一红色算我赢,黑色算你输 摘自策略思维,巴里毕业的时候,为了庆祝一番,参加了剑桥大学的五月舞会(这是英国版本的大学正式舞会)。庆祝活动的一部分包括在一个赌场下注。每人都得到相当于20美元的筹码,截至舞会结束之时,收获最大的一位将免费获得下一年度舞会的入场券。到了准备最后一轮轮盘赌的时候。纯粹处于一个令人愉快的巧合,巴里手里有了相当于700美元的筹码,独占鳌头,第二位是一名拥有300美元筹码的英国女子。其他参加者实际上已经被淘汰出局。就在最后一次下注之前,那个女子提出分享下一年舞会的入场券,但是巴里拒绝了。他占有那么大的优势,怎么可能满足于得到一半的奖赏呢?,为了帮助大家更
4、好地理解接下去的策略行动,我们先简单介绍一下轮盘赌的规则。轮盘赌的输赢取决于轮盘停止转动时小球落在什么地方。典型情况是,轮盘上刻有从0到36的37个格子。假如小球落在0处,就算庄家赢了。玩轮盘赌最可靠的办法就是赌小球落在偶数还是奇数格子(分别用黑色和红色表示),这种玩法的赔率是一赔一,比如一美元赌注变成两美元,不过取胜的机会只有18/37。在这种情况下,即使那名英国女子把筹码全部押上,也不可能稳操胜券;因此,她被迫选择一种风险更大的玩法。她把全部筹码押在小球落在3的倍数上。这种玩法的赔率是二赔一(假如她赢了,她的300美元就会变成900美元),但取胜的机会只有12/37。,现在,那名女子把她的
5、筹码摆在桌面,表示她已经下注,不能反悔。1、巴里应该怎么办?2、什么情况下,那名女子才有赢的可能?,案例讨论,巴里应该模仿那名女子的做法,同样把300美元筹码押在小球落在3的倍数上。那么这么做可以确保他领先对方400美元,最终赢得那张入场券:假如他们都输了这一轮,巴里将以400:0获胜;假如他们都赢了,巴里将以1300:900取胜。那名女子根本没有其他选择。她的唯一希望在于巴里先赌。假如巴里先在黑色下注200美元,她应该怎么做?她应该把她的300美元押在红色。把她的筹码押在黑色对她没有半点好处,因为只有巴里取胜她才能取胜(而她将是亚军),自己取胜而巴里失败就是她唯一的反败为胜的希望所在,这就意
6、味着她应该在红色下注。这个案例里,先行者处于不利的地位。,3.2 可信性和纳什均衡的问题,3.2.1 相机选择和策略中的可信性问题3.2.2 纳什均衡的问题3.2.3 逆推归纳法,3.2.1 相机选择和策略中的可信性问题,动态博弈中博弈方的策略是他们自己预先设定的,在各个博弈阶段,针对各种情况的相应行为选择的计划。这些策略实际上并没有强制力,而且实施起来有一个过程,因此只要符合博弈方自己的利益,他们完全可以在博弈中改变计划。我们称这种问题为动态博弈中的“相机选择”问题。,不同版本的开金矿博弈分钱和打官司的可信性,3.2.2 纳什均衡的问题,第三种开金矿博弈中, (不借-不打,不分)和(借-打,
7、分)都是纳什均衡。但后者不可信,不可能实现或稳定。结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题。,3.2.3 逆推归纳法,定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。 逆推归纳法是动态博弈分析最重要、基本的方法。,乙,不借,(1,0),借,乙,(1,0),(0,4),借,3.3 子博弈和子博弈完美纳什均衡,
8、3.3.1 子博弈3.3.2 子博弈完美纳什均衡,3.3.1 子博弈,定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。,3.3.2 子博弈完美纳什均衡,定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。,子博弈完美纳什均衡能够排除策略组合中不可信行为选择的原因是:虽然包含不可信行为选择的策略组合可以构成整个博弈的纳什均衡,但其中的不可信行为选
9、择,至少在博弈的某些子博弈中不符合博弈方的自身利益,因而不构成纳什均衡,因此要求在所有子博弈中都是纳什均衡的子博弈完美纳什均衡,就排除了其中存在不可信行为选择的可能性,从而在动态博弈分析中具有真正的稳定性。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。,3.4 几个经典动态博弈模型,3.4.1 寡占的斯塔克博格模型3.4.2 劳资博弈3.4.3 讨价还价博弈3.4.4 委托人代理人理论,3.4.1 寡占的斯塔克博格模型,先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。,产量 得益厂商1 3单位 4.5厂商2 1.5单位 2.25,先行优势,
10、3.4.2 劳资博弈,先由工会决定工资率,再由厂商决定雇用多少劳动力。工会代表的劳方效用应该是工资率和雇佣数两者的函数, 即:u=u(W,L), w和L分别表示工资率和厂商雇佣的人数 。厂商的利润函数为: (W,L)R(L)WL由于该博弈先由工会决定工资率,然后厂商根据工会提出的工资率决定雇佣多少劳动。因此可以用逆推归纳法来分析这个博弈:先分析第二阶段厂商的选择,也就是厂商对工会选择的工资率的W的反应函数L(W)。,3.4.3 讨价还价博弈,甲乙二人分享1万元钱的三回合讨价还价博弈,不接受,出S2,不接受,出S(S10000),三回合讨价还价博弈结果的讨论,无限回合讨价还价,3.4.4 委托人
11、代理人理论,一、委托人代理人关系经济活动和社会活动中有很多委托人代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。委托人代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性委托人代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等,二、无不确定性的委托人代理人模型,R(S)-w(S), w(S)-S,R(E)-w(E), w(E)-E,R(0),0,R(0),0,代理人的选择 激励相容约束:w(E)-E w(S)-S w(E) w(S)+E-S,参与约束:,参与约束,委托人的选择,数值例子,12, 2,
12、0,0,0,0,7,1,E=2, S=1,W(E)=4, w(S)=2,三、有不确定性但可监督的委托人代理人博弈,因为可监督,因此代理人报酬与成果无关,只与努力情况有关。不确定性风险由委托人承担。代理人选择同无不确定性情况。,努力:委托:0.9*20-w(E)+0.1*10-w(E)0不委托:0.9*20-w(E)+0.1*10-w(E)0,偷懒:委托: 0.1*20-w(S) +0.9*10-w(S)0不委托: 0.1*20-w(S) +0.9*10-w(S)0,四、有不确定性且不可监督的委托人代理人博弈,只能根据成果付酬,w是成果函数,而非努力程度函数。不确定性对代理人利益、选择有影响。,
13、努力:0.9*w(20)-E+0.1*w(10)-E0.1*w(20)-S+0.9*w(10-S),接受:0.9*w(20)-E+0.1*w(10)-E0,委托:0.9*20-w(20)+0.1*10-w(10)0,激励相容约束,促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件,参与约束,对于委托人来说,就是要根据上述两个条件,以及 E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20)-w(10),五、选择报酬和连续努力水平的 委托人代理人博弈,店主和店员的问题,商店的利润 ,是均值为0的随机变量店员的负效用 , 是店员的努力机会成本为1店主采用的报酬
14、计算公式店员的得益店员期望得益为店主的得益为,参与约束:当店员风险中性时 符合其最大利益店主选择下限 代入得益公式得:期望得益为 ,易求得令 得 ,再代入参与约束得 ,求数学期望得 解得 ,则店主的最优激励工资计算公式是,3.5 有同时选择的动态博弈模型,3.5.1 标准模型3.5.2 间接融资和挤兑风险3.5.3 国际竞争和最优关税3.5.4 工资奖金制度,3.5.1 标准模型,博弈中有四个博弈方,分别称为博弈方1、博弈方2、博弈方3和博弈方4第一阶段是博弈方1和博弈方2的选择阶段,他们同时在各自的可选策略(行为)集合 和 中分别选择 和 第二阶段是博弈方3和博弈方4的选择阶段,他们在看到博
15、弈方1和博弈方2的选择 和 以后,同时在各自的可选策略(行为)集合 和 中分别选择 和各博弈方的得益都取决于所有博弈方的策略 即博弈方i的得益是各个博弈方所选择策略的多元函数,3.5.2 间接融资和挤兑风险,下一阶段,(到期,到期) (存款,存款),(提前,提前) (不存,不存),1.2,1.2,第二阶段,建立信贷保证、保险制度,对存款进行保护、保险的原因,非法集资问题,现代社会更容易引发金融、社会风险的主要是不正规的非法金融活动,如地下钱庄和非法集资等。因为非法金融活动常常通过恶意欺骗的手段吸引人们参加,用借新债还旧债的方法,而不是经营利润偿还到期资金,信用差、管理差而且缺乏保险措施,引起金
16、融风险并引发社会问题的可能性要大得多。,3.5.3 国际竞争和最优关税,厂商的得益函数为:,第二阶段厂商选择:由于企业的利润可以分为国内市场的利润和国外市场的利润之和,且国内市场的利润取决于hi和 国外市场的利润取决于ei和 ,因此企业利润最大值问题可分为下列两个最大值问题:,和,分别求导可得:,第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府得益,再求最优化:,政府的得益函数;,3.5.4 工资奖金制度,模型假设:1.雇员i(i=1,2)的产出函数为 , 为雇员努力水平, 为随机扰动。 服从分布密度 ,均值为0的随机变量。 雇员努力的负效用函数为 ,且 。2.产量高的雇员得到高工资
17、 ,产量低的得到低工资 。3.两雇员在已知雇主宣布的工资奖金制度下,同时独立选择各自的努力程度。,雇员选择,雇主决定了工资以后,雇员同时决定努力程度:一阶条件这是雇员所选择努力程度必须满足的基本条件。,利用条件概率的贝叶斯法则:,代入得: 两雇员情况一样,对努力程度的选择也相同即: ,这样就得到:,这就是两雇员之间的静态博弈纳什均衡。 若进一步假设 ,那么,雇主选择由于雇员之间博弈的均衡是对称均衡,因此双方赢得竞赛的机会都是0.5,假设雇员能得到其他工作机会提供的得益是 ,则保证雇员接受工作的基本条件是: 此即“参与约束”。由于在雇员接受工作的前提下,雇主必然尽可能压低工资,因此约束条件可取等
18、号:,于是得到:设上述参与约束条件满足,雇主的利润函数为,雇主的期望利润为 ,因此雇主有如下的最优化问题:上述雇主决策可转化为促使雇员的努力程度满足: 一阶条件为: 代入两雇员的最优努力水平决定公式得到:,3.6 动态博弈分析的问题和扩展讨论,3.6.1 逆推归纳法的问题3.6.2 颤抖手均衡和顺推归纳法3.6.3 蜈蚣博弈问题,3.6.1 逆推归纳法的问题,1、逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构。这些可能有脱实际的可能。2、逆推归纳法也不能分析比较复杂的动态博弈。3、遇到两条路径利益
19、相同的情况时,逆推归纳法就会发生选择困难。4、对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,对理性有相同的理解,或进一步有“理性的共同知识”。,3.6.2 颤抖手均衡和顺推归纳法,颤抖手均衡,(3, 3),(2, 3),颤抖手均衡的要求:,1、是一个纳什均衡。2、不能包含任何“弱式策略”,也就是偏离对偏离者没有损失的策略。,顺推归纳法,3.6.3 蜈蚣博弈问题,该博弈是说明逆推归纳法和博弈分析困难的经典博弈,案例二新加坡:高薪养廉和严厉处罚,众所周知,新加坡是世界上廉洁程度比较高的国家之一。这既得益于它的高薪养廉制度,还
20、得益于其对贪污贿赂行为的严厉处罚。 20世纪七八十年代,新加坡政府曾连续四次给公务员加薪20。1989年后,新加坡已成为世界上公务员工资最高的国家之一。如新加坡政府部长、常任秘书等级别的公务员工资,是参考该国银行家、会计师、工程师、律师、跨国企业负责人和本土制造业负责人等六种专业职务的薪水制定的。同时,政府每年还通过咨询机构调查私营企业工资水平,以保证公务员与私营企业职员的工资相差不大。2000年,新加坡部长级公务员月薪为484万新元,加上其他奖金,年收入超过100万新元,约合人民币500万元;局长级月薪为2万新元左右,年收入相当于200万元人民币;普通公务员的年收入也在八九万新元左右。 新加
21、坡对贪污受贿行为的处罚,更是雷厉风行,威慑力极大。,这从以下几个案例可见一斑。 黄循文,新加坡环境发展部原政务次长:1975年,因接受外商2000美元的旅游费,被判刑四年。 郑章远,新加坡国家发展部原部长。1986年,他的一个老朋友承认曾于1981年和1982年分别向他行贿40万元,帮助发展商取得土地。案发后,郑章远以为凭与李光耀的私交,李会压下此案。但李光耀不徇私情。郑最后畏罪自杀,他留给李光耀的信中称,自己是“用自杀来表达对新加坡法律的尊重”。 格林奈,新加坡商业事务局原局长。其在任职期间,曾因政绩显著被评为“杰出公务员”。1991年,他以购买新汽车为由向银行申请贷款,银行付款后他却没有购
22、买汽车而是改作他用。他的行为被发现后,法院以“欺骗银行的行为”判处其监禁一天,进而他被政府开除公职。然而,处罚最为严重的是,他50余万元新币的公积金和30万元新币的退休金也因此被取消。,杨胜德,新加坡贸易发展局原局长。1994年初,新加坡法庭判决杨胜德犯有22项贪污罪。他被判必须在半年之内偿还过去5年所贪污的钱,并且要坐牢四年;他是因在任期间介入古董买卖,开立不实发票,赚取中间差价而案发的。 由上可见,有的被告人所犯的罪行虽然很轻,但依然会受到严厉的处罚,因为,在新加坡,任何行贿、受贿都最高可判五年监禁或至少10万新元(约合49万元人民币)的罚款,或两罪并罚。一旦被查出有问题,公务员就不仅要受
23、到经济惩罚或刑事处罚,而且丢尽脸面以后将很难在社会上找到相应的工作,特别是退休金及公积金将同时被没收,这对一个公务员来说是得不偿失的。,在处罚措施中,值得一提的是新加坡的公积金制度,它已经成为新加坡政府以严养廉的强大后盾,对贪污犯罪分子具有巨大的威慑力,因为,新加坡的公务员退休后没有专门的养老金或退休工资,而是领取在职期间积存的公积金。公务员每月积存的公积金相当于工资的40,其中,18由个人承担,其余的22则由单位补贴。职务越高,工龄越长,公积金就越优厚。而一旦发生贪污受贿行为,在刑事处罚的同时,公积金将被全部没收。 高薪养廉在我国尚需时日,毕竟我国的经济基础还相对薄弱,公务员队伍还很庞大。但
24、可以在适当提高公务员工薪的同时,对职务犯罪作出更严厉的经济及刑事处罚。比如像新加坡那样,在对职务人员犯罪作出刑事处罚、没收非法所得的同时,视情节没收其公积金。虽然并非治本之策,但对于抑制职务犯罪无疑会起到促进作用。,本案例思考题: 1 新加坡的高薪养廉为什么能够成功有效地抑制官场腐败?你能否用一个博弈模型来表达这一问题? 2 新加坡在执行“高薪养廉”的同时,对贪污受贿的打击力度很大,为什么这样的威胁在某种程度上较可信?你能否用一个博弈模型来表达。 3 新加坡的反腐经验是否能为我国的反腐败工作提供借鉴意义?,1,2,(a,b),(c,d),(e,f),贪,不贪,打击,不打击,这里假设公务员为博弈
25、方1,政府为博弈方2,(50,200),(30,100),(60,100),(55,100),案例三擦枪走火博弈:古巴导弹危机(编译自A.Dixit和S.Skeath第13章),一、事件概况 由于前苏联的崩溃,一些重要的文件已经公诸于世,有关当年震动世界的古巴导弹危机的内幕也使我们了解了当年美苏那场差点引起核大战的外交争执的真实情况。我们发现,那次冲突及其结局可以运用博弈论作出解释。在那次危机的过程中,形势跌宕起伏,充满了戏剧性,而美苏两大国的领导人也冒着风险作出了许多重要的决策。事后证明,他们的决策是符合人类总体利益的。这次危机也对两大国领导人的决策能力及责任感进行了考验。正如肯尼迪总统在危
26、机期间所说的那样:“这是我挣得工资的一周”。,在1962年的夏末和初冬,前苏联开始在古巴部署中短程弹道导弹。短程弹道导弹有1100英里的射程,可打到华盛顿特区;中程弹道导弹的射程为2200英里,能打击全美的大多数主要城市和军事设施。部署导弹的阵地由最新式的苏式萨姆(SAMS)地对空SA-2型导弹护卫,它能够击落美国的U-2高空侦察机。同时还部署了一种被称为IL-28的轰炸机和战术核武器。前苏联人称这种战术核武器为Luna,而美国人称其为FROG(可地面自由发射的火箭)。古巴人可用这种武器抵挡入侵的军队。 这是前苏联第一次试图把其导弹和核武器部署在前苏联领土之外的地方。倘若他们成功了,将大大提高
27、他们针对美国的攻击能力。现在已经清楚的是当时前苏联境内可直接打到美国本土的已部署的洲际弹道导弹(ICBMS)总共不超过20枚,甚至大概只有2到3枚。他们开始在古巴部署的大约有40枚中短程导弹,这对于前苏联的进攻能力来说是一个大幅度的增强。但是,当时美国仍然在两个超级大国之间的核平衡上维持着巨大的优势。,对于前苏联来说,在古巴部署导弹的意义远远超出了直接的军事意义。成功地在如此接近美国本土的地方部署导弹对于前苏联在全球范围内的声誉及宣传来说是一个巨大的提升,特别是在亚洲及非洲,两个超级大国在那里正在进行激烈的政治及军事影响的竞争。最后,前苏联正打算将古巴作为其“东方阵营”的一个桥头堡。通过在古巴
28、部署导弹,以打消美国入侵古巴的念头,消除古巴所受到的来自美国的巨大威胁,同时,还抵消掉中国在古巴的影响,这正是当时的前苏联领导人尼柯塔赫鲁晓夫作出如此冒险举动的动机。在1962年夏末及初冬期间,美国对古巴及海上行船的监视系统发现了一些可疑的活动。在10月25日和26日,即星期天和星期一,一架美国U-2间谍飞机拍摄了古巴西部地区的照片,它们无可辩驳地显示出正在进行的中程导弹发射基地的建造(随后在10月17日又找到的短程导弹的证据)。这些照片在随后(10月16日)被提交给肯尼迪总统后,他立即组建了一个特别顾问小组,这个小组后来被称为国家安全行政委员会。他们开始讨论对策。,在第一次会议上(10月16
29、日上午),肯尼迪总统决定在他完全准备好应对方案之前,对这件事实行完全的保密和消息封锁。他这样做的主要原因是由于如果苏联知道美国人知道了古巴的事情,苏联人会赶在美国人作出反应之前加快在古巴的导弹安装及部署。除此之外,这样做也可以避免在美国境内造成人们的大恐慌。在这一周其余的时间里(10月16日到21日),国家安全行政委员会进行了多次的集中性讨论。为了保密,总统继续了他原有的正常计划日程,包括为即将参加在1962年11月举行的国会中期选举中的民主党候选人作巡回演说。国家安全行政委员会中的不同成员在关于时局的估价及支持不同的行动上存在着较大的分歧。参谋长联席会议主席认为古巴导弹部署大大打破了军事力量
30、的平衡,国防部长麦克纳马拉认为它“根本”没有影响到军事平衡,并且仍然认为这只是一个纯政治的问题。,总统肯尼迪指出,如果美国对第一次导弹部署不作出反应,则将会有随后的更多的导弹部署,苏联将会利用在美国的后院部署导弹所造成威胁迫使美国将在西柏林驻守的美军、英军及法国军队撤出。肯尼迪也意识到它是美苏之间地缘政治斗争的一个组成部分。前苏联计划将他们在古巴的存在进一步扩充为一个主要的军事基地。他们打算在11月中旬之前就完成导弹的部署。赫鲁晓夫已经计划在11月的下旬与卡斯特罗签订一个协议,然后就去纽约的联合国总部发表演讲,接着打算作出一个有关柏林问题的最后通牒,他以在古巴部署的导弹作为达到这一目的的要挟。
31、赫鲁晓夫认为肯尼迪将不得不将已部署的导弹作为一个既成事实来接受。卡斯特罗开始只是十分勉强地接受导弹部署,因为他害怕由此引起美国的入侵,但后来他也接受了,因为他感到在古巴部署的导弹会大大增加他自己的自信心并增强他那涛涛不绝演说受到人们重视的程度。,包括10月18日即星期四上午的那次会议在内,在之前的所有国家安全行政委员会召开的会议上,每个人都认为美国的反应将会是单纯的军事行动。在这些时候他们认真研究的唯一选择是:(1)对导弹阵地及(可能是)邻近的萨姆导弹阵地的一次毁灭性直接空袭;(2)对包括前苏联和古巴停泊在机场上的所有飞机的一次较广泛的空袭及(3)对古巴的全面入侵。如果需要的话,当较长程的中程
32、导弹存在的证据取得后,态度还可更加强硬。事实上,在星期四的会议上,肯尼迪讨论了在周末开始进行空袭的时间表。麦克纳马拉在10月16日礼拜二会议结束前首次提出了军事封锁的计划,并且在会议结束后在小范围内提出了一种思路(在实际行动将要发生的时候以一种神秘的方式)。国家安全行政委员会中的非军人成员们在他们发觉参谋长联席会议成员们需要的是一次大规模空中打击时,就逐渐倾向于军事封锁的选择;军方将目标仅限于导弹阵地的有限打击视为危险且无效的,以致于“他们宁愿选择不采取任何军事行动也不愿采取有限打击的方式” 。,在第一周的讨论结束之后,决定只有在军事封锁与空袭之间进行选择。持两种立场的文章都递交上来,并且在1
33、0月20日的一次非正式投票中,军事封锁建议以11比6取胜。肯尼迪作出了抉择并且于10月22日在电视上向全美公众宣布军事封锁行动开始了。他要求苏联驶往古巴的运送导弹的船只立即停止航行,同时迅速撤除已经部署在那儿的导弹。从10月23日到25日,前苏联人开初咆哮着试图恫吓和否认,赫鲁晓夫称军事封锁为“盗贼行为,是一种愚蠢的帝国主义行为”,并且声称他的船只将不会理睬它。前苏联人在联合国或其它地方到处都说他们的意图只是防御,并且提出了抗议声明,声称将与美国对抗到底。但在私下里,他们却在寻找结束危机的渠道。其中包括一些赫鲁晓夫向肯尼迪直接发出的信息,也包括一些前苏联人采用的间接和较低层次的沟通方法。事实上
34、,早在星期一,即10月22日在肯尼迪发表电视演说之前最高苏维埃会议主席团已决定不要将这次危机引向战争。直到礼拜四,即10月25日,他们才决定愿意从古巴撤回导弹,但要求作为一种交换,美国要作出不入侵古巴的承诺。但是,他们也同意“再看一看” ,以便寻求到更好的办法。当然,当时美国并不知道苏联人的这种思想准备。,在公开场合以及私下的通信里,前苏联人都建议用一种双方都作出让步的办法来解决危机,即美国从土耳其撤出导弹,苏联从古巴撤出导弹。在10月24日,即星期三那一天,军事封锁开始发挥作用了。尽管苏联人在公共场合仍然表现得十分强硬,前苏联人在处理这一事件时开始变得小心翼翼了。最高苏维埃会议主席团下令所有
35、载有最敏感物质(实际上就是中程导弹)的船只停下来并调转方向返回。但他们又命令爱沙普里雅夫将军,这位驻古巴的苏军司令把他的部队置于战斗准备状态,并且要求他使用除核武器外的所有可能的手段迎击来犯之敌。事实上,最高苏维埃会议主席团曾两次打算但又在发出命令之前取消让他使用战术核武器迎击可能来犯的美军的命令。当然,美方仅仅看见有几艘继续驶向军事封锁区的苏联船只,这些船只实际上载的是油料和其它的非军用货物。美国海军在执行其军事封锁任务时开始转向缓和。有一艘油船未经登船检查就让它通过了,而另一艘运有工业货物的不定期汽船经粗略的登船检查之后就让其继续前行。但是,紧张的状态仍然继续增加,并且双方的行为都比双方最
36、高层政治家所希望的那样来得过火一些。,在10月26日礼拜五的早晨,赫鲁晓夫私下给肯尼迪写了一封调解信,提出只要美国承诺不入侵古巴,他就将导弹撤出。但是,第二天他又态度强硬起来。看来他被所看到的两个现象壮了胆子。一是美国海军在执行军事封锁时没有过于挑衅性的行为。第二,在美国国内报纸上出现了一些带有点鸽派味道的言论。赫鲁晓夫于是在10月26日即星期六又给肯尼迪写了第二封信,提出了这一主张,并且这一次把信的内容公开了。国家安全行政委员会得出的结论是第一封信表达了赫鲁晓夫本人的想法,而第二封是在最高苏维埃主席团中强硬派的压力之下写的。事实上,后来发现,两封信都是经最高苏维埃主席团讨论和批准之后发出的。
37、国家安全行政委员会的成员们继续商讨对策,并且大家的意见也开始变得强硬起来。一种理由是大家逐步感觉到仅仅依靠封锁是不能解决问题的。到了礼拜四,国家安全行政委员会中的其他人也开始意识到这一问题。苏联人的立场变得强硬起来,正如在私下发出的安抚性“周五信件”之后发出的公开性的“周六信件”所表明的那样。最为岌岌可危的是,在星期五,美国的情报部门已发现在古巴部署有战术核武器,这表明苏联在那儿的存在比早先所想象的还要严重得多,但这也使得入侵变得对美军十分不利和危险。还是在星期六,一架美国U-2飞机在古巴上空被击落。另外,古巴防空系统向低空飞行的美国侦察机开火。,在星期六,一个导致紧张局势逐步升级的计划开始被
38、付诸行动起来。在随后的礼拜一,或最迟是礼拜二,将实施空中打击,并且对空军预备队下达了动员令。势态发展的必然性终点将是入侵。一封将由肯尼迪总统私下发给赫鲁晓夫的强硬信件已经起草,并且直接送交到驻华盛顿的苏联大使安东尼多勃雷宁手中。在这封信中,肯尼迪提出以下要求:(1)苏联将部署在古巴的导弹和IL-28轰炸机撤出,并且要进行核查(且不许有新的船只驶入古巴)。(2)美国承诺不入侵古巴。(3)几个月后美国从土耳其撤出自己的导弹,但若苏联人在公开场合提到它或者将此行动与古巴危机相联系的话,美国将放弃这一行动。要求苏联在12到24小时内给予答复,否则将会有灾难性的后果。在星期天早上,即10月28日上午,苏
39、联的无线电广播电台播送了赫鲁晓夫回复给肯尼迪的一封信的内容,其中他声明立即停止导弹阵地的建造工作,并且将拆除已安装好了的导弹,将船只驶回苏联。肯尼迪立即对此加以回应,表示对此决定大加欢迎,现在已经清楚的是,赫鲁晓夫作出让步的决定实际上在他收到经多勃雷宁转交的肯尼迪的信件之前就已作出了,但是这封信使得赫鲁晓夫更加毫不犹豫地作出了这一决定。,但这并未完全终止这场危机。美方的参谋长联席会议怀疑苏联是否如其所说的那样会撤出古巴,并坚持要去空袭古巴。事实上,在后来的几天里,古巴导弹阵地上的建造活动还持续一阵子,而联合国的检查也是成问题的。苏联人也试图将土耳其的美方导弹撤出半公开化。他们还打算让IL-28
40、轰炸机继续留在古巴而不撤出。直到11月20日,危机才最终了结并开始了撤出。,本案例思考题: 美国的军事威胁为什么能够成功迫使苏联从古巴撤出导弹?你能否用一个博弈模型来表达这一问题?,二、一种简单的博弈论解释 初看起来,这场危机的博弈论解释是十分简单的。美国要求苏联人从古巴撤出导弹;于是,美国人的目标是达到一种强迫性。为此,美国人提出一种威胁:如果苏联人不顺从的话,将最终引发两个超级大国之间的一场核大战。军事封锁是这一个必然过程的开始的第一步,并且有一个证明美国人威胁的可信性的实际行动。换句话说,肯尼迪将赫鲁晓夫推向战争的边缘。这就充分地震慑了赫鲁晓夫并迫使其就范。当然,核湮灭的可怕后果同样也会
41、令肯尼迪感到恐怖,但这一正是威胁的本质。所需的是威胁对于另一方来说是充分耗费的,以致于会诱使他们按己方意图行事,这样我们实际上就不会不得不实施这种极槽糕的行动。,我们通过描出一个博弈树,就可以将上述分析严格表达出来,见图1。,图1 古巴导弹危机的完全信息博弈, 苏联已经部署好了导弹,现在由美国首先行动。美国有两个选择,一是什么都不做,二是发出威胁。倘若美国选择什么也不做,苏联凭此就取得一个很大的军事及外交上的成就,故我们将美国此时的支付标记为2,将苏联的支付标记为2。如果美国发出威胁,就轮到苏联进行行动选择了。苏联只有两个选择:撤出或者对抗。对于苏联来说,选择撤出是令人丢尽脸面的(一个很大的负
42、数),并且对于美国的军事优势是一个再一次的证实(一个较高的正数),故我们将美国的支付记为1,将苏联的支付记为4。如果苏联对抗美国的威胁,将会爆发一场核战。这对于双方来说都是十分可怕的,但对于美国人来说是更加恐怖的事,它作为一个民主国家更加关注其人民的生命,故将美国的支付记为10而将苏联的支付记为8。这种定量化的方法是十分粗糙和臆造的,但结论并不精确依赖于我们所选定的数字。现在,我们来找出子博弈精炼均衡。如果面对美国的威胁,苏联从撤出获得的支付为4,从对抗中获得的支付为8,则他们更加偏好于撤出。给定这种预期,美国盘算着若发出威胁将获得支付1,否则获支付2。因此,对于美国来说,最优的选择是发出威胁。美国最终得支付1,苏联得支付4。,三、考虑更多复杂性后的博弈,END,