《最新电大《博弈与决策》期末考试复习指导.doc》由会员分享,可在线阅读,更多相关《最新电大《博弈与决策》期末考试复习指导.doc(6页珍藏版)》请在三一办公上搜索。
1、【博弈与决策】期末复习指导博弈与决策期末复习指导一、考试题型1、名词解释 (每小题5分,共20分)写出定义2、简答题 (每小题10分,共30分)概要回答3、论述题(每小题15分,共30分)进行分析4、案例分析题(共20分)二、考试复习详见网上课堂(1)前三部分网上课堂课件和期末复习资料和教材相关内容(2)案例详见网上课堂案例期末复习资料第一章博弈论的基本理论(一)博弈论的基本概念博弈:现实生活中,不同的决策人为了争夺资源、争夺机会使得决策人处于相互依存的复杂关系中,这就不得不思考他人有针对性行为对自身所产生的影响。博弈就是一种游戏,在这种状态下,参与者必须作出选择,并对对方的选择作出判断,这种
2、判断和选择决定了博弈的结果。每个对弈者在决定采取何种行动时不但要根据自身的利益和目的行事,也要考虑自身的决策行为对其他人的可能影响,以及其他人的行为对自身的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。博弈论:就是以参与人之间有针对性的行为产生的互动过程为研究对象的理论,探讨在互动过程中参与人的一般行为规律。博弈论的核心问题在于如何在“策略互动”的局势中找到局中人的最佳行为方式,使得采用最佳行为方式的局中人能获得最大的收益。所以博弈论可以简单理解尾研究策略互动局势中的局中人的理性行为的理论。(二)博弈论的构成要素1、博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、得益、
3、结果、均衡等。 2、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体);3、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策; 4、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排;5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西;6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则
4、来决定均衡。二、博弈论的发展简史1、萌芽阶段:博弈论思想古已有之,我国古代的孙子兵法就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。2、产生阶段:1944年科学家冯诺伊曼和经济学家奥斯卡摩根斯坦合著博弈论与经济行为将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,标志着博弈论作为一门独立的的学科诞生。3、发展阶段:1950年,约翰纳什(John Nash)引入均衡(解)的概念,即纳什均衡,将博弈论从零和博弈推进到非零和博弈(即参与人会出现双赢或双输的情况),纳什的开创性论文n人博
5、弈的均衡点(1950),非合作博弈(1951)等等,给出了纳什均衡的概念和均衡存在定理。纳什获得1994年诺贝尔经济学奖。4、高潮阶段:20世纪40年代末到50年代中期是博弈论研究的第一个高潮时期,一方面是合作博弈发展到了鼎盛时期,包括纳什和夏普里的“讨价还价”模型,“核”的概念。另一 方面非合作博弈开始创立,纳什的开创性论文n人博弈的均衡点(1950),非合作博弈(1951)以及Tucker于1950年定义的“囚徒困境”。这一时期海提出了“微分博弈”,奥曼提出了“强均衡”概念,“重复博弈”也开始研究。1965年和1975年兰哈德泽尔藤(Reinhard Selten)把纳什均衡推广到动态博弈
6、,并提出子博弈完美纳什均衡;1967-1968年间,约翰海萨尼(John Harsanyi)把纳什思想推广到不完全信息模型,提出贝叶斯均衡;他们与纳什一起分享1994年诺贝尔经济学奖。1996年诺贝尔经济学奖获得者詹姆斯莫里斯教授和威廉姆维克瑞教授在20世纪60、70年代提示不对称信息对交易带来的影响,并提出相应对策。70年代的重要事件海包括“进化博弈论”,“进化稳定策略”,此外“共同知识”也 引起了广泛关注。5、成熟阶段:80、90年代是博弈论于驻留经济学融合时期,也是博弈论走向成熟时期。这个时期最重要的进展包括Elon KohlbergZAI 1981年引入“前向归纳法”,克里普斯和威尔逊
7、在982年提出“序列均衡”,斯密1982年出版进化和博弈论,海萨尼和泽尔藤在988年提出有关非合作博弈中均衡选择的一般理论和标准。1991年佛德伯格和泰勒提出了“精练贝叶斯均衡”。三、博弈论的分类1、参与人行动的先后顺序:静态和动态静态博弈是指参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。动态博弈:参与者的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行动。2、参与人对其他参与人的了解程度:完全信息和不完全信息完全信息博弈:参与者对所有参与者的特征、策略空间及策略组合下的支付有充分了解称为完全信息;不完全信息博弈:参
8、与者对所有参与者的特征、策略空间及策略组合下的支付的信息了解得不够准确或者不是对所有参与者的特征、策略空间及策略组合下的支付的信息都有准确的了解。3、参与人之间是否进行合作:合作和非合作合作性博弈:参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟,其结果对联盟方均有利;参与人在协议范围内进行博弈。非合作性博弈:参与者在行动选择时无法达成约束性的协议4、非合作博弈四种类型及对应的均衡:(1)完全信息静态纳什均衡、占优均衡纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。也就是说,所有人的战略都是最优的。占优均
9、衡指不论其他参与者做何种策略选择,每个参与者的最佳策略都是唯一的,其结果为占优均衡。当所有博弈者都有一个占优战略时,其结果将是占优均衡。占优均衡一定是纳什均衡。(2)完全信息动态子博弈精炼纳什均衡子博弈精炼纳什均衡是泽尔腾(Selten)于年首先提出的,其目的是将那些不可置信威胁策略的纳什均衡从均衡中剔除,从而给出动态博弈一个合理的均衡解。在动态博弈中,参与人的行动有先后顺序,后行动的参与人在自己行动之前就可以观察到先行动者(参与人)的行为,并在此基础上选择相应的策略。而且,由于先行动者拥有后行动者可能选择策略的完全信息,因而先行动者在选择自己的策略时,就可以预先考虑自己的选择对后行动者选择的
10、影响,并采取相应的对策。(3)不完全信息静态博弈贝叶斯纳什均衡贝叶斯纳什均衡:在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型。由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略。但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。因此,该参与人的决策目标就是:在给定自己的类型,以及给定其他参与人的类型与战略选择之间关系的条件下,使得自己的期望效用最大化。贝叶斯纳什均衡是一种类型依赖型战略组合。(4)不完全信息动态博弈精炼贝叶斯纳
11、什均衡精炼贝叶斯纳什均衡:在不完全信息动态博弈中博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。他只是对这一概率分布有自己的主观判断,即有自己的信念。博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念。并根据这种不断变化的信念,作出自己的战略选择。第二章简单博弈与博弈均衡(一)占优战略与占优战略均衡占优战略是博弈论(game theory)中的专业术语,所谓的占优战略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。占优战略均衡必定是纳什均衡,因为局中人的占优战略是对所有其他局中人的任何战略组合情况下的最优战略选择,自然它
12、也一定是对于所有其他局中人的某个特定战略(其他局中人的最优战略)情况下的最优战略选择。但反过来不成立,纳什均衡不一定是占优战略均衡。(二)纳什战略均衡1、纳什均衡的意义: 纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,其重要影响可以概括为以下六个方面: (1)改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。(2)扩展了经济学研究经济问题的范围
13、。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。(3)加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。(4)形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照
14、经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。(5)扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。(6)改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的
15、只有两个词,那就是供给和需求”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是纳什均衡”。2、占优战略均衡和纳什均衡的联系与区别:纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语。在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。也就是说,所有人的战略都是最优的。占优战略是博弈论(game theory)中的专业术语,所谓的占优战略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。占优战略均衡必定是纳什均衡,因为局中人的占优战略是对所有其他局中人的任何战略组合情况下的最优战略选择,自然它也一定是对于所有其他局
16、中人的某个特定战略(其他局中人的最优战略)情况下的最优战略选择。但反过来不成立,纳什均衡不一定是占优战略均衡。显然,占优战略均衡是重复剔除的占优战略均衡的一种特例第三章 重复博弈与序列博弈一、重复博弈 重复博弈中的“针锋相对”策略博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。重复博弈最好的策略十分简单,只要将一个原则贯穿始终,即“针锋相对”。这一策略的获胜有一个十分重要的条件,即博弈是无限次重复的。也就是说,对局者都预期这一博弈将永远持续下去而不会停止。如果对局的次数是有限的话,上述结论将不再有效。二、序列博弈 序列博弈是指对局者选择策略有时间先后的顺序,某些对局者可能
17、率先采取行动。序列博弈也是一种动态博弈。在序列博弈中,先行者可能占据一定的有利地位,我们把它叫作先行者优势。在某些市场中,特别在涉及市场进入的竞争时,先行者优势对于企业的经营具有重要意义。第四章博弈论在企业经济管理决策中的应用一、“保证最低价格”的策略重点掌握保证最低价格策略条款内容:该条款规定,顾客在本商店购买这种商品一个月内,如果发现其他任何商店比本店更低价格出售同样的商品,本店将退还差价,并补偿差额的10%。对消费者来说,保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买,但这种条款无疑是企业之间竞争的一种手段。假定推行保证最低价格条款的商店为商店A,它的竞争者为商店B。当
18、商店A把某产品定为5000元并推行保证最低价格条款的时候,商店B应如何定价最为有利呢?如果商店B高于5000元,显然对其竞争不利,因为除非顾客不了解情况,否则他们将到商店A去购买该产品。如果商店的定价低于5000元,它能否因此而争取到更多的顾客呢?不能,因为商店A已经有了保证最低价格的条款。这样,对商店B来说,它的最优的定价策略就是与商店A制定同样的价格。再如,如果你在该商店花5000元购买了一架尼康相机,一周后你在另一家商店发现那里只卖4500元,那么你就可以向该商店交涉,并获得550元的退款。对消费者来说,保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买,但这种条款无疑是企
19、业之间竞争的一种手段。证最低价格条款是一种承诺,由于法律的限制,商店在向消费者公布了这一条款之后是不能不实行的,因此它是绝对可信的。这一承诺隐含着商店A向商店B发出的不要降价竞争的威胁,并使这种威胁产生其预期的效果。二、扩大生产能力策略垄断者为阻止潜在进入者进入市场,垄断者可能对潜在进入者进行威胁。但垄断者的这种威胁是否能达到阻止进入的目的,取决于其承诺。所谓承诺,是指对局者所采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。那么,一种威胁在什么条件下会变得令人可信呢?一般是,只有当对局者在不实行这种威胁会遭受更大损失的时候。与承诺行动相比,空头威胁无法有效阻止市场进入的主要原因是,它是
20、不需要任何成本的。发表声明是容易的,仅仅宣称将要作什么或者标榜自己是说一不二的人也都缺乏实质性的涵义。因此,只有当对局者采取了某种行动,而且这种行动需要较高的成本,才会使威胁变得可信。三、限制进入定价策略限制进入定价是指现有企业通过收取低于进入发生的价格的策略来防范进入。潜在进入者看到这一低价后,推测出进入后价格也会那么低甚至更低,因而进入该市场终将无利可图。四、掠夺性定价策略掠夺性定价是指将价格设定为低于成本,而期望由此发生的损失在新进入企业或者竞争对手被逐出市场后,掠夺企业能够行使市场权力时可能得到补偿。这也是一种价格报复策略。掠夺性定价与限制定价之间的差异在于,限制定价是针对那些尚未进入
21、市场的企业,是想较长一段时间内维持低价来限制新企业的进入。而掠夺性定价则将矛头指向已经进入的企业或即将来临之际。 案例分析囚徒困境案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,
22、则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白;假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B的唯一的选择也是坦白。所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下:1,18, 0不坦白0,85,5坦白嫌疑犯乙不坦白坦白嫌疑犯甲性格大战案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的
23、满足。分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。1,2-1, -1时装0,02,1足球男时装足球女价格战案例:假设市场中仅有A、B两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益
24、矩阵如下:150,12050,17015元180,30100,8010元企业B15元10元企业A分析:无论对企业A还是企业B来说,低价都是他们的占优战略。从表可见,企业A的占优战略是10元,因为无论B采取什么战略,企业A都能获取比定价15元更多的利润。如果企业B定价10元,企业A定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B定价15元,企业A定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B的占优战略也是定价10元的策略。如果企业A定价10元,企业B定价10元能够获利100万元,而定价15元只能获得50万元;如果企业A定价15元,企业A定价10元可获利180万元,而定价15元却只能获利150万元。同样地,企业A的占优战略也是定价10元的策略。最后有一个最容易出现的结局就是(10,10),故双方均采取低价策略。“电大天堂”