《博弈论ppt课件.ppt》由会员分享,可在线阅读,更多相关《博弈论ppt课件.ppt(48页珍藏版)》请在三一办公上搜索。
1、博弈论,博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。,博弈的基本要素,博弈的参加者(Player)博弈方各博弈方的策略(Strategies)或行动(Actions)博弈的次序(Order)博弈方的收益(Payoffs) (或称支付,或得益),博弈方,博弈方:独立决策、独立承担博弈结果的个人或组织博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的
2、博弈,策略,策略:博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同有限博弈:每个博弈方的策略数都是有限的无限博弈:至少有某些博弈方的策略有无限多个,收益,收益:各博弈方从博弈中所获得的利益收益对应博弈的结果,也就是各博弈方策略的组合收益是各博弈方追求的根本目标及行为和判断的主要依据根据收益的博弈分类:零和博弈、常和博弈、变和博弈,策略型(或标准型)博弈,三要素:名单、策略单和收益单。可用矩阵,或函数形式表示的博弈收益情况。猜硬币模型三人古诺模型,几个经典博弈模型,囚徒的困境赌胜博弈审计博弈性别之战产量决策的古诺模型,囚徒的困境,囚徒的
3、困境是图克(Tucker)1950年提出的该博弈是博弈论最经典、著名的博弈,赌胜博弈,赌博、竞技等构成的博弈问题,在经济中也有许多应用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示赌胜博弈的特点是一方得等于另一方失,不可能双赢,属于“零和博弈”,田忌赛马,取胜关键:不让对方猜到自己策略,尽可能猜出对方策略,审计博弈,简单版(BC,Ft),性别之战,是一种有两个以上纯策略均衡的博弈,例子(石头、剪子、布)中的博弈方、策略和收益,博弈方I(孩子A,孩子B)策略集SASB石头,剪刀,布收益就是这个矩阵,占优均衡,占优:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高
4、于其它的策略,至少不低于其他策略的策略 (囚徒的困境中的“坦白”)占优均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的占优,必然是该博弈比较稳定的结果占优均衡不是普遍存在的(性别之战),严格下策反复消去法,严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去,纳什均衡,策略空间:S1,Sn博弈方i的第j个策略:sijSi博弈方i的得益:ui博弈:GS1 ,Sn,u1,un纳什均衡:在博弈GS1 ,Sn,u1,un中,如果由各个博弈方的各一个策略组成的某个策略组合( s1*,sn* )中,任一i博弈方si*的策略,都是对
5、其余博弈方策略的组合( s1*,si-1*,si+1*,sn* )的最佳对策,即ui( s1*,si-1*,si*,si+1*,sn* ) ui( s1*,si-1*,sij,si+1*,sn* ) 对任意sijSi都成立,则称( s1*,sn* )为G的一个纳什均衡,所有别的游戏者策略的简记法,s-i(s1,si-1,si+1, sn)纳什均衡简述为: ui(si*,s-i*)ui(si,s-i*), siSi,A,纳什均衡的求解划线法,囚徒困境猜硬币,纳什均衡的求解箭头法,审计博弈(B C,Ft),连续变量的纳什均衡,古诺的寡头模型,连续变量的纳什均衡,解:一阶最优条件为:得到:q1q22
6、,混合策略的引进,猜硬币博弈(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念,猜方是否会老猜正面,或反面?,其实“一会儿猜正面,一会儿又猜反面”也是一种策略。,田忌赛马中齐王是如何输掉比赛的?,混合策略的定义,对于游戏者i,其一个混合策略是一个概率密度函数i:SiR,使得,对于所有的siSi,都有 这就是混合策略。,混合策略的纳什均衡定义,如果对于博弈中所有的游戏者i,对于所有的iMi,都有ui*uii,-i*,则称*就是一个混合策略的纳什均。,如何求混合策略的纳什均衡,猜硬币的博弈中解:设猜方猜正方的概率为p,猜反方的概率则为1p
7、;设盖方盖正方的概率为q ,盖反方的概率则为1q。猜方的期望收益:zqp(1p) (1q)p1p期望收益最大的一阶条件是:dz/dq(12p)(12p)0即p0.5,同理可得q0.5。,混合纳什均衡的求解几何法,加重对守位的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概略,P,P,几何法的证明,设守卫睡的概率为Q,小偷偷的概率为P。守卫的期望支付为:PQ( d)(1Q)0 (1P)Qs (1Q)0 PQd(1P)Qs/Q Pd(1P)s0P s/(d s )P/1P(),广延型(扩展型)博弈,四要素名单、博弈分枝结构(节点,或博弈点)、信息集和收益,用对策树
8、形式表示。左右博弈,广延型博弈与策略型博弈,【定理】对于每一个广延型博弈,都存在着一个对应的策略型博弈,我们可以把此策略型博弈视为是游戏者同时选择策略的结果。但是,给出一个策略型博弈,一般地,总存在着若干个与此相对应的广延型博弈。(证明从略),将广延型博弈转化为策略型博弈的例子,讲真话博弈,将策略型博弈转化为广延型博弈的例子,囚犯困境博弈,广延型博弈的解反向归纳,【定义】 反向归纳是指从博弈的最终结局出发,游戏者总是选择对自己最有利的结果;一旦知道博弈的最终结果是什么,然后转向次结局的那个决策点,以同样方法找出该点上的决策者会选择什么决策;然后回到次次结局的那个点如此反复,直到博弈的初始点,在
9、初始点上决策的那个游戏者决定博弈的最终结果。,反向归纳的例子,例子A,子博弈,定义子博弈是展开型的一部分;它是满足下述三个性质的节点和枝的集合:(1)从单个决策节出发。(2)包含了这个节点的每一个后续节。(节点x的后续节是指沿着由x发出的一系列枝可以到达的所有节点。)(3)如果它包含了一个信息集的若干部分,那么它一定包含该信息集中的所有节点。,子博弈的例子,例子,子博弈的例子,两个不是子博弈的例子,子博弈完美纳什均衡,子博弈完美纳什均衡:一个策略组合是子博弈完美纳什均衡,如果它满足:对于整个博弈来说,它是一个纳什均衡;对于任一个子博弈来说,它也是一个纳什均衡。,子博弈完美纳什均衡的例子,均衡1
10、(借,分);均衡2(不借),子博弈与完美性,配套博弈,重复博弈,囚犯困境的重复博弈如果存在下列三个条件,则“价格勾结”(高价,高价)便会出现:第一,博弈重复无穷次。第二,双方都采取“冷酷”战略“以牙还牙”战略,即:(1)从选择“合作”(高价)开始;(2)只要对方一直选择“合作”(高价),便一直“高价”下去;直到有一天发现对方偷偷实行了“不合作”(低价),便由此而采取“不合作”(低价)至永远。第三,贴现因子1/(1r)足够的大(r0)。这个条件是说,将来的收益经贴现之后还比较值钱。即人们对于时间比较有耐心,而不是只图眼前享受。,以牙还牙策略,以牙还牙策略:称下列策略为“以牙还牙”策略,如果:从一
11、开始便选择“合作”;在时期t选对方在时期t1期所采用的策略,即如对方在t1期不合作,则我在t期不合作。,无名氏(大众)定理,无名氏定理:在无穷次重复的由n个游戏者参与的博弈里,如果在每一次重复中博弈的行动集是有限的,则在满足下列三个条件时,在任何有限次重复中所观察到的任何行动组合都是某个子博弈完美均衡的惟一结果: 条件1:贴现因子接近于1;条件2:在每一次重复中,博弈结束的概率或等于0,或为非常小的一个正值;条件3:严格占优于一次性博弈中的最小最大收益组合的那个收益组合集是n维的。,无名氏定理说明,以囚徒困境问题说明此定理设此囚徒困境的收益矩阵为:,无限重复博弈子博弈精练均衡的例子,( R1 , R2 )就是一个子博弈精练均衡(假定1)假定企业1在t期之前选择了R1,而在t期选择采取“机会主义”L1,而企业2直到t期都选择R2,根据“以牙还牙”策略,从t1期开始将一直选择L2,那么企业1从t1期也将一直选择L1。采取“机会主义”的t1期后的收益511不采取“机会主义”的t1期后的收益444显然,企业1不会偏离R1策略,同样企业2也不会偏离R2策略。“江湖义气”也因此产生了。,无限重复的囚徒困境子博弈精练均衡,有无穷多个子博弈精练均衡,在无限重复博弈中,可行收益集(黑色四边形)中的任何一点相对应策略都可以与(1,1)相对应策略构成子博弈精练均衡解。,三人博弈,均衡是(D,L,A),