博弈论的基本概念

?博弈论是研究两人或多人谋略和决策的理论。

?博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。

?参与者：参与者是指一个博弈中的决策主体，通常又称为参与人或局中人。

参与人的目的是通过合理悬着自己的行动，以便取得最大化的收益。参与者可以是自然人，也可以是团体。

?信息：信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要，每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略：策略是参与者如何对其他参与者的行动作出反应的行动规则，它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略，用S i表示参与者i的所有可选择的策略的集合（又成为而i的策略空间）。如果n个参与者没人选择一个策略，那么s=（s1，s2，…，s n）称为一个策略组合。

?收益：收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益，它是策略组合的函数。

?均衡：均衡是所有参与者的最优策略组合，记为s*。

几个经典的博弈实例

?例一囚徒困境两个共同作案的犯罪嫌疑人被捕，并受到指控。除非至少一人认罪，否则警方无充分证据将他们按最论刑。警方把他们隔离审讯，并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度，因警方证据不足，两人将均被判为轻度犯罪入狱一个月；如果双方都坦白，根据案情两人将被判入狱六个月；如果一个招认而另一个拒不坦白，招认者因由主动认罪立功的表现将立即释放，而另一人将被判入狱九个月。

? 例二海滩占位甲、乙两个冷饮摊贩，他们在一个直线状的海滩上，以同样的价格，相同的质量向均匀散布在海滩上的众多游客销售冷饮。既然是做生意，目的总是多赚钱，甲乙两人有时在同一地点做同样的生意，竞争是难免的，这两个摊贩应该怎样安排自己的摊位，才能相安无事的做自己的生意？（假定游客总是到据自己最近的摊位购买冷饮）。

? 例三智猪争食猪圈里有一头打猪和一头小猪。里面有一个猪食槽，槽的对面装有控制开关。只要去拱开关，就会有一次6个单位的饲料流进槽里。如果它们都不去拱开关，那么它们都吃不到饲料；如果小猪去拱，那么等到它跑回来时，大猪已把饲料吃光了；如果大猪去拱，等它回来时可以吃到1个单位的饲料；如果他们一起去拱，在一起跑回来，那么大猪可以抢到4个单位的饲料，小猪也能吃到2个单位的饲料。假定每拱一次开-1，-1 -9，0 0，-9 -6，-6 坦白沉默坦白沉默囚徒一

关需要消耗0.5个单位的饲料能量。它们长期一起进食，上面所说的情况两只猪都知道。它们应该如何选择？

完全信息静态博弈

? 静态博弈：静态博弈指的是博弈的参与者同时选择各自的行动，即便是选择行动有先后的话，后行动者也不知道先行动者所采取的行动。

? 博弈的标准表述（策略表述）含有三个要素（1）博弈参与者集合i ∈ N ；

（2）每个参与者的策略空间S i ；（3）每个参与者的收益函数ui 。

? 定义：在一个有n 个参与者的博弈中，参与者的策略空间S 1,S 2,…,S n ,收益函数为u 1,u 2,…,u n ,称G={S 1,S 2,…,S n ；u 1,u 2,…,u n }为此博弈的一个标准表述。

? 定义：如果对任一s i ’ ∈ S i ,s i ’ ≠ s i *, 不等式u i (s 1,…,s i-1, s i *, s i+1,…,s n )> u i (s 1,…,s i-1, s i ’ ,s i+1,…,s n )对所有的策略组合(s 1,…,s i-1, s i+1,…,s n )都成立，那么 si*称为参与者i 的严格占优策略。

? 定义：在博弈的标准表述中，如果对所有的参与者i ∈N ， s i * 是i 的严格0，0

6，-0.5 0.5，5 3.5，1.5 拱不拱拱不拱大猪小猪

占优策略，那么策略组合s*=(s 1*, …,s n *)称为严格占优策略均衡。

? 定义：在标准表述的博弈中，设s i ’和s i ’’是参与者i 的两个可选策略，若u i (s 1,…,s i-1, s i ’,s i+1,…,s n )

2，0 0，1 0，3 0，1 1，2 1，0 上下左中右参与者1 参与者2 0，1 0，3 1，2 1，0 上下左中参与者1 1，2 1，0 上下左中参与者1

? 定义：在博弈G={S 1,S 2,…,S n ；u 1,u 2,…,u n }，策略s*= (s 1*,…,s i-1*, s i *,s i+1*,…,s n *)满足条件：对每一个参与者i ，都有对所有的s i ∈ S i ， u i (s 1*,…,s i-1*, s i ,s i+1*,…,s n *) ≤ u i (s 1*,…,s i-1*,

s i *,s i+1*,…,s n *) 成立，则称s*为该博弈的一个纳什均衡。

? 严格占优策略均衡、逐步剔除严格劣策略均衡与纳什均衡的关系：严格占优策略均衡是纳什均衡；逐步剔除严格劣策略均衡是纳什均衡；反之不然。

完全信息动态博弈

? 动态博弈：各参与者的行动有先后顺序，而且后行动者在自己行动之前能观测到先行动者的行动。

? 定义：完全信息扩展式博弈形式是一个三元组F=（N,H,P ）：其中N 是参与者的集合。H 是A （行动的集合）中元素组成的序列的集合并且满足：

（1）空序列（）∈H ；（2）如果一个h ∈H ，则h|k ∈H ， h|k 表示h 的长度为k 的子序列；（3）如果一个无穷序列的所有有穷子序列都属于H ，那么h 也属于H 。P ：H/Z ? N ，其中Z ?H 且h ∈Z 当且仅当任给h ’ ∈H ，若h ’|k =h 则h ’ =h 。

? 对于n 个参与者有限战略的扩展式表述有一种直观的图形方法，就是博弈2，4 2，3 1，4 1，1 0，2 4，0 1，2 4，1 3，3 上中左中右参与者1 下

在上面的这个博弈中既不存在严格占优策略均衡，也不存在逐步剔除严格劣策略均衡，对这样的博弈引入纳什均衡的概念。

树。

?设ui：Z ?R，F=（N,H,P）扩展式博弈形式，我们称G=（F,（u i）i N）为一个扩展式博弈。

2 （0，0）（2，1）（1，2）

l L

r R

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P ,I)，其中P 为市场价格，I 为消费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论的基概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者：参与者是指一个博弈中的决策主体，通常又称为参与人或局中人。参与人的目的是通过合理悬着自己的行动，以便取得最大化的收益。参与者可以是自然人，也可以是团体。 ?信息：信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要，每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略：策略是参与者如何对其他参与者的行动作出反应的行动规则，它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略，用S i表示参与者i的所有可选择的策略的集合（又成为而i的策略空间）。如果n个参与者没人选择一个策略，那么s=（s1，s2，…，s n）称为一个策略组合。 ?收益：收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益，它是策略组合的函数。 ?均衡：均衡是所有参与者的最优策略组合，记为s*。几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕，并受到指控。除非至少一人认罪，否则警方无充分证据将他们按最论刑。警方把他们隔离审讯，并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度，因警方证据不足，两人将均被判为轻度犯罪入狱一个月；如果双方都坦白，根据案情两人将被判入狱六个月；如果一个招认而另一个拒不坦白，招认者因由主动认罪立功的表现将立即释放，而另一人将被判入狱九个月。

博弈论知识点总结

1、

2、既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论(课一)

课程内容和时间安排第一讲：概述（第一、二章）第二讲：术语解读和基本假设（第三、四章）第三讲：囚犯困境和破解之道（第五、六、七章）第四讲：万元陷阱和智猪博弈（第八、九章）第五讲：懦夫博弈和性别战（第十、十一章）

博弈学 -----博览全局对弈棋局课一博弈在中国的理解--略观围棋，法于用兵，怯者无功，贪者先亡。西方国家的理解--Game fair play。（中国人在博弈中关注的是获胜，西方人在博弈中关注的是怎么玩的开心。）博弈可以在工作领域，可以在社交往来，可以在家庭相处，无处不在，博大精深。知人者智，自知者明; 胜人者力，自胜者强; 小胜者术，大胜者德。

推荐书刊 1、蒋文华：《用博弈的思维看世界》，浙江大学出版社，2014年。 2、张维迎：《博弈论与信息经济学》，上海三联书店，上海人民出版社，1996年。 3、詹姆斯·米勒：《活学活用博弈论－如何利用博弈论在竞争中取胜》，中国财政经济出版社，2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫：《策略思维》，中国人民大学出版社，2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫：《妙趣横生博弈论》，机械工业出版社，2009年。博弈指在一定的游戏规则约束下，基于直接相互作用的环境条件，各参与人依据所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。故事1，两人同行打猎，忽遇一猛狮。一人卸下身上物品狂奔，同伴不解，问道：“汝能胜狮？”答曰：“非需胜狮，只需胜汝！” （博弈既可以是竞争，也可以是合作！）游戏1，每位同学写1个介于1与100之间的自然数（整数，包括1与100在内），然后求出所有数字的平均数，如果你所写的数字最接近该平均数的二分之一，那么你将在游戏中胜出。（博弈，必须学会换位思考！）

博弈论基础复习

《博弈论基础》主要知识点一、名词解释（5×2＝10分）策略型博弈它是由三个部分组成，即局中人、策略和各种策略组合中所得到的利益。纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。混合策略局中人的混合策略是其纯策略空间上的一种概率分布，表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。扩展型博弈博弈存在着局中人行动的先后次序，是对具有动态结构的决策形式进行研究的规范分析工具。博弈树对于任何一种双人完备博弈，都可以用一个博弈树来描述，并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。完美信息博弈是指一次只有一个局中人在行动，而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上。冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。类型 :一般地，将一个参与人所拥有的所有私人信息称为他的类型。信号博弈是研究具有信息传递作用的信号机制的一般博弈模型，其基本特征是两个博弈方，分别称为信号发出方和信号接收方。分离均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者以概率1选择不同的信号，接收者完全可以通过信号来准确判断出发送者的类型。混同均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者选择了相同的信号，接收者无法从信号中得到新的信息，无法对先验信念进行修正。特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益，也就是给出了一种集合函数，称为特征函数。联盟

博弈论中的几个经典问题

几个博弈论中的经典问题博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。几个重要的概念 1、策略(strategies)：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。 2、得失(payoffs)：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。 3、次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。 4、博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a，那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。

博弈论中的相关概念

新古典经济学前提：理性选择——减少不确定； ——经济系统效用最大化。理性——新古典经济学与博弈论的纽带博弈论决策前提：理性的战略选择。博弈论决策基础：最优反应，即带来最大收益的战略。但是，在博弈论中最优反应不是理性的唯一表现，也不总是假定人是理性的。新古典经济学决策的背景：理性的个体面临特定的制度环境（产权、货币、高度竞争的市场），在此基础上以获取利益最大化为目的。隐含的基础：只需考虑自身情况和市场条件，而不考虑他人行为。弊端： ——限制了理论的使用范围，现实中竞争并不完全； ——无法解决货币经济以外的决策难题。博弈论的优势： ——不仅考虑自身条件和市场环境，最重要的是还需考虑他人的行为。游戏规则：两个选手，轮流取币；每次至少取一枚硬币；只能从一行中取任意数量的硬币，不许从两行中选取；取走最后一枚硬币的为胜者囚徒困境的启示：囚徒困境仅仅是二人博弈，多人博弈在现实中更多；如果囚犯可以交流，结果显著不同；如果多轮博弈，结果也有不同；导致困境结论的分析过程令人注目，但最后结论并非理性。通常假设参与者将采取最优反应战略而理性行事，最大化利润、力争在游戏中获胜、达到主观收益最大化，或者惩罚最小化，皆属于理性行为。最优反应战略是在其他参与者战略已知或可预测条件下，给某参与者带来最大化收益的战略。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。依据新古典经济学，我们把一个参与者的最优反应（best response）定义为，在其他参与者已经选定战略，或者可以预计到他们将选择何种战略时，能够给该参与者带来的最大收益的战略。标准式——数字矩阵；扩展式——树形图不确定事件（contingency）：相机战略（contingent strategy）：仅在不确定事件发生时才会采取的战略信息集（information set）：节点2包含了决策者掌握的所有信息，因此也称为信息集。扩展式的优势： ——展示了每一阶段掌握的信息； ——展示了参与者掌握信息的不完全所有博弈问题均可用标准式描述，即绘制一个表格，边缘列出参与者的战略，里面列出参与者的收益；

耶鲁大学博弈论_精简版

第一讲导论-五个入门结论 1.通过成绩博弈模型可以知道，不选择严格劣势策略，因为每次博弈会得到更好的收益。 2.通过囚徒的困境博弈模型可以知道，理性选择导致次优的结果（协商难以达成目的的原因不是因为缺少沟通，而是没有强制力）。 3.通过愤怒天使博弈模型可以知道，汝欲得之，必先知之；永远选择优势策略，选择非劣势策略，损失小，如果对手有优势策略则应以此作为选择策略的指导。 4.如果想要赢，就应该站在别人的立场去分析他们会怎么做。第二讲学会换位思考 1.构成博弈要素包括，参与人，参与人的策略以及收益。 2.所谓严格优势策略，就是指不论对方采取什么策略，采取的这个策略总比采取其他任何策略都好的策略。 3.在博弈中剔出某些选择时需要站在别人的角度去思考结果，因为对手不会选择劣势策略；同时要考虑到对手也是一个理性的参与人。 4.在博弈中剔除某些选择是一种直接思考，同时也是作为一个理性参与人的选择。第三讲迭代剔除和中位选民定理 1.在选民投票博弈模型中，通过不断地迭代以及剔除来决定策略，由此，我们得到了一种新的选择策略的方法：迭代剔除法。 2.选民投票博弈模型的结果与现实存在偏差，主要是因为：①现实中选民并不是均匀分布的；②选民通常根据候选人的性格而非政治立场来进行投票，而政治立场只是单一维度；③只适用于只有两个候选人的情况；④同时存在弃权票；⑤选民未必相信候选人所声明的立场。 3.建立模型，是为了更好的描述事实以激发灵感，模型是有重要的事是抽象而来，逐步增加约束条件完善模型观察结果，比较分析结果的变化。第四节足球比赛与商业合作之最佳对策 1.点球博弈模型告诉我们，不要选择一个在任何情况或信念下都不是最佳对策的策略。 2.最佳对策：①参与人针对对手策略的定义：参与人i的策略s^i（简写成BR）是对手策略S-i的最佳对策，如果参与人i在对手的策略S-i下选S^i的收益弱优于其它对策Si`，这对参与人i的所有Si`都适用，则策略S^i是其它参与人策略S-i的最佳对策。S^i最大化了对手选S-i时我的收益；②最佳对策广义定义：参与人i的策略S^i是最佳策略（你对其他参与人可能采取的策略持信念P时的最佳策略），在参与人i仍持信念P的情况下选S^i 的获得预期收益比在同样的信念P下选其它的策略获得的预期收益都要高（对于所有可选的Si`均成立）即Eu（S^i，P）≥Eu（Si`，P） Si` in Si 我从Si选择可选策略时S^i而非S-i最大化了我的预期收益。第五讲坏风气与银行挤兑 1.纳什均衡，即对任意一个此博弈内的参与者A，他所选择的策略是其他参与人所选策略的最佳策略。

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案如果图片不显示，用打印预览就可以了。 P127 第一题：领悟精神就可以了，而且每本书上都有这些例题，不找了。第二题： UMD 为参与人1的战略，LMR 为参与人2的战略。前面的数字代表参与人1的得益，后面的代表参与人2的得益。参与人2的R 战略严格优于M 战略，剔除参与人2的M 战略，参与人1的U 战略优于M 战略，剔除参与人1的M 战略，参与人1的U 战略优于D 战略，剔除参与人1的D 战略，参与人2的L 战略优于R 战略，剔除参与人2的R 战略。最后均衡为U ，L （4，3）。这样可能看不清，按照步骤一步步画出图就好多了。第三题：恩爱型厌恶型用划线法解出，恩爱的都活着或者都死，厌恶的或者受罪，死了对方另一个人开心的不得了。第四题：没有人会选择比原来少的钱，战略空间为{原来的钱，比原来多的钱}。支付为{0，原来的钱，比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。第五题：n 个企业，其中的一个方程：π1＝q 1（a －（q 1＋q 2＋q 3……q n ）－c ），其他的类似就可以了，然后求导数，结果为每个值都相等，q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题：在静态的情况下，没有一个企业愿意冒险将定价高于自己的单位成本C ，最终P=C ，利润为0。因为每个参与人都能预测到万一自己的定价高于C ，其他人定价为C 那么自己的利益就是负的（考虑到生产的成本无法回收）。就算两个企业之间有交流也是不可信的，最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争，一定会取得一个P 1=P 2=P 均衡。此时利润不为零，双方将不在进行价格竞争。第七题：设企业的成本相同为C ，企业1的价格为P 1，企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2)，π2=(P 2-C)(a-P 2+P 1)。一阶最优：a-2P 1+C+P 2=0，a-2P 2+C+P 1=0。解得：P 1=P 2=a+C ，π1=π2=a 2。第八题：不会！到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。第十题：无纯战略纳什均衡，设参与人1为P 1～P 4，参与人2为Q 1～Q 4。得到：-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3，推出：Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子，老虎，鸡，虫子中选择一个。

生活中的博弈论感悟(优.选)

《生活中的博弈论》学习感悟第一讲初试博弈论生活中的资源是有限和稀缺的，于是就产生了竞争，这种竞争就需要一种形式把大家聚在一起，这种形式就是博弈。博弈论是在力图在最简单的假设下得到最大范围的推广和应用，其伟大在于对后世的引导和激发作用。博弈论不仅从古代就散发着智慧，还体现在我们生活中的种种小事中，如双方互拨打电话，放弃球赛陪女友逛街等。博弈论是建立在博弈双方或者多方都属于理性人的基础上，通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素，博弈者做出对自己最有利最保险的决策和行动，从而使得自己能达到获利或者获胜的目的。每个人都可以成为博弈高手，但人的决策又具有有限理性，因此博弈论也不是万能的。第二讲纳什均衡在某一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲，勿施于我。

囚徒困境博弈反映个人最佳选择并非团体最佳选择。用囚徒困境博弈对两个势均力敌的竞争对手进行分析，可以发现合作是可以实现双赢的。如：两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。此二公司可以有二选择：互相达成协议，减少广告的开支。（合作）增加广告开支，设法提升广告的质量，压倒对方。（背叛）若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。第四讲斗鸡博弈所谓“斗鸡博弈”就是两只公鸡面对面斗争，继续斗下去，两败俱伤；一方退却便意味着认输。在这样的博弈中，要想取胜，就要在气势上压倒对方，至少要显示出破釜沉舟、被谁一站的决心来，以迫使对方退却。但到最后的关键时刻，必有一方要退下来，除非真正抱定鱼死网破的决心。学习了知识，就要善于联想，善于联系生活。在很多的时候我们都可能是在不知不觉中就使用了或者是接触到了博弈论，就像是平常我们和其他人之间的争执问题，每次都可能弄得脸红脖子粗的，双方都不服气，最终的结果是有一个人妥协，然后彼此达成一致；冷战期间的美苏两大军事集团的争斗也是一种“斗鸡博弈”。

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。囚徒困境的例子：军备竞赛；中小学生减负；几个大企业之间的争相杀价等等；以中小学生减负为例：在当前的高考制度下，给定其他学校对学生进行减负，一个学校最好不减负，因为这样做，可以带来比其他学校更高的升学率。给定其他学校不减负，这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此，不论其他学校如何选择，这个学校的最佳选择都是不减负。每个学校都这样想，所以每个学校的最佳选择都是不减负，因此学生的负担越来越重。请用同样的方法分析其他例子。智猪博弈的例子：大企业开发新产品；小企业模仿；股市中，大户搜集分析信息，散户跟随大户的操作策略以股市为例：给定散户搜集资料进行分析，大户的最佳选择是跟随。而给定散户跟随，大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随，散户的最佳选择都是跟随。因此如果大户和散户是聪明的，并且大户知道散户也是聪明的，那么大户就会预见到散户会跟随，而给定散户跟随，大户只有自己分析。请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。破釜沉舟是一个承诺行动。目的是要断绝自己的退路，让自己无路可退，让自己决一死战变得可以置信。也就是说与敌人对决时，只有决一死战，这样才可以取得胜利。否则，如果不破釜沉舟，那么遇到困难时，就很有可能退却，也就无法取得胜利。穷寇勿追就是要给对方一个退路，由于有退路，对方就不会殊死抵抗。否则，对方退无可退，只有坚决抵抗一条路，因而必然决一死战。自己也会付出更大的代价。

博弈论与策略行为

博弈论与策略行为 G a m e T h e o r y a n d S t r a t e g y B e h a v i o r 蔡继明教授/主任清华大学政治经济学研究中心 Center for Political Economy at Tsinghua University CPET

目录第一讲：导论一、博弈论的研究对象第二讲：占优战略与社会两难第三讲：纳什均衡和双人博弈第四讲：三人博弈与n人博弈第五讲：纯战略和混合战略第六讲：博弈的合作解第七讲：序贯博弈与子博弈完美均衡第八讲：重复博弈第九讲：企业经营决策的博弈分析第十讲：企业内部组织分析第十一讲：政府行为分析第一讲导论博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略（给自己带来最大收益的策略）。二、博弈论的产生和发展博弈又称博戏，是一门古老的游戏。 1. 博弈在中国《学弈》（《孟子 ?告子》）：弈秋，通国之善弈也。使弈秋侮二人弈，其一人专心致志，惟弈秋之为听；一人虽听之，一心以为有鸿鹄将至，思援弓缴而射之。虽与之俱学，弗若之矣。为是其智弗若与？吾曰：非然也。《世本》说，“乌曹作博”，乌曹乃是夏代著名之能工巧匠。千百年来，博弈更是与人们的生活紧紧相连，从博棋到牌戏，从斗戏到彩票，中华民族的历史长河中就这样形成了别具风情的博弈文化从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战

博弈论的基础知识与应用

博弈论的基础知识与应用(转) 1 基础知识博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论（如同计算科学理论和许多其他的贡献一样）是由约翰.冯.诺伊曼（John von Neumann）创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦（Oskar Morgenstern）共同写成的《博弈论与经济行为》（The Theory of Games and Economic Behavior）。当然，摩根斯坦把新古典经济学的思想带入了合作中，但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻由于诺伊曼的工作，在更广阔的人类行为互动的范围内，“博弈”成为了一个科学的隐喻。在人类的互动行为中，结局依赖于两个或更多的人们所采取的交互式的战略，这些人们具有相反的动机或者最好的组合动机（mixed motives）。在博弈论中常常讨论的问题包括：1）当结局依赖于其他人所选择的战略以及信息是完全的时候，“理性地”选择战略意味着什么？ 2）在允许共同得益或者共同损失的“博弈”中，寻求合作以实现共同得益（或避免共同损失）是否“理性”？或者，采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失，这是否是“理性”的？ 3）如果对2）的回答是“有时候是”，那么在什么样的环境下侵略是理性的，在什么样的情况下合作是理性的？ 4）在特定情况下，正在持续的关系与单方退出这种关系是不同的吗？ 5）在理性的自我主义者的行为互动中，合作的道德规则可以自然而然地出现吗？ 6）在这些情况下，真正的人类行为与“理性”行为是否相符？ 7）如果不符，在那些方面不符？相对于“理性”，人们更倾向于合作？或者更倾向于侵略？抑或二者皆是？因而，博弈论研究的“博弈”包括：破产门口的野蛮人（Barbarians at the Gate）网络战（Battle of the Networks）货物出门，概不退换（Caveat Emptor）征召（Conscription）协调（Coordination）逃避（Escape and Evasion）青蛙呼叫配偶（Frogs Call for Mates）鹰鸽博弈（Hawk versus Dove） Mutually Assured Destruction 多数决定原则（Majority Rule） Market Niche 共同防卫（Mutual Defense）囚徒困境（Prisoner’s Dilemma）补贴小商业Subsidized Small Business 公共地悲剧Tragedy of the Commons 最后通牒Ultimatum

博弈论中的几个经典问题精编版

博弈论中的几个经典问题集团企业公司编码：（LL3698-KKI1269-TM2483-LUI12689-ITT289-

3、次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。 4、博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。 5、纳什均衡(NashEquilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B 也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因

博弈论复习大纲下

博弈论第六讲--第九讲复习大纲第六讲声誉和对称信息重复博弈 1、重复博弈（Repeated Game）：是动态博弈的一种特殊情况。在重复博弈里，完全相同的环境一次次重复出现，参与人在重复出现的相同环境中做出决策。重复博弈是一类很重要的动态博弈。 2、有限次重复博弈例子：连锁店悖论：现象---博弈的重复进行对进入威慑博弈和囚徒困境的结果基本上没有影响；结论---在位者在包括第1个市场的所有市场上都将选择合谋。这个结论称为连锁店悖论。通过对连锁店悖论的分析，得出结论：如果当事人完全理性，有限次重复博弈的均衡解和一次博弈没有区别。把这个结论推广到囚徒困境博弈中，就是说，尽管两个人都选择不坦白是集体最优的，但如果同样的博弈重复有限次，这个重复博弈的均衡仍然是（坦白，坦白）。重复博弈比不重复进行的一次性博弈要复杂得多。在现实中，如果当事人不那么理性，或者看起来不那么理性，那么有限次重复博弈的结果有可能和一次博弈不同。那么在有限次博弈的囚徒困境中，就有可能实现（抵赖、抵赖）的结果。 3、无名氏定理：重复博弈中最重要也是最有名的结果是“无名氏定理”，该定理认为，只要局中人有足够的耐心，那么任何理性的可行盈利都可以在均衡中得以实施。换句话说，只要局中人的耐心足够地大，一次博弈中可行的理性结局总是可以与重复博弈中某均衡结局相一致。无名氏定理告诉我们：在无限次重复博弈中声称完美均衡导致了某一特定的行为是没有意义的。 4、声誉：在重复进行的囚徒困境博弈里，只有博弈将重复进行无限次时，参与人才会选择合作。这是声誉的一个大问题。因为每个人都知道一个参与人将在最后一期选择坦白，那么为什么他们还要假设这个参与人会在目前建立起自己的声誉呢？声誉应用： 5、折现率的概念以及无限次重复博弈中合作条件的推导，以产量卡特尔为例。 6、价格竞争对制造商的影响 7、进化与囚徒困境，鸽鹰博弈

博弈论基础作业及答案

博弈论分析

中美军备竞赛的博弈分析 1.理论介绍 1.1博弈论的概念博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。 1.2博弈论的主要特点博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure)，所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。具有竞争或对抗性质的行为成为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。 1.3博弈的分类博弈的分类根据不同的基准也有不同的分类。一般认为，博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。从行为的时间序列性，博弈论进一步分为静态博弈、动态博弈两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。通俗的理解："囚徒困境"就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈。按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。目前经济学家们现在所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。与上述四种博弈相对应的均衡概念为：纳什均衡(Nash equilibrium），子博弈精炼纳什均衡（sub game perfect Nash equilibrium），贝叶斯纳什均衡(Bayesian Nash equilibrium），精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium）。博弈论还有很多分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型等等。 1.4纳什均衡纳什均衡的定义：在博弈G=﹛S1，…，Sn：u1，…，un﹜中，如果由各个博弈方的各一个策略组成的某个策论组合（s1*，…，sn*）中，任一博弈方i的策论si*，都是对其余博

博弈论基础

ECON 40050 Game Theory Exam 1- Answer Key Instructions: 1) You may use a pen or pencil, a hand-held nonprogrammable calculator, and a ruler. No other materials may be at or near your desk. Books, coats, backpacks, etc... must be placed against the wall. No electronic communication devices may be used. 2) As soon as the instruction to begin the test is given, please check that you have 10 numbered pages. 3) Be sure to show all of your work. Answers without supporting calculations will receive zero credit. You will receive credit only for the answers and supporting calculations that appear in this test packet. 4) All exams must be turned in by 1:45 pm. No extensions will be granted. 5) Be sure to read each question in its entirety before beginning your analysis. 6) The time estimates at the beginning of each question are only suggestions to help you manage your time. NAME ____________________________________________ Question 1 (10 minutes)_______ (15 points) Question 2 (10 minutes)_______ (15 points) Question 3 (10 minutes)_______ (15 points) Question 4 (15 minutes)_______ (15 points) Question 5 (20 minutes)_______ (20 points) Total: (65 minutes)_______ (80 points)