一、博弈论的基本概念

一、博弈论的基本概念
一、博弈论的基本概念

博弈与决策复习资料

第一章博弈论的基本理论

一、博弈论

(一)、博弈论的基本概念

?博弈

博弈论

(二)、博弈论的构成要素

?博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、得益、结果、

均衡等。

?(1)参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也

可以是团体);

?(2)行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策;

?(3)策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动

的预先安排;

?(4)得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或

行动的函数,这是每个参与人最关心的东西;

?(5)均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分

析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。

?上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博

弈规则来决定均衡。

二、博弈论的发展简史

?萌芽阶段

?产生阶段1944 《博弈论与经济行为》

?发展阶段纳什均衡

?高潮阶段诺贝尔经济学奖

?成熟阶段

三、博弈论的分类

?参与人行动的先后顺序:静态和动态

?参与人对其他参与人的了解程度:完全信息和不完全信息

?参与人之间是否进行合作:合作和非合作

?非合作博弈四种类型及对应的均衡:

?完全信息静态——纳什均衡、占优均衡

?完全信息动态——子博弈精炼纳什均衡

?不完全信息静态博弈——贝叶斯纳什均衡

?不完全信息动态博弈——精炼贝叶斯纳什均衡

第二章简单博弈与博弈均衡

一、占优战略与占优战略均衡案例分析囚徒困境

二、纳什战略均衡案例分析性格大战纳什均衡的意义

占优战略均衡和纳什均衡的联系与区别:

第三章重复博弈与序列博弈

一、重复博弈

重复博弈中的“针锋相对”策略博弈

二、序列博弈

第四章博弈论在企业经济管理决策中的应用

一、扩大生产能力策略

二、保证最低价格策略

重点掌握保证最低价格策略

三、掠夺性定价策略

四、限制进入定价策略

红字部分内容参见教材

除红字部分外内容参见网上课堂课件、网上案例

博弈论的基概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

博弈论(课一)

课程内容和时间安排 第一讲:概述(第一、二章) 第二讲:术语解读和基本假设(第三、四章) 第三讲:囚犯困境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章) 第五讲:懦夫博弈和性别战(第十、十一章)

博弈学 -----博览全局对弈棋局课一 博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。 西方国家的理解--Game fair play。 (中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的开心。) 博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。

推荐书刊 1、蒋文华:《用博弈的思维看世界》,浙江大学出版社,2014年。 2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。 3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民大学出版社,2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2009年。 博弈 指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 故事1,两人同行打猎,忽遇一猛狮。一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作! ) 游戏1,每位同学写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出所有数字的平均数,如果你所写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。(博弈,必须学会换位思考!)

博弈论泽尔腾简介

莱茵哈德?泽尔腾简介 一、人物生平 莱茵哈德?泽尔腾(Reinhard Selten),德国人,1930年10月10日出生于德国的布莱斯劳。由于犹太人的身份,泽尔腾自小对政治、经济学感兴趣,对数学的爱好伴随其一生。 1951~1957年,他在法兰克福大学学习数学,1957年获硕士学位。 1961年,泽尔腾获得马恩法兰克福大学的数学博士学位。 1967~1968年,泽尔腾去伯克利加州大学商学院当客座教授。 1969年接受柏林大学聘请,担任经济学教授至1972年。 1984年,他到波恩大学任经济学教授。 1991年,泽尔腾和夫人伊丽莎白都患上了严重的糖尿病。伊丽莎白因此下肢瘫痪,并且视力也接近失明。但泽尔腾夫妇对生活仍充满了自信。泽尔腾多次来中国访问,并到过多所大学进行学术演讲。泽尔腾在学术报告中展示出的大师的学术精神与态度、深刻的思想见解以及伟大的学术抱负令聆听其报告的每一个人所敬佩。 1994年泽尔腾教授因在“非合作博弈理论中开创性的均衡分析”方面的杰出贡献而荣获诺贝尔经济学奖。 泽尔腾现还任计量经济学社团委员、美国艺术与科学学院外籍名誉院士、青岛大学名誉教授、南开大学公司治理研究中心顾问、南京审计学院名誉教授。

二、主要著作和学术贡献 1、主要著作 泽尔腾的主要学术论著有:《一项寡头垄断实验》、《关于扩展性博弈中均衡完善概念的再检验》、《连锁商店之谜》、《博弈中均衡选择通论》、《价格制定者厂商的一般均衡》(1974年)、《博弈均衡选择的一般理论》(1988年,与哈萨尼合作)、《战略理性模型与决策理论丛书:《系列C:博弈论、数学规划及运筹学研究》(1988年)。1994年,由于“莱茵哈德?泽尔腾教授的均衡分析中的完善性的观念大大扩展了非合作博弈论的应用”,他与约翰?纳什、约翰?哈萨尼共同荣获该年度诺贝尔经济学奖。 2、学术贡献 他的主要学术研究领域为博弈论及其应用、实验经济学等。博弈论是作为数学的一个分支出现的,但是它在军事、政治、经济许多方面都有很多重要的运用,其中以在经济学内的运用最多也最为成功。博弈论整个改写了经济学理论。博弈论对人类的更大贡献是,加强了国际间的交流合作机会。各国对博弈论的研究,促进了人类社会的文明发展。此外,博弈论的思维方式推动了人类思维模式更高层次的发展。 泽尔腾针对纳什均衡中的静态分析的不足,在1965年将扩展型博弈推广为动态博弈,并提出了子博弈的概念和子博弈完美均衡的概念,发展了倒推归纳法。1975年发表“关于扩展型博弈中完美均衡概念的再检验”一文,提出了被称之为“颤抖手完美纳什均衡”的概念,

博弈论的相关知识

零和博弈 博弈是一种策略的相互依存状况:你的选择或策略将会得到什么结晶,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他的选择称为行动。一个博弈当中的参与者的利益可能严格对立,一人所得永远等于另一人所失。这样的博弈称为零和博弈。不过,更常见的情况是,既有共同利益,也有利益冲突,从而可能出现导致共同受益或者共同受禹的策略组合。但是,我们通常还是会把这个博弈当中的其他参与者称为一方的对手。一个博弈的行动可能是相继进行,也可能是同时进行。在相继行动的博弈里,存在一条线性思维链:假如我这么做,我的对手可以那么做,反过来我应该这么应对。。。。。。这种博弈通过描绘博弈树进行研究。其中要遵循法1则:向前展望,倒后推理,就能找出最佳的行动方式。 策略组合 而在同时行动的博弈中,存在一个逻辑循环的推理过程:我认为他认为我认为。。。。这个循环必须解开,一方必须看穿对手的行动,哪怕他在行动时候并不知道这是怎么一回事。要想解开这么一种博弈,可以建立一张图,这张图能显示所有可能想得到的策略组合将会相应产生什么结果。然后按照下列步骤进行分析:首先看参与各方有没有优势策略,优势策略意味着,无论对手采取什么策略,这一策略都将胜过其他的任何组合策略。这就引出法则2:假如你有一个优势策略,请照办。假如你没有优势策略,但你的对手有,那么,尽管认定他一定会照办吧,然后相应选择你自己的策略。 优势策略 接着,假如没有一方拥有优势策略,那就看看有没有人拥有一个劣势策略,劣势策略意味着无论对手采取什么策略,这一策略都将逊于其他作任何策略。如果有,请遵循法则3:剔除劣势策略,不予考虑。如此一步一步做下去。假如在这么做的过程中,在简化之后的博弈里出现了一个优势策略,应该应用这个优势策略。假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动法则以及这个博弈的结果。即便这个过程可能有会导出一个独一无二的结果,这么做也可以缩小整个博弈的规模,使其变得更加容易控制。最后,假如既没有优势策略也没有劣势策略,又或者这个博弈已经经过第二步进行了最大限度的简化,那么请遵循法则4:寻找这个博弈的均衡,即一对策略,按照这对策略做,各个参与者的行动都是对对方行动的最佳回应。假如存在一个这样的独一无二的均衡,我们就有很好的证据证明为什么所有的参与者都应该选择这个均衡。假如存在许多这样的均衡,你就需要用一个普遍认帐的法则或者说惯例做出取舍。假如并不存在这样的均衡,这通常意味着一切有规则可循的行为都有可能被对方加以利用,这时候你需要将你的策略混合运用。在实践过程中,博弈可能包含一些相继行动过程,也可能包含一些同时行动过程,因此须将上述技巧综合起来,灵活运用,思考和决定自己的最佳行动应该是什么。[2] 《博弈思维》- 零和博弈 简介 零和(zero sum). 赌博中,双方相同的获胜概率。这个词也经常用在政治中,两个国家的势均力敌的实力可以被称作“零和”。“零和”是博弈论的一个概念,意思是双方博弈,一方得利必然意味着另一方吃亏,一方得益多少,另一方就吃亏多少,双方得失相抵,总数为零,所以称为“零和”。“囚徒困境”产生的最主要原因是因应了这种“零和”思维——每个人都在你输我赢的博弈中,追求自身利益的最大化。人们发现在社会的方方面面都能发现与“零和游戏”类似的局面。从个人到国家,从政治到经济,似乎无不验证了世界正是一个巨大的“零和游戏”场。游戏中不是“你赢我输”,就是“你输我赢”。任何一方的收获,即是对方的损失。 零和理论

博弈论中的相关概念

新古典经济学前提: 理性选择——减少不确定; ——经济系统效用最大化。 理性——新古典经济学与博弈论的纽带 博弈论决策前提:理性的战略选择。 博弈论决策基础:最优反应,即带来最大收益的战略。 但是,在博弈论中最优反应不是理性的唯一表现,也不总是假定人是理性的。 新古典经济学决策的背景: 理性的个体面临特定的制度环境(产权、货币、高度竞争的市场),在此基础上以获取利益最大化为目的。 隐含的基础:只需考虑自身情况和市场条件,而不考虑他人行为。 弊端: ——限制了理论的使用范围,现实中竞争并不完全; ——无法解决货币经济以外的决策难题。 博弈论的优势: ——不仅考虑自身条件和市场环境,最重要的是还需考虑他人的行为。 游戏规则: 两个选手,轮流取币; 每次至少取一枚硬币; 只能从一行中取任意数量的硬币,不许从两行中选取; 取走最后一枚硬币的为胜者 囚徒困境的启示: 囚徒困境仅仅是二人博弈,多人博弈在现实中更多; 如果囚犯可以交流,结果显著不同; 如果多轮博弈,结果也有不同; 导致困境结论的分析过程令人注目,但最后结论并非理性。 通常假设参与者将采取最优反应战略而理性行事,最大化利润、力争在游戏中获胜、达到主观收益最大化,或者惩罚最小化,皆属于理性行为。 最优反应战略是在其他参与者战略已知或可预测条件下,给某参与者带来最大化收益的战略。 博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。 依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来的最大收益的战略。 标准式——数字矩阵; 扩展式——树形图 不确定事件(contingency): 相机战略(contingent strategy):仅在不确定事件发生时才会采取的战略 信息集(information set):节点2包含了决策者掌握的所有信息,因此也称为信息集。 扩展式的优势: ——展示了每一阶段掌握的信息; ——展示了参与者掌握信息的不完全 所有博弈问题均可用标准式描述,即绘制一个表格,边缘列出参与者的战略,里面列出参与者的收益;

博弈论的理论精华及其现实意义

48 [收稿日期]2002-02-25 [作者简介] 胡希宁(1952-),男,安徽芜湖人,中共中央党校经济学教研部教授;贾小立(1970-),男,山西洪洞人,中共 中央党校研究生院硕士研究生。 博弈论的理论精华及其现实意义 胡希宁 1 贾小立 2 (1.中共中央党校经济学教研部,北京100091; 2.中共中央党校研究生院,北京100091) [摘要]经济博弈论以贴近现实的方式,揭示了现代经济活动的内在规律。它的发展过程是 纳什均衡从提出到改进的过程。无论在理论上还是在实践上,博弈论都具有重要的现实意义。 [关键词] 博弈论;纳什均衡;信息经济学 [中图分类号] F062.5 [文献标识码]A [文章编号]1007-5801(2002)02-0048-06 第6卷第2期 2002年5月 中共中央党校学报 Journal of the Part y School of the Central Committee of the C.P.C. Vol.6,No.2Ma y .,2002 博弈论(Game Theor y )研究的是,各个理性决策个体在其行为发生直接相互作用时的决策及决策均衡问题。冯?诺伊曼(John Von Neumann )与摩根斯坦恩(Oskar Mor g enstern )合作出版的《博弈论与经济行为》(1944)一书第一次系统地将博弈论引入经济学中。到20世纪50年代,合作博弈发展到鼎盛期,非合作博弈也开始产生。纳什 (Nash ,J.F.)的《N 人博弈的均衡点》(1950)、《非 合作博弈》(1951)明确提出了“纳什均衡”(Nash E q uilibrium ),图克(Tucker )则定义了“囚徒困境”(Prisoners’Dilemma ,1950)。两人的著作奠定了 现代非合作博弈论的基石。泽尔滕(R.Seleten , 1965)首次将动态分析引入博弈论,提出了纳什均 衡的第一个重要改进概念———“子博弈精炼纳什均衡”(Sub g ame Perfect Nash E q uilibrium )和相应 的求解方法———“逆向归纳法”(Bakeward Induction )。豪尔绍尼(J. C.Harsan y i ,1967)首次 把信息不完全性引入博弈分析,定义了“不完全信息静态博弈”(Static Games of Incom p lete information )的基本均衡概念———“贝叶斯-纳什 均衡” (Ba y esian -Nash E q uilibrium ),构建了不 完全信息博弈的基本理论。之后,不完全信息动态博弈(d y namic g ames of incom p lete information ) 得到迅速发展,弗得伯格和泰勒尔(Furdenber g and Tirole ,1991)定义了它的基本均衡概念——— “精炼贝叶斯—纳什均衡”(Perfect Ba y esian -Nash E p uilibrium )。70年代以后,博弈论形成了一个完整的体系;大体从80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础。1994年诺贝尔经济学奖被授予纳什、豪尔绍尼和泽尔滕三人,以表彰他们在博弈论的发展及应用中所作出的开创性贡献。 一经济博弈论的基本理论———基本博弈结构、纳什均衡及其改进 这里,我们以完全信息静态、完全信息动态、不完全信息静态、不完全信息动态四种博弈结构为主线,对纳什均衡及其改进进行概括,以阐明经济博弈论的主要思想内涵。 (一)完全信息静态博弈———纳什均衡 纳什均衡是完全信息静态博弈的基本均衡概念。完全信息静态博弈(Static Games of Com p lete Information )是指,博弈的每个局中人(参与竞争的具有不同利益的行为主体或决策者)对所有其他局中人的特征(策略空间、支付函数等,前者指可供局中人选择的策略组合,后者指决定局中人损益得失的函数)有完全的了解;所有局中人同时选择行

耶鲁大学博弈论_精简版

第一讲导论-五个入门结论 1.通过成绩博弈模型可以知道,不选择严格劣势策略,因为每次博弈会得到更好的收益。 2.通过囚徒的困境博弈模型可以知道,理性选择导致次优的结果(协商难以达成目的的原因不是因为缺少沟通,而是没有强制力)。 3.通过愤怒天使博弈模型可以知道,汝欲得之,必先知之;永远选择优势策略,选择非劣势策略,损失小,如果对手有优势策略则应以此作为选择策略的指导。 4.如果想要赢,就应该站在别人的立场去分析他们会怎么做。 第二讲学会换位思考 1.构成博弈要素包括,参与人,参与人的策略以及收益。 2.所谓严格优势策略,就是指不论对方采取什么策略,采取的这个策略总比采取其他任何策略都好的策略。 3.在博弈中剔出某些选择时需要站在别人的角度去思考结果,因为对手不会选择劣势策略;同时要考虑到对手也是一个理性的参与人。 4.在博弈中剔除某些选择是一种直接思考,同时也是作为一个理性参与人的选择。 第三讲迭代剔除和中位选民定理 1.在选民投票博弈模型中,通过不断地迭代以及剔除来决定策略,由此,我们得到了一种新的选择策略的方法:迭代剔除法。 2.选民投票博弈模型的结果与现实存在偏差,主要是因为:①现实中选民并不是均匀分布的;②选民通常根据候选人的性格而非政治立场来进行投票,而政治立场只是单一维度;③只适用于只有两个候选人的情况;④同时存在弃权票;⑤选民未必相信候选人所声明的立场。 3.建立模型,是为了更好的描述事实以激发灵感,模型是有重要的事是抽象而来,逐步增加约束条件完善模型观察结果,比较分析结果的变化。 第四节足球比赛与商业合作之最佳对策 1.点球博弈模型告诉我们,不要选择一个在任何情况或信念下都不是最佳对策的策略。 2.最佳对策:①参与人针对对手策略的定义:参与人i的策略s^i(简写成BR)是对手策略S-i的最佳对策,如果参与人i在对手的策略S-i下选S^i的收益弱优于其它对策Si`,这对参与人i的所有Si`都适用,则策略S^i是其它参与人策略S-i的最佳对策。S^i最大化了对手选S-i时我的收益;②最佳对策广义定义:参与人i的策略S^i是最佳策略(你对其他参与人可能采取的策略持信念P时的最佳策略),在参与人i仍持信念P的情况下选S^i 的获得预期收益比在同样的信念P下选其它的策略获得的预期收益都要高(对于所有可选的Si`均成立)即Eu(S^i,P)≥Eu(Si`,P) Si` in Si 我从Si选择可选策略时S^i而非S-i最大化了我的预期收益。 第五讲坏风气与银行挤兑 1.纳什均衡,即对任意一个此博弈内的参与者A,他所选择的策略是其他参与人所选策略的最佳策略。

(定价策略)价格战中博弈论的浅析

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流管理(采购与供应链1班) 学号:1040407122 姓名:曾维乐 二〇一一年十二月十八日

价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。 关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单说来就是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、

生活中的博弈论感悟(优.选)

《生活中的博弈论》学习感悟 第一讲初试博弈论 生活中的资源是有限和稀缺的,于是就产生了竞争,这种竞争就需要一种形式把大家聚在一起,这种形式就是博弈。博弈论是在力图在最简单的假设下得到最大范围的推广和应用,其伟大在于对后世的引导和激发作用。博弈论不仅从古代就散发着智慧,还体现在我们生活中的种种小事中,如双方互拨打电话,放弃球赛陪女友逛街等。博弈论是建立在博弈双方或者多方都属于理性人的基础上,通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素,博弈者做出对自己最有利最保险的决策和行动,从而使得自己能达到获利或者获胜的目的。每个人都可以成为博弈高手,但人的决策又具有有限理性,因此博弈论也不是万能的。 第二讲纳什均衡 在某一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲,勿施于我。

囚徒困境博弈反映个人最佳选择并非团体最佳选择。用囚徒困境博弈对两个势均力敌的竞争对手进行分析,可以发现合作是可以实现双赢的。如:两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)增加广告开支,设法提升广告的质量,压倒对方。(背叛)若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 第四讲斗鸡博弈 所谓“斗鸡博弈”就是两只公鸡面对面斗争,继续斗下去,两败俱伤;一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、被谁一站的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。学习了知识,就要善于联想,善于联系生活。在很多的时候我们都可能是在不知不觉中就使用了或者是接触到了博弈论,就像是平常我们和其他人之间的争执问题,每次都可能弄得脸红脖子粗的,双方都不服气,最终的结果是有一个人妥协,然后彼此达成一致;冷战期间的美苏两大军事集团的争斗也是一种“斗鸡博弈”。

博弈论理论经典讲解

博弈论经典案例 冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅 引用 光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典 案例. <案例一:囚徒困境> 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析. 在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。 这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年. <案例二:智猪博弈> 这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的 成本,支付水平分别为5和1.其他情形可以类推. 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得! <案例三:性别战>

博弈论与策略行为

博弈论与策略行为 G a m e T h e o r y a n d S t r a t e g y B e h a v i o r 蔡继明 教授/主任 清华大学政治经济学研究中心 Center for Political Economy at Tsinghua University CPET

目录 第一讲:导论 一、博弈论的研究对象 第二讲:占优战略与社会两难第三 讲:纳什均衡和双人博弈第四讲:三 人博弈与n人博弈第五讲:纯战略和 混合战略第六讲:博弈的合作解第 七讲:序贯博弈与子博弈完美均衡第 八讲:重复博弈第九讲:企业经营决 策的博弈分析第十讲:企业内部组织 分析第十一讲:政府行为分析 第一讲 导论 博弈论是研究理性的决策主体在其行为发生直 接的相互作用时的策略选择及策略均衡的理论。 博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大 收益的策略)。 二、博弈论的产生和发展 博弈又称博戏,是一门古老的游戏。 1. 博弈在中国《学弈》(《孟子 ?告 子》):弈秋,通国 之善弈也。使弈秋侮 二人 弈,其一人专心致志,惟 弈秋之为听;一人虽 听之,一心以为有鸿 鹄将至,思援弓缴而射 之。虽与之俱学,弗若 之矣。为是其智弗若 与?吾曰:非然也。 《世本》说,“乌曹作博”,乌曹乃是 夏代著名之能工巧匠。千百年来,博 弈更是与人们的生活紧紧相连,从博 棋到牌戏,从斗戏到彩票,中华民族 的历史长河中就这样形成了别具风情 的博弈文化 从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战

1

博弈论复习大纲下

博弈论第六讲--第九讲复习大纲 第六讲声誉和对称信息重复博弈 1、重复博弈(Repeated Game):是动态博弈的一种特殊情况。在重复博弈里,完全相同的环境一次次重复出现,参与人在重复出现的相同环境中做出决策。重复博弈是一类很重要的动态博弈。 2、有限次重复博弈例子:连锁店悖论:现象---博弈的重复进行对进入威慑博弈和囚徒困境的结果基本上没有影响;结论---在位者在包括第1个市场的所有市场上都将选择合谋。这个结论称为连锁店悖论。 通过对连锁店悖论的分析,得出结论:如果当事人完全理性,有限次重复博弈的均衡解和一次博弈没有区别。把这个结论推广到囚徒困境博弈中,就是说,尽管两个人都选择不坦白是集体最优的,但如果同样的博弈重复有限次,这个重复博弈的均衡仍然是(坦白,坦白)。 重复博弈比不重复进行的一次性博弈要复杂得多。在现实中,如果当事人不那么理性,或者看起来不那么理性,那么有限次重复博弈的结果有可能和一次博弈不同。那么在有限次博弈的囚徒困境中,就有可能实现(抵赖、抵赖)的结果。 3、无名氏定理:重复博弈中最重要也是最有名的结果是“无名氏定理”,该定理认为,只要局中人有足够的耐心,那么任何理性的可行盈利都可以在均衡中得以实施。换句话说,只要局中人的耐心足够地大,一次博弈中可行的理性结局总是可以与重复博弈中某均衡结局相一致。 无名氏定理告诉我们:在无限次重复博弈中声称完美均衡导致了某一特定的行为是没有意义的。 4、声誉:在重复进行的囚徒困境博弈里,只有博弈将重复进行无限次时,参与人才会选择合作。这是声誉的一个大问题。因为每个人都知道一个参与人将在最后一期选择坦白,那么为什么他们还要假设这个参与人会在目前建立起自己的声誉呢? 声誉应用: 5、折现率的概念以及无限次重复博弈中合作条件的推导,以产量卡特尔为例。 6、价格竞争对制造商的影响 7、进化与囚徒困境,鸽鹰博弈

博弈论教学大纲

《博弈论》教学大纲 第一部分教学说明 1、课程的性质与任务 《博弈论》是经济学院本科生的限定选修课。 2、课程教学目标 课程教学目标是帮助学生获得必要的决策科学基本知识,了解学科发展前沿,掌握探索系统科学基本规律的一般方法;使学生学会应用博弈论的基本原理和方法分析政治、经济、军事、管理和社会生活等领域的博弈问题。 3、适用专业与学时数 本课程的教学大纲适用于经济学和非经济类的本科专业的本科生。为了让学生基本地掌握发展经济理论,我们计划用38个学时分五部分讲授知识,用4个学时进行经济实践活动,希望在教学与实践中,学生能够加强对发展经济学理论的理解和检验。 4、本课程与其他课程的关系 本课程以微观经济学为基础。 5、推荐教材与参考书 《博弈论与信息经济学》,张维迎著,上海三联书店、上海人民出版社; 《博弈论战略分析入门》,Roger A McCain著,原毅军等译,机械工业出版社; 《博弈论》施锡铨著,上海财经大学出版社,2002; 《Game Theory》,1991,D.Fudenberg& J.Tirole 中译本,中国人民大学出版社; 《经济博弈论》(第二版) 谢识予编著复旦大学出版社, 2002。 6、主要教学方法与媒体要求 本课程以老师课堂讲授为主,以学生课后实践为辅,同时鼓励学生参与经济实践与经济讨论的活动如举行经济散文竞赛和经济辩论等等。为适应科学教育的现代化、国际化和信息化,我们在教学媒体上逐步使用电脑、投影仪、幻灯片等硬件设备,与此相配套的就是使用诸如Powerpoint之类的电子讲稿,此外我们还将通过网络与学生多方面、多层次、多角度的交流,及时了解学生学习的动态和存在的问题。 7、开课与编写大纲单位:经济学教研室;课程负责人:卢燕平;审定单位:经济学院;

博弈论蒋文华浙江大学

第一讲、博弈论概述 献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么! 行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的

策略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉 特别提示: 如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢(大智若愚) 特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示: 在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。 ----汉代刘向,《围棋赋》 二、西方的理解 game(规则) 费厄泼赖(fairplay)

第三节学习博弈论的收益 一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展 三、提出完善游戏规则(制度)的建议 第二章发展简史 第一节最初的探索和应用 一、古诺模型 参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。 二、伯川德模型 该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。 三、斯塔克尔伯格模型 该模型分析的是这么一种市场竞争:企业A先决定一个产量,然后企业B 可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。 第二节理论的诞生与发展 1、20世纪40年代的社会变化。 2、约翰·冯·诺依曼(JohnVonNeumann,1903-1957)的卓越贡献。1944

1对策论的基本概念

§1 对策论的基本概念 对策模型的三个基本要素: 1.局中人:参与对抗的各方; 2.策略集:局中人选择对付其它局中人的行动方案称为策略;某局中人的所有可能策略全体称为策略集; 3.一局势对策的益损值:局中人各自使用一个对策就形成了一个局势,一个局势决定了各局中人的对策结果(量化)称为该局势对策的益损值。 “齐王赛马”齐王在各局势中的益损值表(单位:千金) §1 对策论的基本概念 其中:齐王的策略集: S1={ α1, α2, α3, α4, α5, α6 }, 田忌的策略集:S2={ β1, β2, β3, β4, β5, β6 }。 下面矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3 §1 对策论的基本概念 二人有限零和对策(又称矩阵对策): 局中人为2;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。

通常将矩阵对策记为: G = {S1, S2, A} S1:甲的策略集;S2:乙的策略集; A:甲的赢得矩阵。 “齐王赛马”是一个矩阵策略。 §2 矩阵对策的最优纯策略 在甲方的赢得矩阵中: A=[a ij]m×n i行代表甲方策略i=1, 2, …, m;j 行代表乙方策略j=1, 2, …, n;a ij 代表甲方取策略i,乙方取策略j,这一局势下甲方的益损值。此时乙方的益损值为 -a ij (零和性质)。 在考虑各方采用的策略时,必须注意一个前提,就是双方都是理智的,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。 §2 矩阵对策的最优纯策略 例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛。比赛共赛三局,规定每局胜者得1分,输者得-1分,可知三赛三胜得3分,三赛二胜得1分,三赛一胜得-1分,三赛三负得-3分。甲队的策略集为S1={α1,α2,α3},乙队的策略集为S2={β1,β2,β3}。根据以往比赛的资料,有甲队的赢得矩阵为A,如下所示, 请问这次比赛各队采用哪种阵容上场最为稳妥? §2 矩阵对策的最优纯策略 矩阵A中每行的最小元素分别为1,-3,-1。 在这些最少赢得中最好的结果是1,故甲队会采取策略α1,无论对手采取何策略,甲队至少得1分。对于乙队,{β1,β2,β3}可能带来的最少赢得,即A中每列的最大元素,分别为3,1,3。乙队会采取β2策略,确保甲队不会超过1分。 α1和β2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略。 这种最优纯策略只有当赢得矩阵A=(a ij)中等式 成立时,双方才有最优纯策略,并把(α1,β2)称为对策G在纯策略下的解,又称(α1,β2)为对策G的鞍点。把其值V称之为对策G={S1,S2,A}的值。 §2 矩阵对策的最优纯策略 例某单位采购员在秋天决定冬季取暖用煤的储量问题,已知在正常的冬季气温条

第一讲 博弈论战略分析

博弈论战略分析 刘会齐 手机:135******** QQ:470498940 Email:commonuse@https://www.360docs.net/doc/ed7438652.html, 公共:sbsteacherliu@https://www.360docs.net/doc/ed7438652.html, PIN:1234567890123

考核方式 期末考试占60%,开卷考试 (范围以课堂讲解内容,在ppt上都有)平时占40%,其中考勤占20% 课堂练习占20%

第一章:冲突、战略与博弈 本章主要概念 ●博弈论( Game theory):博弈论是研究理性的经济 个体在相互交往中战略选择问题的理论。 ●博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应战略。依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来最大收益的战略。 ●博弈论这种说法是一种科学的比喻,很多不被看做 是博弈的行为,如竞争、战争和竞选等都可以作为博弈来处理和分析。

什么是博弈论?它与战略、冲突又有什么关系呢? 显然,包括博弈在内的许多人类活动,都存在着战略和冲突。冲突的结果是一方获胜,一方落败,博弈通常也总是有输有赢。 本讲将向读者介绍一种分析战略的方法,一种源自数学研究的博弈思维方式。 本章首先要回答两个问题:一是何为博弈论(game theory);二是博弈论与战略之间有什么 关系。 为了阐述这些问题,让我们先看几个例子。第一个例子是最常与战略、冲突联系在一起的人类活动:战争。

1.1西班牙叛乱:击溃赫图勒斯 约公元前75年,西班牙(位于拉丁美洲 的伊斯巴尼亚)发生了一起反对罗马的 叛乱,然而,叛乱的发起人却是罗马士 兵和一些膜拜罗马的西班牙人。后人普 遍认为,西班牙叛乱的领导者昆塔斯·塞 多留(Quintus Sertorius)当时是想利用西 班牙来使自己登上罗马帝国的最高统治 宝座。

耶鲁大学——博弈论

中文片名: 耶鲁大学开放课程:博弈论 英文片名: Open Yale course:Game Theory 剧集分类: 悬疑 影片类型: 教学 资源格式: RMVB 上影时间: 2010 导演: 主演: 对白语言: 英语 字幕语种: 中英 介绍: 中文名: 耶鲁大学开放课程:博弈论 英文名: Open Yale course:Game Theory 版本: 更新完毕[MOV] 发行时间: 2009年 地区: 美国 对白语言: 英语 字语言: 英文 简介: 课程类型:经济 课程介绍: 这门课程是系统介绍有关博弈论和战略思想。比如支配思想、落后的感应、纳什均衡、进化稳定性、承诺,信誉,信息不对称,逆向选择等。并在课堂上提供了各种游戏以及经济、政治,电影和其他方面的案例来讨论。 关于课程主讲人: Ben Polak教授任职于耶鲁大学管理学院经济系。他在剑桥大学Trinity College获得学士学位,在西北大学获得硕士学位,在哈佛大学获得博士学位。他是微观经济理论和经济史方面的专家。他的论文在Economic Letters、Journal of Economic Theory、Journal of Economic History、Journal of Legal Studies、Journal of Theoretical and Institutional Economics、Econometrica等学术期刊多次发表。他最近的研究是“广义功利主义和海萨尼的公正观察员定理”和“平均分散的偏好” 课程结构: 本耶鲁大学课程每周在学校上两次课,每次75分钟,2007年秋季拍摄作为耶鲁大学开放课程之一。 课程安排: 1. Introduction: five first lessons

博弈论简明教材

博弈论 第一节博弈问题概述 一、博弈的基本概念 博弈论是近年经济学中发展得很快的一个分支。博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。换句话说,博弈论研究当某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体时的决策问题和均衡问题。 在前面几讲中,除了寡头市场外,消费者的效用或厂商的利润都只依赖于他自己的选择,而与其他人的选择无关。在这里,经济作为一个整体,各个经济主体的选择是相互影响的。但对于单个的消费者或厂商来说,所有其它经济主体的行为都被包括在一个参数里。这个参数就是价格。除此以外,经济主体在决策时,面临的似乎是一个非人格化的东西。经济主体既不需要考虑他人的选择对自己选择的影响,也何必需要考虑自己的选择对他人的影响。而在本讲所介绍的博弈论中,消费者的效用或厂商的利润不仅依赖于自己的选择,而且依赖于具体的某一个或某一些其它经济主体的选择。 在经济学中,博弈论通常是放在寡头市场的分析中,因为在寡头市场上,某一寡头企业在决策时,不得不考虑其他寡头企业的反应。但事实上,博弈行为是广泛存在的。 博弈分析的目的是使用博弈规则决定均衡。 博弈论的基本概念包括:参与人、行动、战略、博弈规则、信息、报偿、均衡。 参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。 行动是指参与人作的决策。 战略是指参与人选择行动的规则,它告诉参与人在什么情况下选择什么行动。 例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。这里,“犯”与“不犯”是两种不同的行动。战略规定了什么时候选择“犯”,什么时候选择“不犯”。 博弈规则是指参与人共同接受的不同情况下的最优战略。信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。 报偿是参与人从博弈中获得的结果,它取决于所有参与人的行动或战略。 把全体参与人可能采取的不同战略及其报偿都列出来,称为报偿矩阵。 均衡是所有参与人的最优战略或行动的组合。 二、博弈的分类 可以从不同的角度对博弈进行分类。 根据博弈者选择的战略,可以将博弈分成合作博弈 (cooperative games) 与非合作博弈 (non-cooperative games). 合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。例如,如果几家寡头通过订立并实行协议,限制产量,制定垄断高价,则称这种博弈为合作博弈。若寡头们在市场竞争中没有达成有约束里的协议,每个企业仅仅是在考虑到

相关文档
最新文档