博弈论中的相关概念

博弈论中的相关概念
博弈论中的相关概念

新古典经济学前提:

理性选择——减少不确定;

——经济系统效用最大化。

理性——新古典经济学与博弈论的纽带

博弈论决策前提:理性的战略选择。

博弈论决策基础:最优反应,即带来最大收益的战略。

但是,在博弈论中最优反应不是理性的唯一表现,也不总是假定人是理性的。

新古典经济学决策的背景:

理性的个体面临特定的制度环境(产权、货币、高度竞争的市场),在此基础上以获取利益最大化为目的。

隐含的基础:只需考虑自身情况和市场条件,而不考虑他人行为。

弊端:

——限制了理论的使用范围,现实中竞争并不完全;

——无法解决货币经济以外的决策难题。

博弈论的优势:

——不仅考虑自身条件和市场环境,最重要的是还需考虑他人的行为。

游戏规则:

两个选手,轮流取币;

每次至少取一枚硬币;

只能从一行中取任意数量的硬币,不许从两行中选取;

取走最后一枚硬币的为胜者

囚徒困境的启示:

囚徒困境仅仅是二人博弈,多人博弈在现实中更多;

如果囚犯可以交流,结果显著不同;

如果多轮博弈,结果也有不同;

导致困境结论的分析过程令人注目,但最后结论并非理性。

通常假设参与者将采取最优反应战略而理性行事,最大化利润、力争在游戏中获胜、达到主观收益最大化,或者惩罚最小化,皆属于理性行为。

最优反应战略是在其他参与者战略已知或可预测条件下,给某参与者带来最大化收益的战略。

博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。

依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来的最大收益的战略。

标准式——数字矩阵;

扩展式——树形图

不确定事件(contingency):

相机战略(contingent strategy):仅在不确定事件发生时才会采取的战略

信息集(information set):节点2包含了决策者掌握的所有信息,因此也称为信息集。

扩展式的优势:

——展示了每一阶段掌握的信息;

——展示了参与者掌握信息的不完全

所有博弈问题均可用标准式描述,即绘制一个表格,边缘列出参与者的战略,里面列出参与者的收益;

有些博弈的部分战略是相机战略,只有当对方已经采取了特定的行动时,这些战略才会生效。相机战略和应急计划非常重要,尤其是当参与者能够通过其掌握的信息而获取优势时;

如果一个参与者不知道对手已经做出或将要做出的决策,我们就把他所有可能的选择标在同一节点上,在树形图中,该节点会包括多条分支,由于它说明了决策者掌握的信息,我们将其称为一个信息集。确切地说,信息集反映的是决策者不知道的信息,因为他不知道对手将如何决策;

博弈的两种描述方法——扩展式和标准式可以相互替代。

占优战略

占优战略均衡

合作解

非合作解

社会两难

博弈论的精髓:行为互动。

在经济学中,稳定、可预测的互动行为模式被称为均衡。

博弈论要做的就是探寻博弈回合的均衡模式。

占优战略(dominant strategy):无论对方采取何种战略,其都是最优反应的战略。

占优战略均衡:当每一位参与者都选择了各自的占优战略时,相应的博弈结果就是占优战略均衡。

劣战略(dominated strategy):如果无论对手选择哪种战略,一个战略的收益总高于另一个战略,第二个战略就被称为劣战略

社会两难(social dilemma):是一种存在占优战略均衡的博弈,并且参与者采用这种均衡战略的收益比采用非均衡战略的收益要差。

合作解:因合作而提高收益。

非合作解:在没有可能达成有约束力的协议,以协调不同参与者的战略时,参与者们所选的战略及其收益就是一个博弈的非合作解。例如占优战略。

占优战略的存在以及它与合作解相悖的事实是导致社会两难的根本原因。

占优战略均衡也是合作解。

这种合作的占优战略均衡并不是社会两难问题。

占优战略均衡与合作解之间不冲突。

但这是最好的结果吗?

博弈分析的目标之一就是找到参与者之间稳定的、可预测的互动行为模式。按照经济学家的说法,我们称之为均衡。

因为我们假设参与者都是理性的,所以,只有一个参与者选择的是针对对手战略的最优反应战略,其选择才是稳定的。

如果存在一个针对对手所有战略来说都是最有反应的战略,我们就称之为占优战略;

如果博弈中的每个参与者都有占优优势,并且也实施其占优优势,我们就可以获得一个占优战略均衡;

占优战略均衡是一个非合作均衡,每位参与者都独立行动,而不是一起协商战略选择,如果博弈中的参与者都能够保证自己履行协商后的战略,那么他们选择的战略就被称为合作均衡。

合作均衡和占优战略均衡有可能一样,也可能不一样;

社会两难问题是一类重要的占优战略均衡博弈,代表就是囚徒困境。社会两难问题都有一个共性:存在一个与合作均衡冲突的占优战略均衡;

并非所有的博弈都存在占优战略均衡。

纳什均衡;

协调博弈;

谢林点。

纳什均衡(Nash equilibrium):是全部参与者所选战略的一个组合,在这个战略组合中,每个人的战略都是针对其他人战略的最优反应。

任何一方都不可能单方面变换战略而改善自己的境况。

由于纳什均衡战略的选择者也是没有协商的,因此也是非合作均衡。

收益占优均衡(payoff dominant equilibrium):均衡获得最大收益。

风险占优均衡(risk dominant equilibrium):均衡规避最大损失。

协调博弈(coordination game):只有协调彼此的战略选择,两个参与者才能得到最优的收益。两点启示:

——在特定情况下,惯例和传统能够提供多纳什均衡博弈的解;

——协调博弈中的纳什均衡可以解释为什么习俗和惯例看似很随意,实际却很稳定,因为它们都是纳什均衡,能够自我强化。

没有谢林点。

二者收益并不均衡,一方必须接受收益低的现实。

如果双方都认为对方会选择追求其他女士,则又回到(0,0)的初始状态

在一个没有占优战略均衡的博弈中,如果每一个参与者都采用了针对其他参与者所选战略的最优反应战略,那么参与者的战略选择仍然是确定、可预测且理性的,我们把这种情况称之为纳什均衡。

占优均衡战略是一种纳什均衡,但有些纳什均衡不是占优均衡。

纳什均衡是一种非合作均衡,与博弈的合作均衡可能相同,也可能不同。

纳什均衡是求解博弈问题的一个普遍适用的方法。

但也有缺点:

——有些博弈的纳什均衡不是唯一解;如果有线索是决策者认为某个均衡更可能发生,则这个均衡被称为谢林点;

——并不是所有博弈都存在纳什均衡。

零和博弈(zero-sum game):参与者收益之和为零的博弈;

非常数和博弈(nonconstant-sum game):

常数和博弈:

最大最小收益(minimax payoff):最优战略是其最小收益中数值最大的收益所对应的战略。最大最小解并非适合于所有双人零和博弈

零和博弈尽管在博弈论发展史上具有重要的意义,但是过于简化,并不能完全适合于现实。因此又不要引入非常数和博弈

在非常数和博弈中,最大最小解与纳什均衡可能不完全一致。

两种博弈在博弈论发展中具有重要影响:

——零和博弈:依赖最大最小法则或最小最大法则确定纳什均衡;

——存在两个纳什均衡的2×2非常数和博弈。

联盟:

拆台者;

公共物品

联盟(coalition):在博弈论中,把协调相互战略的参与者称为联盟。

当所有参与者联合起来时政治学上称为大联盟(grand coalition)。

单人联盟(single coalition):博弈论中将一个参与者单独行动视为自己与自己的联盟,可以称为单人联盟。

联盟结构(coalition structure):

三人以上的非合作博弈形成联盟也有可能,但是缺少制约机制情况下,实现纳什均衡的联盟才能存在。

2.政治博弈中的“拆台者”

3.有时第三方充当“拆台者”的角色。

4.拆台者(spoiler):是指自己不可能获胜却可以阻止其他人获胜的参与者

5.股票投资建议

6.当博弈中存在三个或更多的参与者时,对任一参与者来说,与大多数人合作总是比较好的选择。

7.两人作伴,三人拥挤”的博弈

8.前面的博弈有三种类型:

9.一是有人始终被排除在联盟之外;

10.二是有人扮演拆台者的角色;

11.三是第三人必须与大多数人保持一致。

12.现在有第四种情况,即“两人作伴,三人拥挤”的现象。

13.公共物品(public good):带有某种特性的某种商品或服务,政府提供类似服务要优于个人。

14.公共物品具有两个特征:

15.——每个人都可以从中受益,特别是没有付费的人可以与付费的人同等享用该物品;

16.——成本由提供服务的水平决定,而不取决于接受服务的消费者数量。同等水平下,消费者数量的增加不会导致成本的升高,而且没有人能够通过减少公共物品对他人的服务以增加对自己的服务。

17.例如非商业用途的广播、免费的乡间公路、国防等。

18.三人博弈中,两人可以形成联盟以抵抗第三人;但非合作博弈中,联盟并非总是可行,只有符合纳什均衡的联盟才可能稳定。

19.三人博弈中还有“拆台者”现象。

20.三人博弈中,参与者会遵循服从大多数的原则。

概率;

期望值;

风险厌恶

概率(probablity):衡量可能性的一种数字度量,取值范围为[0,1]。

期望值(expected value):所有可能收益的加权平均之和,权重为各种可能的对应概率。例1:赌博中投出6得到10美元,投出其他数字什么也没有。

期望值=10×1/6﹢0×5/6

=5/3

自然的不确定性(natural uncertainty):

是博弈的一方重要力量。

“自然”同“机遇”都是相当特殊的博弈参与者,与理性行为不同的是,自然界从不关心结果,而是随机地采取具有特定概率的战略。

创新产品未来面临的市场是“好”还是“不好”是未知的;

未来条件的“好”与“不好”由自然随机决定,发生的概率各占50%;

在某种意义上讲,数学期望是不确定收益的公平价值。由于期望值带有风险,而人们常常希望规避风险,所以仅仅知道期望值是不够的。

风险厌恶(risk averse):如果某人选择具有相同期望值的无风险收益,而不是带有风险的收益时,我们就说他是风险厌恶的;

风险偏好(risk loving):如果某人选择带有风险的收益,而不是具有相同期望值的无风险收益,我们就说他是风险偏好的;

风险中立(risk neutral ):如果某人不考虑风险,只考虑期望值的大小,我们称之为风险中立

期望效用

效用(utility)将风险厌恶与其他类型的主观动机联系起来。首先假定在博弈中,获胜方的主观收益可以用数字测量,即效用。效用不一定等同于货币收益

期望效用:消费者在不确定条件下的可能得到的各种结果的效用的加权平均数。

pU(W1)+(1-p)U(W2)

期望值的效用:不同结果下的消费者所拥有的货币财富量的加权平均数的效用。

U[pW1+(1-p)W2]

当无风险收益(虚线曲线)相比具有相同期望值的有风险收益(实线直线)具有更大的效用。这是一种风险厌恶型

纯战略;

混合战略;

随机选择战略;

混合战略均衡。

纯战略和混合战略基本界定

纯战略(pure strategy):单一的、确定的战略选择。

混合战略(mixed strategy):战略决策者选择纯战略的方式不可预测,这种不可预测性意味着战略选择中包含随机因素,每一种战略都有一定的概率被选中,因为是多种纯战略的混合,因此叫做混合战略。

混合战略均衡(mixed strategy equilibrium):由于以上例题中的决策者所选择的混合战略都是基于对手选择的最优反应,因此也属于纳什均衡,这种类型的纳什均衡被称为混合战略均衡。

这是社会两难问题。

对于社会两难问题,占优战略均同时占优于混合战略和纯战略。

在不确定状态下,理性的参与者调整纯战略的选择概率,使自己的行为不可预测,从而减少被对手反制的机会。当参与者以这种方式选择战略时,我们称之为混合战略。

混合战略收益不确定;

因为混合战略的收益是不确定的,所以我们要用期望收益对其加以衡量。

最优反应就是指能够使期望收益达到最大的战略(或战略选择的概率值);

依据最优反应的这种定义方式,所有的二人博弈都存在纳什均衡,包括那些不存在纯战略均衡的两人博弈;

一些博弈可能存在纯战略的均衡和混合战略的均衡。协调博弈的混合均衡战略不是稳定的。

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

范里安《微观经济学:现代观点》(第9版)课后习题详解-(博弈论的应用)【圣才出品】

第30章博弈论的应用 1.在一个双人博弈纳什均衡中,每一个参与人都在针对什么作出最优的反应?在一个占优策略均衡中,每一个参与人又都在针对什么作出最优的反应? 答:(1)在纳什均衡中,每个参与人都对其他选手的最优反应作出了自己的最优反应。 (2)在一个占优策略均衡中,每个参与人的选择都是对其他选手所有选择的最优反应。特别地,占优均衡一定是纳什均衡,但纳什均衡却未必是占优均衡。 2.在有关混合策略的章节中,考虑行参与人和列参与人的最优反应。它们会产生最优反应函数吗? 答:行参与人和列参与人没有最优反应函数。如图30-1所示,这两条曲线分别体现了行参与人和列参与人对应于对方选择时的最优反应。曲线的交点就是纳什均衡。在这种情况下,博弈存在三个均衡,其中,两个是纯策略均衡,一个是混合策略均衡。当行参与人选择r=2/3时,列参与人存在无穷多个最优反应,而不是像函数的数学定义所要求的那样,只有一个最优反应。

图30-1 最优反应曲线 3.在一个合作博弈中,如果博弈双方作出相同的选择,那么,结果对于他们两个对这都令人满意。这个结论是否正确? 答:这个说法不正确。 这是因为合作博弈的结果取决于博弈的收益,而非两个人是否选择相同的策略。比如在汽车博弈中,如果双方都选择直线驾驶,他们将陷入最糟糕的境况。 4.本章正文指出,在均衡状态,行参与人在62%的时间内会得分。这个数值是如何得到的? 答:博弈的均衡策略为“行参与人按0.7的概率踢向左方,而列参与人以0.6的概率扑向左方”,由于射门方向和扑救方向共有四种组合,从而得到每种组合的概率分布如表30-1所示。 表30-1不同组合的概率分布

博弈论的基概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论及其应用(期末学习报告)

博弈论及其应用长虹与同行家电业的价格战 姓名: 学号: 学院: 专业:

博弈论及其应用 长虹与同行家电业们的价格战 一、事件背景 由军工厂转型的长虹是国内最早从日本松下引进彩电生产线的企业。1985年,军人气质十足的倪润峰执掌长虹。1994年,长虹在上海证交所上市;1995宣布自己成为“中国最大彩电基地”。 1996年,长虹的指挥官倪润峰决定拿出更大的动作。提出一个令人意外的“产业报国”计划。1996年,本土彩电企业陷入最艰难的苦战时刻,一个潜在的危机正在步步逼近。4月1日开始,彩电的进口关税将大幅下降。3月26日,长虹宣布,所有品种彩电一律大幅度让利销售,降价幅度从8%到18%。随后,猝不及防的其他中国厂家纷纷选择跟进。彩电业的价格大战,就在这样一种“产业报国”的氛围之中,拉开大幕。 价格战刚刚开打一个月,长虹的市场占有率就上升到19%,比降价前增加了7.9%。到年底,长虹坐稳了“彩电大王”的宝座。中国每卖出三台彩电,有一台出自长虹,有一台是外资品牌,还有一台才是其他国内品牌。倪润峰逐渐把国内同行们逼到了死角。在此战之前,国内各省市其实还有60多个地方性的彩电品牌,它们大部分是国有企业,作为当地的支柱产业割据一方,小富即安。然而在长虹的降价冲击下,大多数企业迅速凋零,成为行业重组中一颗颗散落的棋子,只能到长虹、康佳、TCL那里请求收购。彩电业从此步入由五六家大公司瓜分市场的时代。这一年,预算内国有企业的净销售利润率降低到历史最低点,亏损总数是1985年的28.6倍。相比之下,全国乡镇企业的产值增长22%,中外合资企业的所得税增长40%。 1997年,用价格战给中国企业家们好好上了一课的倪润峰被推上了事业的巅峰,1998年,在价格战中得到洗礼的国内同行开始显山露水。1999年,长虹的净利润下降74%;2000年5月,倪润峰卸下总经理职务,退隐江湖。2000年6月9日,康佳和TCL在内的九大国内彩电巨头联手组成价格联盟,准备正面迎击长虹的价格战。2005年4月16日,在这个特意挑选的休市日,长虹公布了2004年年报,抛出中国股市有史以来上市公司亏损之最:36.81亿元。价格战的发明者和坚决的拥护者,为最后的豪赌交出了最昂贵的学费。 二、各方的观点

博弈论在经济学中的应用

博弈论在经济学中的应用 刘肃素 (华中师范大学经济与工商管理学院 2011211086) 摘要:博弈论是研究策略博弈的数学理论,亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈,这就需要了解博弈的思想,用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。 关键词:博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

初探博弈论及其应用【开题报告】

毕业论文开题报告 信息与计算科学 初探博弈论及其应用 一、选题的背景与意义 在人类历史上,很早就有了博弈思想的故事,如众所周知的“田忌赛马”。在社会生活中,我们也能碰到类似的情形和现象,如下棋、打扑克、猜拳等想用自己的战术去取胜,这就是所谓的博弈现象。博弈论是研究理性的个体在相互依存时如何做出决策的一门理论知识,主要是强调决策主体的行为而引起的直接相互作用。 上世纪80年代以后,博弈论经历了突飞猛进的发展,主要是在经济方面的发展,越来越多的人把它归为主流经济学的重要组成部分。不仅是在经济上有广泛的应用,而且在军事、信息、政治等方面也能看见它的影子。1994年的诺贝尔经济学奖获得者就是三位博弈论的专家。以后又有三次奖授给了与博弈论有关的专家。在我国,经济学界对经济博弈论的关注和兴趣也在迅速增强。由于博弈论应用的广泛性和实用性,越来越来多的人开始学习和研究博弈论。可以说,博弈论正将进入一个崭新的阶段。 二、论文的主要思想 博弈论研究理性的个体在相互依存时如何作出决策。因此博弈论在研究时需要作出一定的假设,当然也包括一些基本定义。所以本文从介绍博弈论的基本假设和基本概念开始,在对基本概念了解的基础上学习博弈论中的经典模型,从中学习博弈过程中的双方博弈思维,然后再选取一些实际中的例子,运用所学的博弈论思维,从博弈双方的角度考虑得出该做出何种决策。 三、研究的步骤及方法 研究步骤 1. 1.10——1.20 明确毕业论文的设计方向,查阅文献资料,完成开题报告。 2. 2.10——2.25 撰写文献综述,翻译外文资料。 3. 2.26——3.05 列出论文正文部分的撰写提纲。 4. 3.06——4.01 撰写论文初稿。 5. 4.02——4.20 根据指导老师的建议进一步修改。 6. 4.21——4.27 论文定稿,装订成册,按时完成其它各项任务,准备答辩。 研究方法

博弈论中的相关概念

新古典经济学前提: 理性选择——减少不确定; ——经济系统效用最大化。 理性——新古典经济学与博弈论的纽带 博弈论决策前提:理性的战略选择。 博弈论决策基础:最优反应,即带来最大收益的战略。 但是,在博弈论中最优反应不是理性的唯一表现,也不总是假定人是理性的。 新古典经济学决策的背景: 理性的个体面临特定的制度环境(产权、货币、高度竞争的市场),在此基础上以获取利益最大化为目的。 隐含的基础:只需考虑自身情况和市场条件,而不考虑他人行为。 弊端: ——限制了理论的使用范围,现实中竞争并不完全; ——无法解决货币经济以外的决策难题。 博弈论的优势: ——不仅考虑自身条件和市场环境,最重要的是还需考虑他人的行为。 游戏规则: 两个选手,轮流取币; 每次至少取一枚硬币; 只能从一行中取任意数量的硬币,不许从两行中选取; 取走最后一枚硬币的为胜者 囚徒困境的启示: 囚徒困境仅仅是二人博弈,多人博弈在现实中更多; 如果囚犯可以交流,结果显著不同; 如果多轮博弈,结果也有不同; 导致困境结论的分析过程令人注目,但最后结论并非理性。 通常假设参与者将采取最优反应战略而理性行事,最大化利润、力争在游戏中获胜、达到主观收益最大化,或者惩罚最小化,皆属于理性行为。 最优反应战略是在其他参与者战略已知或可预测条件下,给某参与者带来最大化收益的战略。 博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。 依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来的最大收益的战略。 标准式——数字矩阵; 扩展式——树形图 不确定事件(contingency): 相机战略(contingent strategy):仅在不确定事件发生时才会采取的战略 信息集(information set):节点2包含了决策者掌握的所有信息,因此也称为信息集。 扩展式的优势: ——展示了每一阶段掌握的信息; ——展示了参与者掌握信息的不完全 所有博弈问题均可用标准式描述,即绘制一个表格,边缘列出参与者的战略,里面列出参与者的收益;

博弈论中的几个经典问题精编版

博弈论中的几个经典问 题 集团企业公司编码:(LL3698-KKI1269-TM2483-LUI12689-ITT289-

几个博弈论中的经典问题博弈论(GameTheory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的 完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博 弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一 局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作 不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关 量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(NashEquilibrium):在一策略组合中,所有的参与者面临 这样一种情况,当其他人不改变策略时,他此时的策略是最好的。 也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B 也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因

博弈论基础及应用

博弈论(对策论、游戏论) 博弈论又名对策论、游戏论,是一门研究互动关系“游戏”的参与者各自选择策略的科学,博弈论把这些复杂关系理论化,以便分析其中的逻辑和规律,并对实际决策提供指导和借鉴。 游戏三要素(博弈的规则、结构): 1、博弈、游戏参加者。 博弈论分析,假定参与者都是机智而理性的。 2、行为和策略空间。 博弈参与者必须知道他自己及其对手伙伴的策略选择范围,并了解各种策略之间的因果关系。 3、有可评价优劣高下的决策行为结果。 博弈论用数字表示这类结果,并称之为支付。 支付矩阵 可以用支付矩阵(得益矩阵、收益矩阵、赢得矩阵)来描述一个博弈结构。 厂商B 厂商A 支配策略: 由于游戏参与者试图实现自身利益最大化并具有理性的决策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具有一个简单而确定的结果。从厂商A角度来说,它采取策略“下”而得到的支付总是好于“上”(2,1分别对1,0)。同样,对于厂商B来说,选择策略“左”得到的利益总是优于“右”(1,2分别对0,1)。因此,我们可以确定预期均衡选择策略是A选择“下”而B选择“左”的策略。 囚徒困境: 下面支付矩阵表示著名的“囚徒困境”游戏,从博弈论角度看,这是一个存在支配均衡的博弈;因为对囚犯A、B来说,无论对方如何选择,“坦白”都是各自的最优选择。 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处(3个月刑期)等竞争性动机阻碍了他们达到更好的互利选择,他们面临“囚徒困境”。我们将看到,寡头垄断厂商经常面临类似的困境。 囚犯B 囚犯A 纳什均衡: 支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支配均衡表示博弈中,厂商A、B在选择做广告问题上存在的策略关系。其中厂商A没有支配策略,因为A的最佳决策取决于B的选择。例如,当B选择做广告时,A应当选择做广告,由此得到10而不是6的支付得益,然而,当B选择不做广告时,A应当选择不做广告,从而得到20而不是15的支付得益。假定两个厂商需要同时决策,A应当如何决策?

博弈论教学大纲

《博弈论》教学大纲 第一部分教学说明 1、课程的性质与任务 《博弈论》是经济学院本科生的限定选修课。 2、课程教学目标 课程教学目标是帮助学生获得必要的决策科学基本知识,了解学科发展前沿,掌握探索系统科学基本规律的一般方法;使学生学会应用博弈论的基本原理和方法分析政治、经济、军事、管理和社会生活等领域的博弈问题。 3、适用专业与学时数 本课程的教学大纲适用于经济学和非经济类的本科专业的本科生。为了让学生基本地掌握发展经济理论,我们计划用38个学时分五部分讲授知识,用4个学时进行经济实践活动,希望在教学与实践中,学生能够加强对发展经济学理论的理解和检验。 4、本课程与其他课程的关系 本课程以微观经济学为基础。 5、推荐教材与参考书 《博弈论与信息经济学》,张维迎著,上海三联书店、上海人民出版社; 《博弈论战略分析入门》,Roger A McCain著,原毅军等译,机械工业出版社; 《博弈论》施锡铨著,上海财经大学出版社,2002; 《Game Theory》,1991,D.Fudenberg& J.Tirole 中译本,中国人民大学出版社; 《经济博弈论》(第二版) 谢识予编著复旦大学出版社, 2002。 6、主要教学方法与媒体要求 本课程以老师课堂讲授为主,以学生课后实践为辅,同时鼓励学生参与经济实践与经济讨论的活动如举行经济散文竞赛和经济辩论等等。为适应科学教育的现代化、国际化和信息化,我们在教学媒体上逐步使用电脑、投影仪、幻灯片等硬件设备,与此相配套的就是使用诸如Powerpoint之类的电子讲稿,此外我们还将通过网络与学生多方面、多层次、多角度的交流,及时了解学生学习的动态和存在的问题。 7、开课与编写大纲单位:经济学教研室;课程负责人:卢燕平;审定单位:经济学院;

博弈论分析

中美军备竞赛的博弈分析 1.理论介绍 1.1博弈论的概念 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 1.2博弈论的主要特点 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。 具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。 1.3博弈的分类 博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。 目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(sub game perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。 博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型等等。 1.4纳什均衡 纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博

1对策论的基本概念

§1 对策论的基本概念 对策模型的三个基本要素: 1.局中人:参与对抗的各方; 2.策略集:局中人选择对付其它局中人的行动方案称为策略;某局中人的所有可能策略全体称为策略集; 3.一局势对策的益损值:局中人各自使用一个对策就形成了一个局势,一个局势决定了各局中人的对策结果(量化)称为该局势对策的益损值。 “齐王赛马”齐王在各局势中的益损值表(单位:千金) §1 对策论的基本概念 其中:齐王的策略集: S1={ α1, α2, α3, α4, α5, α6 }, 田忌的策略集:S2={ β1, β2, β3, β4, β5, β6 }。 下面矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3 §1 对策论的基本概念 二人有限零和对策(又称矩阵对策): 局中人为2;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。

通常将矩阵对策记为: G = {S1, S2, A} S1:甲的策略集;S2:乙的策略集; A:甲的赢得矩阵。 “齐王赛马”是一个矩阵策略。 §2 矩阵对策的最优纯策略 在甲方的赢得矩阵中: A=[a ij]m×n i行代表甲方策略i=1, 2, …, m;j 行代表乙方策略j=1, 2, …, n;a ij 代表甲方取策略i,乙方取策略j,这一局势下甲方的益损值。此时乙方的益损值为 -a ij (零和性质)。 在考虑各方采用的策略时,必须注意一个前提,就是双方都是理智的,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。 §2 矩阵对策的最优纯策略 例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛。比赛共赛三局,规定每局胜者得1分,输者得-1分,可知三赛三胜得3分,三赛二胜得1分,三赛一胜得-1分,三赛三负得-3分。甲队的策略集为S1={α1,α2,α3},乙队的策略集为S2={β1,β2,β3}。根据以往比赛的资料,有甲队的赢得矩阵为A,如下所示, 请问这次比赛各队采用哪种阵容上场最为稳妥? §2 矩阵对策的最优纯策略 矩阵A中每行的最小元素分别为1,-3,-1。 在这些最少赢得中最好的结果是1,故甲队会采取策略α1,无论对手采取何策略,甲队至少得1分。对于乙队,{β1,β2,β3}可能带来的最少赢得,即A中每列的最大元素,分别为3,1,3。乙队会采取β2策略,确保甲队不会超过1分。 α1和β2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略。 这种最优纯策略只有当赢得矩阵A=(a ij)中等式 成立时,双方才有最优纯策略,并把(α1,β2)称为对策G在纯策略下的解,又称(α1,β2)为对策G的鞍点。把其值V称之为对策G={S1,S2,A}的值。 §2 矩阵对策的最优纯策略 例某单位采购员在秋天决定冬季取暖用煤的储量问题,已知在正常的冬季气温条

博弈论知识点总结材料

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则 为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消

费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与 人在何时行动; 3、 序列结构:每个参与人行动时面 临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 5、博弈论分类: {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

西方经济学(博弈论及其应用)历年真题试卷汇编1

西方经济学(博弈论及其应用)历年真题试卷汇编1 (总分:40.00,做题时间:90分钟) 一、单项选择题(总题数:9,分数:18.00) 1.考虑两寡头厂商A和B的如下支付矩阵,二者的(纳什)均衡策略组合为( )。(电子科技大学2010研 (分数:2.00) A.(U,L) B.(D,R) √ C.(U,R) D.(D,L) 解析:解析:在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略,如果其他参与者均不改变各自的最优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于本题,当B选择U时,A会选择R,因为5>3;当B选择D时,A会选择R,因为2>0。当A 选择L时,B会选择U,因为4>3;当A选择R时,B会选择D,因为1>0。因此,依据纳什均衡定义,可知(D,R)是纳什均衡。 2.下列说法错误的是( )。(中山大学2009研) (分数:2.00) A.占优策略均衡一定是纳什均衡 B.纳什均衡不一定是占优策略均衡 C.占优策略均衡中,每个参与者都是在针对其他参与者的某个特定策略而做出最优反应√ D.纳什均衡中,每个参与者都是在针对其他参与者的最优反应策略而做出最优反应 解析:解析:占优策略均衡中,不论其他参与者采取何种策略,每个参与者都会选择其自身的最优策略。 3.甲乙两人各在纸片上写上“上”或“下”,然后双方同时翻开纸片,如果两人的字相同,那么甲赢2块钱,乙输两块钱;如果写的字不同,那么乙赢1块钱,甲输1块钱。下列关于该博弈纳什均衡的描述哪一项是正确的?( )(上海财经大学2009研) (分数:2.00) A.甲以1/2概率选择“上”;乙以1/2概率选择“上”√ B.甲以1/3概率选择“上”;乙以1/3概率选择“上” C.甲以1/3概率选择“上”;乙以1/2概率选择“上” D.甲以1/2概率选择“上”;乙以1/3概率选择“上” 解析:解析:根据题目条件可以得出甲乙两人的收益矩阵,如表5—1 “上”时,乙必然会选择写“下”。同理,当甲选择写“下”时,乙必然会选择写“上”。因此,两个人选择写“上”的概率都为1/2时才能达到均衡。 4.在一条狭窄巷子里,两个年青人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去"或者选择“避让”。如果选择“避让”,不管对方采取什么策略,他得到的收益都是0。如果其中一个人采取“冲过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是一36。这个博弈有两个纯策略纳什均衡和( )。(上海财经大学2008研) (分数:2.00) A.一个混合策略纳什均衡,即两人都以80%概率选择“避让”,以20%的概率选择“冲过去”√ B.两个混合策略纳什均衡,即每个青年人轮流采取避让或者冲过去 C.一个混合策略纳什均衡,即一人以80%的概率选择“避让”,另一人以20%的概率选择“冲过去” D.一个混合策略纳什均衡,即两人都以40%的概率选择“避让”,以60%的概率选择“冲过去” 解析:解析:根据题中条件可写出两人的收益矩阵,如表5—2 有两个纯策略纳什均衡(9,0),(0,9)。设甲选择“冲过去”的概率为r,乙选择“冲过去”的概率为c。

博弈论简明教材

博弈论 第一节博弈问题概述 一、博弈的基本概念 博弈论是近年经济学中发展得很快的一个分支。博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。换句话说,博弈论研究当某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体时的决策问题和均衡问题。 在前面几讲中,除了寡头市场外,消费者的效用或厂商的利润都只依赖于他自己的选择,而与其他人的选择无关。在这里,经济作为一个整体,各个经济主体的选择是相互影响的。但对于单个的消费者或厂商来说,所有其它经济主体的行为都被包括在一个参数里。这个参数就是价格。除此以外,经济主体在决策时,面临的似乎是一个非人格化的东西。经济主体既不需要考虑他人的选择对自己选择的影响,也何必需要考虑自己的选择对他人的影响。而在本讲所介绍的博弈论中,消费者的效用或厂商的利润不仅依赖于自己的选择,而且依赖于具体的某一个或某一些其它经济主体的选择。 在经济学中,博弈论通常是放在寡头市场的分析中,因为在寡头市场上,某一寡头企业在决策时,不得不考虑其他寡头企业的反应。但事实上,博弈行为是广泛存在的。 博弈分析的目的是使用博弈规则决定均衡。 博弈论的基本概念包括:参与人、行动、战略、博弈规则、信息、报偿、均衡。 参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。 行动是指参与人作的决策。 战略是指参与人选择行动的规则,它告诉参与人在什么情况下选择什么行动。 例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。这里,“犯”与“不犯”是两种不同的行动。战略规定了什么时候选择“犯”,什么时候选择“不犯”。 博弈规则是指参与人共同接受的不同情况下的最优战略。信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。 报偿是参与人从博弈中获得的结果,它取决于所有参与人的行动或战略。 把全体参与人可能采取的不同战略及其报偿都列出来,称为报偿矩阵。 均衡是所有参与人的最优战略或行动的组合。 二、博弈的分类 可以从不同的角度对博弈进行分类。 根据博弈者选择的战略,可以将博弈分成合作博弈 (cooperative games) 与非合作博弈 (non-cooperative games). 合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。例如,如果几家寡头通过订立并实行协议,限制产量,制定垄断高价,则称这种博弈为合作博弈。若寡头们在市场竞争中没有达成有约束里的协议,每个企业仅仅是在考虑到

范里安《微观经济学:现代观点》名校考研真题详解-第五章 博弈论及其应用【圣才出品】

第五章博弈论及其应用 第一节博弈论 一、名词解释 1.纳什均衡(华中科技大学2002研;东南大学2003研;厦门大学2006研;中央财经大学2012研) 答:纳什均衡(Nash Equilibrium)又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰·纳什的名字命名。纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略的情况下,他选择了最好的策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而没有人有积极性去打破这个均衡。 2.混合策略(Mixed Strategy)(厦门大学2010研) 答:混合策略(mixed strategy)指参与人使他们的策略选择随机化——即对每项选择都指定一个概率,并按照这些概率选择策略。混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。混合策略是相对于纯策略而言的。并不是所有的博弈都存在纯策略纳什均衡,但是混合策略均衡总是存在的。 3.合作博弈(厦门大学2012研) 答:合作博弈是指各博弈方可以谈定能使它们设计联合策略的有约束力的合同的博弈。

厂商之间进行的经济博弈既可以是合作的也可以是非合作的。如果不可能谈判并执行有约束力的合同,博弈就是非合作的;如果能设计出合同,则是合作的。 合作博弈的一个例子是买方和卖方之间就一块地毯的价格讨价还价。如果地毯生产成本为100美元,而买方对其评价是200美元,因为双方同意以101~199美元之间任一价格成交都将最大化买方的消费者剩余与卖方的利润之和,并使双方都得到好处,因此该博弈可能有合作的解。 合作和非合作博弈之间的基本差别在于签订合同的可能性,在合作博弈中有约束力的合同是可能存在的,而在非合作博弈中它们是不可能的。 二、单项选择题 1.考虑两寡头厂商A 和B 的如下支付矩阵,二者的(纳什)均衡策略组合为( )。 (电子科技大学2010研) A.() U L ,B.() D R ,C.() U R ,D.() D L ,【答案】B 【解析】在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略,如果其他参与者均不改变各自的最优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于本题,当B 选择U 时,A 会选择R,因为5>3;

相关文档
最新文档