平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)
平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡

1 ?假设厂商A与厂商B的平均成本与边际成本都是常数,MC A=10,MC B =8,对厂

商产出的需求函数是

Q D二500 -20 p

(1)如果厂商进行Bertrand竞争,在纳什均衡下的市场价格是多少?

(2)每个厂商的利润分别为多少?

(3)这个均衡是帕累托有效吗?

解:(1)如果厂商进行Bertrand竞争,纳什均衡下的市场价格是p B =10 一;,p A =10 , 其中;是一个极小的正数。理由如下:

假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,p A和p B都不会严格大于10。否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高

自己的利润。所以均衡价格一定满足p A空10 , p B?「0。但是由于p A的下限也是10,所以均衡时P A =10。给定P A =10 ,厂商B的最优选择是令P B =10- ;,这里:是一个介于0到2 之间的正数,这时厂商B可以获得整个市场的消费者。综上可知,均衡时的价格为P A =10 , P B =10 -;。

(2)由于厂商A的价格严格高于厂商B的价格,所以厂商A的销售量为零,从而利润也是零。下面来确定厂商B的销售量,此时厂商B是市场上的垄断者,它的利润最大化问题为:

max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中,得到:

max (10 —芯―)500 —20(10 —名卩

解得;=0,由于;必须严格大于零,这就意味着;可以取一个任意小的正数,所以厂商

B 的利润为:||500-20 10 -; 10-;。

(3)这个结果不是帕累托有效的。因为厂商B的产品的价格高于它的边际成本,所以

如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一;之间的价格,那么厂商B的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A的剩余(因为A的利润

还是零)。

2.(单项选择)在下面的支付矩阵(表10-1 )中,第一个数表示A的支付水平,第二个数表示B 的支付水平,a、b、c、d是正的常数。如果A选择“下”而B选择“右”,那么:

(1) b .1 且d :::1

(2)c:::1 且b :::1

(3) b :::1 且 c ::: d

(4) b ::: c 且 d :::1

(5) a :::1 且b ::: d

【答案】(3)

【分析】由于(下,右)是均衡策略,所以给定B选择“右”,“下”是A的最优选择,这就意味着c ::: d ;同样的,给定A选择“下”,“右”也是B的最优选择,这就意味着 b :::1。

3?史密斯与约翰玩数字匹配游戏。每一个人选择1、2或者3。如果数字相同,约翰支

付给斯密3美元。如果数字不同,斯密支付给约翰1美元。

(1)描述这个对策的报酬矩阵,并且证明没有纯策略纳什均衡策略组。

(2)如果每一个局中人以1的概率选择每一个数字,证明这个对策的混合策略确实有

3

一纳什均衡。这个对策的值是什么?

解:(1 )根据题意,构造如下的支付矩阵(表10-2 )(其中每一栏中前一个数字是史密斯的支付,后一个数字是约翰的支付) :

表10-2 玩数字匹配游戏的支付矩阵

首先由史密斯来选择,假设史密斯选择1,并期望约翰选择1,从而使自己得到3的支

付。但是,如果史密斯选择1,则约翰一定会选择2或者3,从而使自己得到1,而不是-3。

假设约翰选择2,他期望史密斯选择1或者3,以使得自己得到1 ,而实际上史密斯会选择2, 使得约翰得到-3 ,等等。不断的循环反复,最终也无法达成一个使得双方都能够接受的方案。因此,这个对策没有一个纯策略纳什均衡。

(2)假设均衡时,约翰选择1、2、3的概率分别为为、X2和1 -为-x2,那么此时史密斯在选择1、2、3之间是没有区别的,即:

3X1 - X2 - 1 - X1 - X2 = —X1 '3冷-1 - X1 - X2 = —X1 - X2 3 _ x-i - X2 i 从而解得

1

人=x2 =1 -为-X2

3

类似的方法可以解得史密斯在均衡状态下选择1、2、3的概率分别为1/3。

4.假定世界上氟的整个供给由20个人控制,每一个人拥有这种强有力的矿物10000克。世界对氟的需求是

Q =1000 T000p

其中p是每克的价格。

(1)如果所有拥有者合谋控制氟的价格,他们设置的价格是多少?他们能够卖出的量

是多少?

(2) 为什么(1)中计算的价格是不稳定的?

(3) 通过改变要求保持市场价格的产出,在没有厂商能够获利的意义下存在一个稳定 的均衡时,氟的价格是多少?

解:(1 )所有拥有者合谋控制氟的价格,此时总的利润函数为:

-1 —Q Q

V 1000 丿

利润最大化的一阶条件为:

兰亠丄Q=0

dQ 500

解得总供应量为Q =500 (克)。此时p=1

?Q =0.5 ,每个厂商的供应量为

1000

500/20 =25 (克)。

(2) 对第一个厂商而言,给定其他每个厂商的供应量为 25克,那么他的利润最大化问 题为:

525 T max q q

1000

根据一阶条件解得:

q =262.5

可见在其他厂商的供应量为 25克的条件下,厂商 1增加供应量会提高自己的利润。类 似的结论对市场上的其他厂商也成立,所以合谋是不稳定的。

(3) 题目要求完全竞争市场的均衡结果。令 p 二MC ,得到氟的价格为零。市场上的总 供给量为1000克,每个成员的出售量为 50克。

5?在下表所示的策略型博弈(表

10-3 )中,找出占优均衡。

答:对于行为人2而言,R 优于M ,所以行为人2将会剔除掉M 策略,只在R 、L 这 两个策略中进行选择; 对于行为人1来说,知道了行为人2会在L 、R 策略中选择,则U 占 优于M 和D 策略。当行为人2知道行为人1选择了 U 策略时,他则最终会选择 L 策略。所 以,最终的占优均衡为(U , L )。

6 ?模型化下述划拳博弈:两个老朋友在一起划拳喝酒,每个人有四个纯策略:杆子、 老虎,鸡和虫子。输赢规则是:杆子降考虎,老虎降鸡,鸡降虫子,虫子降杆子。两个人 同时出令。如果一个打败另一个,赢者的效用为

1,输者的效用为-1 ;否则,效用均为0。

写出这个博弈的收益矩阵。这个博弈有纯策略纳什均衡吗?计算出混合策略纳什均衡。

答:(1 )该题的支付矩阵(表 10-4 )为:

表10-4 划拳博弈的支付矩阵

对两个参与者,给定对方策略时,本方的占优策略对应的支付以下划线标注,均衡存在当且仅当在同一栏中出现两个下划线。由此可知,该博弈没有纯策略纳什均衡。

(3)记游戏者1分别选择各个策略的概率为P i, p2, p3, p/?,游戏者2分别选择各个策

当游戏者2分别以概率bqq,? [选择四个策略时,游戏者1的四个策略的收益应该相等(根据同等支付原则):

1 业亠I 1 4 = -1 q 1 q3 = -1 q

2 1 q4 =1 q i 亠[1 q3

又因为q1 *q2 +q3 *q4 二1,可以得到:q =q2 =q3 =q4 =—。

4

同理,当对于游戏者1分别以概率fp1,P2,P3, P4 [选择四个策略时,游戏者2的四个策略的收益应该相等(根据同等支付原则):

1XP2 +(二尸P4 =(—1 F P1 +仆P3 =(—1〃P2 +仔卩4=1汇P1 +(—1『P3 又因为P1 ■P2 ■ P3 ' P4 ",可以得到:P1 二P2 二P3 二P4 = 1。

4

因此混合策略纳什均衡为:(q,ff2),其中

疔_『 1 1 1 1 )疔一『1 1 1 1〕

-■ 1 ,,,, 2 *

4 4 4 4 4 4 4 4

7.巧克力市场上有两个厂商,各自都可以选择去市场的咼端(咼质量),还是去低端(低质量)。相应的利润由如下收益矩阵(表10-5 )给出:

(2)如果各企业的经营者都是保守的,并都采用最大最小化策略,结果如何?

(3)合作的结果是什么?

(4)哪个厂商从合作的结果中得好处最多?哪个厂商要说服另一个厂商需要给另一个厂商多少好处?

解:(1)纳什均衡的结果是(高,低)和(低,高),相应的收益分别为(100,800)

和(900,600)。

(2)如果1选择低,则有min [20,900? - _20 ;如果1选择高,则有min [100,50“.; =50。

因此如果1想要最大化它的最小支付,其最优决策为:

max [mi n\_20,900?,min [100,50》=max 1-20,50] =50

所以1会选择高。类似的分析表明2也会选择高,因此两个人都采用最大最小策略的均衡结果为(高,高),相应的支付为(50,50)。

(3)如果双方进行合作,那么他们的目标就是总利润最大化,这样最终的结果就是(低,高),相应的支付为(900,600 )。

(4)厂商1从合作的结果中获得的好处多。为了使得厂商2不选择另外一个纳什均衡(高,低),厂商1应当给厂商2 一笔800—600=200的支付。

&考虑在c,f,g,三个主要汽车生产商之间的博弈。每一个厂商可以生产要么大型车,要么小型车,但不可同时生产两种型号的车。即,对于每一个厂商i , i=c, f,g,

他的行动集合为Al =[S M,L G >用:?i代表i所选择的行动,「A1,二1「c,J 代表厂商i的利润。假设,每个厂商的利润函数定义如下:

* 三?,如果a j=LG,j =c , f,g ;

,如果:j=SM,j =c , f,g ;

a,如果& =LG,且a j=SM ,j H i ;

:-,如果=SM,且「=LG,j -i ;

1 ,如果=:-j=LG,且:-k=SM,j =k=i ;

3,如果=:■j=SM,且:?k=LG , j =k=i ;

(1)当:> 0时,是否存在纳什均衡?请证明。

(2)当:? ?■ - 0时,是否存在纳什均衡?请证明。

证明:该博弈的支付矩阵如表10-6和10-7所示。

表10-6 G汽车厂生产SM型汽车

(1)该博弈存在纳什均衡。首先考虑三家选择的行动相同,那么任一个厂家都将得到数量为的利润。因为爲=?叮#,所以任何厂商只要选择和其他两个工厂生产不同型号的产品,就可以获得更

高的利润,所以三家工厂生产相同的产品不是纳什均衡。如果三个工厂生产不同的产品,比如说:.c, ]=[SM,LG,SM,因为:£>『■>',所以C厂已经获得了它

可能获得的最高利润,因此它不会背叛;给定其他厂商的选择,F厂生产LG型号的汽车只

能获得数量为1的利润,高于它生产SM型号的汽车获得的数量为的利润,所以F厂也不

会背叛;给定其他厂商的选择,G厂在生产两种型号的汽车之间是没有差异的,因为无论那

种情况下,他都只能获得数量为1的利润,所以G厂同样不会背叛。

综上可知:二:」,:丿]:[SM,LG,SM是一个纳什均衡。类似的分析表明,只要三个工厂

生产不同的产品,就是纳什均衡。

(2)只要三个工厂生产的汽车型号不完全相同,这样的结果就是纳什均衡。分析类似于第(1)问。

9.考虑下列策略型博弈(表10-8 ):

表10-8 博弈的支付矩阵

请问,该博弈里有几个均衡?为什么?答:(1)该博弈的纯策略均衡为( D , R )。

(2)下面分析混合策略均衡。设参与人A分别选择策略U、M和D的概率为Cp,p2,P3?;设参与人B分别选择策略L、M和R的概率为:q,q2,q3?;下面分三种情况讨论:

①达到混合均衡时,如果参与人A分别选择策略U、M和D的概率都严格大于零,那

么他选择策略U、M和D的期望收益就要相等,即:q -2q2 - -2q - q^q3

从而解得q =73,矛盾,所以对参与人B而言,不存在使得q , q? , 口3同时大于

零的混合均衡;对参与人A也有类似的结论成立。

②尽管如此,以上的分析并不能说明不存在混合均衡。因为达到均衡时,有可能存在参

与人选择某一行动的概率为零的可能。对A而言,在U、M、D三个行动中选择某一行动

的概率等于零的情况共有三种可能。对B也是一样,这样均衡时共有九种可能的情况,下面分别讨论:

a. A选择行动D的概率为零,B选择行动R的概率为零,即p3二q3=0,从而得到如表10-9所示的支付矩阵:

A M U q _2q 2 - -25 ? q 2

q i 以2 ;又因为q 3 =0,所以q 72

。从而解得q =q 2 =0.5 ;同理可得P 1 =P 2 =0.5。所

以◎ =0.5口2 =0.5,% =0”'和:p =0.5, p =0.5, p =0』就是一个混合均衡。

B 选择行动M 的概率为零,采用类似于①的做法可知, B 选择行动L 的概率为零,采用类似于①的做法可知, B 选择行动R 的概率为零,采用类似于①的做法可知, B 选择行动M 的概率为零,采用类似于①的做法可知, B 选择行动L 的概率为零,采用类似于①的做法可知, B 选择行动R 的概率为零,采用类似于①的做法可知, B 选择行动M 的概率为零,采用类似于①的做法可知, B 选择行动L 的概率为零,采用类似于①的做法可知,

综合上述分析可知,唯一的混合均衡就是: ;d 」O5,0.5,0?,二B 」05,0.5,0?。

③ 均衡时,如果A 选择某两个行动的概率都等于零,

即A 只能选择一个行动。 这就要求

在B 的行动中,至少有一对行动可以给自己带来相同的支付,

但是由支付矩阵可知, 这一条

件并不满足,这样均衡时, B 也只能选择一个行动,这就退化成了纯策略均衡。所以 A 选择

某两个行动的概率都等于零的混合均衡是不存在的; 同理B 选择某两个行动的概率都等于零

的混合均衡也是不存在的。

综合上述分析可知,该博弈只有唯一的混和均衡,即:

? =0.5,q 2 =0.5,q 3 =0/和 g = 0.5,p 2 =0.5, p 3 = 0』

b. A 选择行动D 的概率为零, 在这种情况下,不存在混合均衡。

c. A 选择行动D 的概率为零, 在这种情况下,不存在混合均衡。

d. A 选择行动M 的概率为零, 在这种情况下,不存在混合均衡。

e. A 选择行动M 的概率为零, 在这种情况下,不存在混合均衡。

f . A 选择行动M 的概率为零, 在这种情况下,不存在混合均衡。

g. A 选择行动U 的概率为零, 在这种情况下,不存在混合均衡。

h. A 选择行动U 的概率为零, 在这种情况下,不存在混合均衡。

i . A 选择行动U 的概率为零, 在这种情况下,不存在混合均衡。

博弈论与纳什均衡

《博弈论与纳什均衡理论》 姓名张贺祺 学号 2010010404 专业政治经济学 指导老师张秉云

摘要 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 关键字:博弈论;纳什均衡;合作博弈;非合作博弈

目录 摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) (一)博弈论的主要思想 (4) (二)博弈论的分类 (5) 三、经典案例 (7) (一)博弈论的经典案例 (7) (二)纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) (一)博弈论的重要影响 (8) (二)纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论 一、引言 近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 博弈论(Game Theory):亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 纳什均衡:(Nash equilibrium)又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。假设有n人局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 二、博弈论与纳什均衡的主要内容 (一)博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P:为局中人,博弈的参与者,也称为博弈方,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。决策人:在博弈中率先做出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者:在博弈二人对局中行动滞后的那个人,与决策人要做出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,因此对

平新乔《微观经济学十八讲》课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第 10 讲策略性博弈与纳什均衡 跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。 以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。 1.假设厂商 A与厂商 B的平均成本与边际成本都是常数, MC A 10, MC B 8,对厂商产出的需求函数是 Q D 500 20p ( 1)如果厂商进行 Bertrand 竞争,在纳什均衡下的市场价格是多少? ( 2)每个厂商的利润分别为多少? ( 3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行 Bertrand 竞争,纳什均衡下的市场价格是 p B 10 , p A 10 ,其中是一个极小的正数。理由如下: 假设均衡时厂商 A 和 B 对产品的定价分别为 p A 和 p B ,那么必有 p A 10 , p B 8 ,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,p A和 p B 都不会严格大于 10。否 则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足p A 10, p B 10。但是由于 p A 的下限也是10,所以 均衡时 p A 10。给定 p A 10,厂商 B的最优选择是令 p B 10 ,这里是一个介于 0到2 之间的正数,这时厂商 B可以获得整个市场的消费者。综上可知,均衡时的价格为p A 10 , p B 10 。 ( 2)由于厂商 A 的价格严格高于厂商 B 的价格,所以厂商 A 的销售量为零,从而利润也是零。下面来确定厂商 B 的销售量,此时厂商 B是市场上的垄断者,它的利润最大化问题为: max pq cq ① 其中 p 10 ,q 500 20 10 ,把这两个式子代入①式中,得 到: max 10 0 8 500 20 10 解得0 ,由于必须严格大于零,这就意味着可以取一个任意小的正 数, 所以厂商 B的利润 为: 500 20 10 10 。 (3)这个结果不是帕累托有效的。因为厂商 B 的产品的价格高于它的边际成本,所以 如果厂商 B和消费者可以为额外 1 单位的产品协商一个介于 8 到10 之间的价格,那么厂商 B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商 A的剩余(因为A 的利润还是零)。

博弈论和纳什均衡

博弈论和纳什均衡文件管理序列号:[K8UY-K9IO69-O6M243-OL889-F88688]

关于博弈论和纳什均衡你应该知道这些 腾讯财经[]2015-05-25 10:05 我要分享 [摘要]纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。 腾讯财经综合报道(风生)奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。事发当时,这辆出租车失控撞向栏杆,两人均被抛出车外。 约翰-纳什因发表两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即着名的纳什均衡。 不均衡人生中孕育出均衡论 纳什于1928年在美国西弗吉尼亚州出生,曾在麻省理工学院任教,晚年为普林斯顿大学担任数学系教授,死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名,1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。

纳什在数学领域上取得多项突破,但他同时深受精神分裂症困扰,其生平故事在2001年被改编成电影《美丽心灵》,赢得包括最佳电影在内的4项奥斯卡奖项。 尽管西维亚-纳萨斯(Sylvia Nasars)广为人知的小说《美丽心灵》(A Beautiful Mind)和改编自该书的、由拉塞尔-克罗(Russell Crowe)主演的同名奥斯卡电影探究了纳什错综复杂的生平,但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界,人们普遍认为,与牛顿和爱因斯坦的数学理论相比,纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题,而纳什的数学却可以应用在生物学和社会学领域。 如若不是精神疾病的困扰,纳什今天可能已与那些科学伟人齐名。尽管如此,他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就,他与约翰海萨尼(John Harsanyi)和莱茵哈德-泽尔腾(Reinhard Selten)一起获得了1994年诺贝尔经济学奖。 什么是博弈论与纳什均衡 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争

博弈论和纳什均衡

博弈论和纳什均衡

关于博弈论和纳什均衡你应该知道这些 美股腾讯财经[微博]2015-05-25 10:05 我要分享 139 [摘要]纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。 腾讯财经综合报道(风生)奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。事发当时,这辆出租车失控撞向栏杆,两人均被抛出车外。 约翰-纳什因发表两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。 不均衡人生中孕育出均衡论 纳什于1928年在美国西弗吉尼亚州出生,曾在麻省理工学院任教,晚年为普林斯顿大学担任数学系教授,死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名,1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。 纳什在数学领域上取得多项突破,但他同时深受精神分裂症困扰,其生平故事在2001年被改编成电影《美丽心灵》,赢得包括最佳电影在内的4项奥斯卡奖项。 尽管西维亚-纳萨斯(Sylvia Nasars)广为人知的小说《美丽心灵》(A Beautiful Mind)和改编自该书的、由拉塞尔-克罗(Russell Crowe)主演的

同名奥斯卡电影探究了纳什错综复杂的生平,但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界,人们普遍认为,与牛顿和爱因斯坦的数学理论相比,纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题,而纳什的数学却可以应用在生物学和社会学领域。 如若不是精神疾病的困扰,纳什今天可能已与那些科学伟人齐名。尽管如此,他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就,他与约翰海萨尼(John Harsanyi)和莱茵哈德-泽尔腾(Reinhard Selten)一起获得了1994年诺贝尔经济学奖。 什么是博弈论与纳什均衡 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 纳什均衡:又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰-纳什命名。假设有n人局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 近代对于博弈论的研究,开始于策墨咯,波雷尔及冯-诺伊曼。1928年,冯-诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯-诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰-福布斯-纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均

第二卷智猪博弈案例

第二卷智猪博弈案例 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 1 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1 ?假设厂商A与厂商B的平均成本与边际成本都是常数,MC A=10, MC B =8,对厂 商产出的需求函数是 Q D二500 -20 p (1)如果厂商进行Bertrand竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand竞争,纳什均衡下的市场价格是p B =10 一;,p A =10 , 其中;是一个极小的正数。理由如下: 假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,p A和p B都不会严格大于10。否 则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高 自己的利润。所以均衡价格一定满足p A空10 , p B?「0。但是由于p A的下限也是10,所以均衡时P A =10。给定P A =10 ,厂商B的最优选择是令 P B =10- ;,这里:是一个介于0到2 之间的正数,这时厂商B可以获得整个市场的消费者。综上可知,均衡时的价格为P A =10 , P B =10 -;。 (2)由于厂商A的价格严格高于厂商B的价格,所以厂商A的销售量为零,从而利润也是零。下面来确定厂商B的销售量,此时厂商B是市场上的垄断者,它的利润最大化问题为: max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中,得到: max (10 —芯―)500 —20(10 —名卩 解得;=0,由于;必须严格大于零,这就意味着;可以取一个任意小的正数,所以厂商 B 的利润为:||500-20 10 -; 10-;。 (3)这个结果不是帕累托有效的。因为厂商B的产品的价格高于它的边际成本,所以 如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一;之间的价格,那么厂商B的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A的剩余(因为A的利润 还是零)。 2.(单项选择)在下面的支付矩阵(表10-1 )中,第一个数表示A的支付水平,第二个数表示B的支付水平,a、b、c、d是正的常数。如果A选择“下”而B选择“右”,那么: (1) b .1 且 d :::1

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较 【摘要】均衡概念是构成整个博弈论的基石,对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。本文首先将博弈划分为不同的类型,并对主要的均衡概念进行了数学描述,最后对不同的均衡概念进行了比较。 【关键词】博弈论;纳什均衡;重复博弈 博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。因此,本文将主要的博弈均衡概念进行分类和表述,并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。 一、博弈的主要类型 博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。依据不同的分类标准,博弈可以被划分为不同的类型。 1、静态博弈、动态博弈和重复博弈 博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。 2、完全信息和不完全信息博弈 完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。 3、完美信息和不完美信息博弈 在动态博弈中,一参与人完全了解在自己行为之前的博弈进程,则称此参与人为有完美信息的参与人,如果博弈中所有的参与人都具有完美信息,则称此动态博弈为完美信息的动态博弈。反之,如果在存在具有不完美信息的参与人(参

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡 在纳什均衡中,你不一定满意其他的策略,但你的策略是回馈对手招数的最佳策略。 从囚徒困境中我们会发现,作为博弈各方的行动就是针对对方行动而确定的最佳对策,而一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学把这么一个结果称为均衡。这个概念是有普林斯顿大学数学家约翰·纳什提出的,因此被称为纳什均衡。 诺贝尔经济学奖获得者萨缪尔森有句名言,你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词,供给与需求。博弈论专家坎多瑞引申说:“要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡”。 1950年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。 纳什的贡献是,他证明了在这一类的竞争中,在很广泛的条件下是有稳定解存在的,只要是别人的行为确定下来,竞争者就可以有最佳的策略。 那么,什么纳什均衡呢?简单说,就是一策略组合中,所有的参与者面临这样的一种情况:给定你的策略,我的策略是我最好的策略。给定我的策略,你的策略也是你最好的策略,即双方在对方给定的策略下不愿意调整自己的策略。 纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具,所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展,甚至说是一场革命。 纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战,按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果,

从纳什均衡引出一个悖论:从利己的目的触发,结果损人不利己。“囚徒困境”就是如此,从这个意义说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。 纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。 在囚徒困境中存在唯一的纳什均衡点,即两个囚犯均选择“招认”,这是唯一稳定的结果。 有些博弈的纳什均衡点不止一个,如下述夫妻博弈中有两个纳什均衡点。 丈夫和妻子商量晚上的活动,丈夫喜欢看拳击,而妻子喜欢欣赏歌剧,但两个人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点:要么一同去看歌剧,要么一同去看拳击。在有两个或两个以上纳什均衡点的博弈中,其最后的结果难以预测。在夫妻博弈中,我们无法知道,最后结果是一同欣赏歌剧还是一同看拳击。 是不是所有的博弈均存在纳什均衡点呢?不一定存在纯策略纳什均衡点,但至少存在一个混合策略均衡点。 这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略,所谓混合策略是指参与者采取的不是唯一的策略,而是其策略空间上的概率分布。 我们下面将在警察与小偷的博弈中给出混合策略的说明。 在西部片里,我们常能看到这样的故事:某个小镇上只有一名警察,他要负责整个镇的治安,现在我们假定,小镇的一头有一家酒馆,另一头有一家银行,再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察一次只能在一个地方

博弈论与纳什平衡

博弈论与纳什平衡 博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。 纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。 所有的博弈问题都会遇到三个要素。在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略(strategies)是承认了杀人事实,最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人,另外一个抵赖,不承认杀人,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。 类似的:我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。 在互联网这个原始丛林中:最优策略是如何产生的呢? 一、博弈中最优策略的产生 艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。 社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。 显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。 对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选C,他选D得5

博弈论与纳什均衡

第22卷哈尔滨师范大学自然科学学报 Vol .22,No .42006 第4期 NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY 博弈论与纳什均衡 郭 鹏 (中国矿业大学) 杨晓琴 (鸡西大学) 【摘要】 纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础. 关键词:博弈论;纳什均衡;非合作博弈 收稿日期:2006-02-15 0 引言 博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具. 简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是 效用(U tility ),是可以定义或量化的参与人的利 益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈. 1 博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失. 博弈论模型可以用五个方面来描述:G ={P,A,S,I,U ) P:为局中人,博弈的参与者,也称为“博弈 方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标. A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

智猪博弈

在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待,一份也得不到;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 启示 在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。 如果再加上一些更为实际的条件,假设大猪小猪分别具有M、m饲料相当的能量,在等待一个单位时间内,两猪会同时消耗1份饲料相当的能量,且当消耗的能量大于一定比例后会虚弱。此时大猪完全可以等待。这样符合一些情况下的市场竞争原则。当然如果要考虑其他更复杂的因素,比如说大猪小猪单位时间消耗的能量不同,这又得考虑最佳能量比。所以智猪博弈只能在一些特殊环境下应用。 带给企业的启示

3-混合策略的纳什均衡

博弈论教学/混合策略的纳什均衡 出自MyKnowledgeBase < 博弈论教学 Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡 目录 ■1 复习 ■2 混合策略(Mixed strategy) ■2.1 举例/Example ■2.2 概念 ■2.3 纯策略和混合策略 ■2.4 混合策略的争议 ■3 混合策略的纳什均衡 ■3.1 基本概念 ■3.2 混合策略纳什均衡的存在性/纳什定理 ■3.3 学术争议与批评 ■4 混合策略纳什均衡举例 ■4.1 社会福利博弈Social Welfare Game ■4.1.1 博弈分析(方法1:收益无差异) ■4.1.2 博弈分析(方法2:图形分析法) ■4.1.3 博弈分析(方法3:导数(Derivative)极值法) ■4.2 普通例子 ■4.3 审计博弈(Tax Game) ■4.4 激励的悖论[5] ■4.5 求解纳什均衡的一般方法 ■5 多重纳什均衡 ■5.1 多重纳什均衡举例 ■5.1.1 夫妻之争 ■5.1.2 制式问题 ■5.1.3 市场机会博弈 ■5.2 多重纳什均衡分析 ■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.1 帕累托最优Pareto optimality ■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.3 举例分析 ■5.2.2 风险上策均衡(Risk-dominant Equilibrium) ■5.2.3 聚点均衡(Focal Points Equilibrium) ■5.2.4 相关均衡 ■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义 ■7 作业 ■8 参考文献

智猪博弈论与纳什均衡

智猪博弈理论 介绍 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:

从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。 在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。 博弈与制度由智猪博弈故事得到的启示 在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。

论博弈论与纳什均衡的影响及局限

论博弈论与纳什均衡的影响及局限 摘要:纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。同时,纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础。 关键词:纳什均衡、博弈论、影响、局限 引言:Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。以两家公司的价格大战为例,Nash 平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。纳什均衡理论正如克瑞普斯①书中所说,?在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。? 博弈论是研究决策主体的行为发生直接相互作用时候的决

以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 一.博弈论的影响 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。 博弈论所研究的是理性的决策者之间冲突及合作的理论,可以为实际决策提供理论基础和方向指导。其最终追求结果是使博弈方达到利益最大化的均衡。 博弈论不仅仅存在于数学的运筹学中,也正在经济学中占据越来越重要的地位,但如果你认为博弈论的应用领域仅限于此的话,那你就大错了。实际上,博弈论甚至在我们的工作和生活中无处不在!在工作中,你在和上司博弈,也在和下属博弈,你也同样会跟其他相关部门人员博弈;而要开展业务,你更是在和你的客户以及竞争对手博弈。在生活中,博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:要想在现代社会

博弈论复习题及答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

智猪博弈理论

智猪博弈理论 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 目录 介绍 博弈与制度 由智猪博弈故事得到的启示 编辑本段介绍 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 小猪 行动等待 大猪行动5,14,4 等待9,-10,0  从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。

在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。 编辑本段博弈与制度 由智猪博弈故事得到的启示 在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。 对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。 还有一个经典案例,是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只是运送犯人的费用要等到犯人送到澳洲后才由政府支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 关于这一问题,现任招商局掌门人秦晓先生在最近做客央视《对话》节目时,也谈了他的一些看法。他认为:企业领导人应该去制定游戏规则,而不应该单纯地去做裁判。他觉得制度应当比个人的权威

相关文档
最新文档