平新乔课后习题详解(第11讲--广延型博弈与反向归纳策略)

平新乔课后习题详解(第11讲--广延型博弈与反向归纳策略)
平新乔课后习题详解(第11讲--广延型博弈与反向归纳策略)

平新乔《微观经济学十八讲》第11讲广延型博弈与反向归纳策略

1.考虑图11-1所示的房地产开发博弈的广延型表述:

(1)写出这个博弈的策略式表述。

(2)求出纯策略纳什均衡。

(3)求出子博弈完美纳什均衡。

图11-1 房地产开发商之间的博弈

解:(1)开发商A的策略为:①开发,②不开发。

开发商B的策略为:

①无论A怎样选择,B都会选择开发;用(开发,开发)表示。

②当A选择开发时,B选择开发;当A选择不开发时,B选择不开发;用(开发,不开发)表示。

③当A选择开发时,B选择不开发;当A选择不开发时,B选择开发;用(不开发,开发)表示。

④无论A怎样选择,B都会选择不开发;用(不开发,不开发)表示。

房地产开发博弈的策略式表述如表11-1所示:

表11-1 房地产开发商之间的博弈

(2)对于任意的参与人,给定对手的策略,在他的最优策略对应的支付下面画一条横线。对均衡的策略组合而言,相应的数字栏中有两条下划线,所以本题共有三个纯策略纳什均衡(如表11-1所示),它们分别为:

①{不开发,(开发,开发)};②{开发,(不开发,开发)};③{开发,(不开发,不开发)}。

(3)利用反向归纳法可知,子博弈完美的纳什均衡为{开发,(不开发,开发)}。

2.你是一个相同产品的双寡头厂商之一,你和你的竞争者生产的边际成本都是零。而市场的需求函数是:

=-

p Q

30

(1)假设你们只有一次博弈,而且必须同时宣布产量,你会选择生产多少?你期望的利润为多少?为什么?

(2)若你必须先宣布你的产量,你会生产多少?你认为你的竞争者会生产多少?你预

计你的利润是多少?先宣布是一种优势还是劣势?为了得到先宣布或后宣布的选择权,你愿意付出多少?

(3)现在假设你正和同一个对手进行十次系列博弈中的第一次,每次都同时宣布产量。你想要十次利润的总和(不考虑贴现)最大化,在第一次你将生产多少?你期望第十次生产多少?第九次呢?为什么?

解:(1)由于只有一次博弈,所以这里的产量为古诺解。由已知可得厂商1的利润函数为:

()()21111121213030pQ C Q Q Q Q Q Q π=-=--=-+- 利润最大化的一阶条件为1121

2300Q Q Q π?=-+-=?,可得厂商1的反应函数为: 12150.5Q Q =- ①

同理得到厂商2的反应函数为:

21150.5Q Q =- ②

联立①、②两式,解得110Q =,210Q =。

从而市场价格和厂商各自的利润为:10p =;1100π=,2100π=。

(2)这是一个斯塔克博格模型。在这个模型中,市场的领导者会根据竞争对手的反应函数(由第﹙1﹚问可知)来确定自己的最优产量,此时厂商1的利润函数为:

211111130300.5152Q Q Q Q Q π-??=--=-+ ???

利润最大化的一阶条件为:111

150Q Q π?=-=?,解得115Q =。 从而可得:27.5Q =;7.5p =;1112.5π=;256.25π=。

由以上的计算可知,先宣布产量是一种优势,为了得到先宣布产量的选择权,领导者愿意付出的代价应不大于两种情况下的利润差,即112.510012.5-=。

(3)当两企业进行有限次的博弈时,按照古诺模型确定的产量是各自的最优选择,所以在每次博弈中,两个企业的产量都为10。这是因为两企业为了实现利润最大的最优选择原本应是按照联合定价的卡特尔模型行事,但在第十次生产时,双方都知道这是最后一次博弈,为实现自身的利润最大,都会选择背叛,即实行先宣布产量的战略,从而使得市场的最后均衡为古诺均衡,而第九次博弈时,既然双方都知道在第十次博弈时,对方一定会背叛自己,那就没有理由在第九次博弈中合作,而市场的最终结果还是古诺均衡。依次类推,可知古诺产量是每一次博弈的均衡解。

3.考虑下列三个广延型博弈(如图11-2),哪一个博弈有多重反向归纳策略?

图11-2 广延型博弈的树形图

答:(1)有多重反向归纳策略。分析如下:这个动态博弈的子博弈完美的纳什均衡为:

①(){},,L L L "';②(){},,R R R "';③(){},,L R R "'(相应的均衡路径如图11-3中①L ;②

R R R -'-";③L 所示)

图11-3 博弈的均衡路径

(2)只有单重的反向归纳策略。分析如下:当1选择L 后,2有两种选择:(L ',R '),对应的支付为()(){}0,4,5,1。此时2肯定会选择L '使自己得到数量为4的支付,从而1只能得到数量为零的支付。这对于1来说是不合意的,不如选择T 得到的支付多。同理,如果1选择R ,2也有两种选择:(L ',R '),对应的支付为()(){}1,2,3,1。2肯定会选择L ',使得自己得到数量为2的支付,此时1只能得到数量为1的支付,这还是比1选择T 的支付少。所以均衡的结果为1选择T ,然后博弈就此结束。如图11-4所示:

图11-4 利用反向归纳法得到均衡的结果

(3)有多重的反向归纳策略。分析如下:如果2选择L ,那么1肯定会选择L ',因为这样可以使他比选择R '获得更多的支付,此时2得到数量为1的支付;同样的原因,当2选择R 时,1肯定会选择R ',这样,2得到的支付仍然为1;可见2选择L 和R 对他是没有区别的,并且得到的支付都比他选择T 所得到的支付(2选择T 只能得到数量为0的支付)多,所以均衡的结果是2选择L 或R 。如图11-5所示。

图11-5 利用反向归纳法得到均衡的结果

4.请将图11-6所示的广延型博弈转化为策略型博弈,并求纳什均衡。

图11-6 广延型博弈

解:策略型博弈的支付矩阵如表11-2所示。

表11-2 策略型博弈的支付矩阵

(1)纯策略纳什均衡为:(L ,l )和(R ,r )。

(2)混合策略就是一个概率分布,表明参与人实行每个纯策略的概率。比如在本题中,设参与人1实行L 和R 的概率分别为p 和1p -,那么此人的混合策略就是()1,1p p σ-,类似的参与人2的混合策略就是()2,1q q σ-。下面求解混合策略均衡,设游戏者1、2选L 、l 的概率分别为p 、q ,则均衡时,游戏者1选择L 和R 可以获得相同的期望收益,即:

()31q q =- 解得34q =。同理可得14p =。所以()12,σσ为此博弈的混合策略纳什均衡,其中11344σ??= ???,,23144σ??

= ???

,。

5.两家电视台竞争周末黄金时段晚8点到10点的收视率,可选择把较好的节目放在前面还是后面。它们决策的不同组合导致收视率如表11-3所示(每个数字栏中,前一个数字表示电视台2的收益,后一个数字表示电视台1的收益)。

表11-3 电视台竞争收视率的博弈

(1)如果两家是同时决策,有纳什均衡吗?

(2)如果双方采用规避风险的策略,均衡的结果是什么?

(3)如果电视台1先选择,结果有什么?若电视台2先选择呢?

(4)如果两家谈判合作,电视台1许诺将好节目放在前面,这许诺可信吗?结果可能

是什么?

解:(1)如果两家同时决策,存在纳什均衡,均衡策略组合为:电视台1选择在后面播放,电视台2选择在前面播放,即(后面,前面)。

(2)风险回避的策略也就是最大最小策略。

当电视台2选择前面时,它获得的最小收益为()min 18,2318=。

当电视台2选择后面时,它获得的最小收益为()min 4,164=。

那么电视台2的最大最小策略就是()(){}max min 18,23,min 4,1618=,即电视台2会选择前面;同理可以知道电视台1也会选择前面。所以均衡策略为:(前面,前面),其收益为(18,

18)。

(3)如果电视台1先选择,那么利用反向归纳法,可知电视台1和2的选择分别为:(后面,前面)。如图11-7所示。

图11-7 电视台1先决策的动态博弈

如果电视台2先选择,结果同1先选择的情况,如图11-8所示。

图11-8 电视台2先决策的动态博弈

(4)电视台1将好节目放在前面的许诺不可信。这是因为对电视台2而言,“前”是其占优策略,所以在电视台1确定电视台2会选择“前面”时,电视台1只会选择“后面”来最大化它的收益。

6.两个厂商(A 与B )考虑健康雪茄的竞争品牌。厂商报酬如表11-4所示(A 的利润首先给定)。

表11-4 生产雪茄的厂商之间的博弈

(1)这个对策有纳什均衡吗?

(2)这个对策对于厂商A或者厂商B有先动优势吗?

(3)厂商B发现欺骗厂商A,能把它赶出市场吗?

答:(1)该博弈存在纳什均衡,均衡的策略组合为:(生产,不生产),(不生产,生产)。当厂商B选择生产时,厂商A的最优策略为不生产,当厂商B选择不生产时,厂商A的最优策略是选择生产;当厂商A选择生产时,厂商B的最优策略为不生产,当厂商A选择不生产时,厂商B的最优策略为生产,因此最终存在两个纳什均衡(生产,不生产),(不生产,生产),对应的支付为(5,4),(4,5)。

(2)如果厂商A先行动(如图11-9所示),根据反向归纳法,这个动态博弈的均衡为(生产,不生产);如果厂商B先行动(如图11-10所示),根据反向归纳法,这个动态博弈的均衡为(不生产,生产)。可见每个厂商选择先行动都比选择后行动可以获得更高的收益,所以厂商A和厂商B都有先动优势。

图11-9 厂商A先行动的博弈的反向归纳

图11-10 厂商B先行动的博弈的反向归纳

(3)厂商B不能把厂商A赶出市场,这是因为无论厂商B实行什么策略,厂商A总是可以获得正的利润。

7.WET公司垄断了震动充水床垫的生产。这种床垫的生产是相对缺乏弹性的——当价格为每床1000美元时,销售25000床;当价格为每床600美元,销售30000床。生产充水床垫的惟一成本是最初的建厂成本。WET公司已经投资建设生产能力达到25000床的工厂,滞留成本与定价决策无关。

(1)假设进入这个行业能够保证得到一半市场,但是要投资10000000美元建厂。构造WET公司(1000

p=)和潜在进入者(进入或者不进入)博弈的支付矩阵。

p=或者600

这个对策有纳什均衡吗?

(2)假设WET公司投资5000000美元将现有工厂的生产能力扩大到生产40000床充水床垫。阻止竞争对手的进入是有利可图的策略吗?

解:(1)由于WET公司是在位者,所以在本题的博弈中WET公司是先行者,当它把产品价格定为1000美元时:

π=?=(美元)。

如果此时WET垄断市场,那么10002500025000000

WET

如果竞争对手进入市场,那么可得:

π=?=(美元)

10001250012500000

WET

π=?-=(美元)

100012500100000002500000

ENTREANT

当WET公司把产品价格定为600美元时:

如果此时WET垄断市场,那么6002500015000000

π=?=(美元)。

WET

如果竞争对手进入市场,那么可得:

π=?=(美元)

600150009000000

WET

π=?-=-(美元)

60015000100000001000000

ENTREANT

博弈的扩展型表述如图11-11所示(支付的单位是百万)。

图11-11 博弈的扩展型表述

博弈的策略表达式如表11-5所示(支付的单位是百万)。

表11-5 动态博弈的策略式表述(单位:百万)

纳什均衡为{1000,(进入,进入)}、{600,(进入,不进入)},子博弈完美的纳什均衡为{600,(进入,不进入)}。

(2)WET投资新建厂的策略是无利可图的。理由如下:WET公司扩大产能以后,当它把产品价格定为1000美元时:

π=?-=(美元)。

如果此时WET公司垄断市场,那么可得100025000500000020000000

WET

如果竞争对手进入市场,那么可得:

π=?-=(美元)

10001250050000007500000

WET

π=?-=(美元)

100012500100000002500000

ENTREANT

当WET公司把产品价格定为600美元时:

π=?-=(美元)。

如果此时WET公司垄断市场,那么60030000500000013000000

WET

如果竞争对手进入市场,那么:

π=?-=(美元)

6001500050000004000000

WET

π=?-=-(美元)

60015000100000001000000

ENTREANT

博弈的扩展型表述如图11-12所示(支付的单位是百万):

子博弈完美的纳什均衡为{600,(进入,不进入)},此时WET公司的利润为13000000,比扩大产能之前低。

图11-12 博弈的扩展型表述

8.解图11-13的广延型博弈。

图11-13 广延型博弈

解:利用反向归纳法,可知博弈的均衡策略为:参与人1第一步选择L,第三步选择L";参与人2选择L',如图11-14所示。

图11-14 利用反向归纳法解广延型博弈

在图11-13的广延型博弈中,由于第一步和最后一步都是参与者1先行动,因此可从最后一步即第三步开始考虑,在第三步,对于参与者1来说L"是最优策略,此时支付组合为(3,0),由于参与者2知道在第三步中参与者1会选择L",此时自己得到的支付为0,因此在第二步时,参与者2会选择L'结束博弈,此时参与者2得到支付1,参与者1只得到支付1。参与者1如果知道参与者2在第二步选择L',则为了使自己支付最大化,参与者1会在第一步直接选择L结束博弈,此时参与者1得到支付2,参与者2得到0。

所以,这个广延型博弈的均衡为(2,0),即由参与者1选择L来直接结束博弈过程。

9.讨论本讲中的“蜈蚣博弈”(见图11-15),若三方都采取“向前看”的态度,有没有“妥协”并使三方都获利的可能?这对讨论中国的“债转股”问题有什么启发?

图11-15 蜈蚣型广延博弈

答:(1)在理论上有一种可能,如图11-16所示:

图11-16 三方都采取“向前看”的态度时的均衡

若在图11-16中的蜈蚣型广延博弈中,若A、B、C三人都向前看且具有妥协性,则A 先妥协选择策略z,然后C妥协选择w,然后A再次妥协选择x',B将选择X',最后C再次妥协选择u',此时可以使三方都获利,支付组合为(5,5,5)。因此存在这种可能。

(2)在中国的债转股市场上,主要处理的是四大国有银行对大型国有企业的贷款问题。如果四大国银行逼国有企业还款,则国有企业由于无法还清银行的贷款而可能被诉诸法庭并且其财产可能会被法庭强制变卖以偿还银行贷款,最终会导致企业和银行双方都遭殃。但是,如果银行能够同意将贷款转换为国有企业的股份,则可以使国有企业摆脱困境并且重新走上盈利之路。因此,蜈蚣博弈对于债转股还是有很大启发的。

10.考虑下列广延型博弈(如图11-17所示):

图11-17 广延型博弈

(1)写出该博弈的策略型博弈形式。

(2)该策略型博弈中有纳什均衡吗?

解:(1)参与人1的策略:①选左;②选右。

参与人2的策略:

①无论参与人1的选择是什么,参与人2都选择左;

②如果参与人1选择左,参与人2也选择左;如果参与人1选择右,那么参与人2也选择右。

③如果参与人1选择左,那么参与人2就选择右;如果参与人1选择右,那么参与人2就选择左。

④无论参与人1的选择是什么,参与人2都选择右;

博弈的策略型表述如表11-6所示。

表11-6 博弈的策略型表述

(2)该博弈的纯策略均衡为{左,(右,右)}和{右,(右,左)},因而有纳什均衡。

智慧树知到《博弈策略与完美思维》章节测试题[完整答案]

智慧树知到《博弈策略与完美思维》章节测 试题[完整答案] 见面课:信号博弈 2、如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡,这就是该动态博弈的一个子博弈完美纳什均衡。 A.对 B.错 正确答案:对 3、颤抖手均衡解决了博弈方犯错误的问题,因此能够保证它的预测一定就是实际博弈的结果。 A.对 B.错 正确答案:错 4、不完全信息动态博弈分析的基本方法也是逆推归纳法。 A.对 B.错 正确答案:错 5、在动态经济博弈论问题中,各个博弈方的选择和博弈的结果,与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系。

B.错 正确答案:对 见面课:纳什均衡与应用 1、在囚徒困境的博弈中,两个囚徒合作的策略会形成( )。 A.纳什均衡 B.占优策略均衡 C.重复剔除的占优均衡 D.非纳什均衡 正确答案:非纳什均衡 2、在社会福利博弈中,流浪汉和政府博弈的均衡属于( )。 A.纯战略纳什均衡 B.混合战略纳什均衡 C.重复剔除的占优均衡 D.占优策略均衡 正确答案:混合战略纳什均衡 3、合作博弈就是博弈方采取相互合作态度的博弈。 A.对 B.错 正确答案:错 4、任何理性的博弈方都不可能采用严格下策。 A.对

正确答案:对 5、在考虑混合策略的情况下,我们不可利用重复剔除的方法进行分析求解。 A.对 B.错 正确答案:对 6、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 A.对 B.错 正确答案:错 见面课:纳什生平故事漫谈 1、下列哪个博弈属于零和博弈( )。 A.囚徒困境 B.懦夫博弈 C.智猪博弈 D.硬币博弈 正确答案:硬币博弈 2、“敌不动,我不动”指的就是纳什均衡。 A.对

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论复习题及答案

囚徒困境说明个人得理性选择不一定就是集体得理性选择。(√) 子博弈精炼纳什均衡不就是一个纳什均衡。(× ) 若一个博弈出现了皆大欢喜得结局,说明该博弈就是一个合作得正与博弈.()博弈中知道越多得一方越有利。( ×) 纳什均衡一定就是上策均衡。(× ) 上策均衡一定就是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。 (×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√) 在博弈中纳什均衡就是博弈双方能获得得最好结果。 (× ) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少. (×)上策均衡就是帕累托最优得均衡。(×) 因为零与博弈中博弈方之间关系都就是竞争性得、对立得,因此零与博弈就就是非合作博弈。 (×) 在动态博弈中,因为后行动得博弈方可以先观察对方行为后再选择行为,因此总就是有利得。(×) 在博弈中存在着先动优势与后动优势,所以后行动得人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒得困境博弈中两个囚徒之所以会处于困境,无法得到较理想得结果,就是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢得时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益得策略组合.(√)不存在纯战略纳什均衡与存在惟一得纯战略纳什均衡,作为原博弈构成得有限次重复博弈,共同特点就是重复博弈本质上不过就是原博弈得简单重复,重复博弈得子博弈完美纳什均衡就就是每次重复采用原博弈得纳什均衡。(√ ) 多个纯战略纳什均衡博弈得有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略与纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)得子博弈完美均衡结局,其中对于任意得t<T,在t阶段得结局并不就是G得Nash均衡.(√)(或:如果阶段博弈G={A1,A2,…,An; u1,u2,…,un)具有多重Nash均衡,那么该重复博弈G(T)得子博弈完美均衡结局,对于任意得t<T,在t阶段得结局一定就是G得Nash均衡。) 零与博弈得无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈得混合战略纳什均衡.(√)(或:零与博弈得无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈得混合战略纳什均衡.(×)) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈得纯战略纳什均衡本身就是各局中人能实现得最好结果,符合所有局中人得利益,因此,不管就是重复有限次还就是无限次,不会与一次性博弈有区别。(√) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一得纳什均衡不就是效率最高得战略组合,存在潜在合作利益得

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲 策略性博弈与纳什均衡 1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是 50020D Q p =- (1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。理由如下: 假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,A p 和B p 都不会严格大于10。否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足10A p ≤,10B p ≤。但是由于A p 的下限也是10,所以均衡时10A p =。给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。综上可知,均衡时的价格为10A p =,10B p ε=-。 (2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为: max pq cq ε>- ① 其中10p ε=-,()5002010q ε=-?-,把这两个式子代入①式中,得到: ()()0 max 1085002010εεε>----???? 解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-?--????。 (3)这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本,所以 如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”,那么: 表10-1 博弈的支付矩阵

策略博弈习题部分解答

博弈论与政治第三小组作业 第二章名词解释: 1、理性行为(rational behavior):参与人精于算计并严格按照其最优策略行事。其中理性有两个重要的内涵:一个人对自己的利益完全了解,并能完美地计算出何种行动可以最大化其利益。 2、不完美信息(imperfect information):在博弈的每一个行动时点上,参与人可能无法获悉决策所需的全部信息。这包括相关的外部环境——比如天气——的不确定性,以及对方先前或当前的行动。这类情况称为不完美信息。 3、不完全信息(incomplete information):当一个参与人比另一个参与人了解更多信息时,阴谋诡计就会产生。这类情况称为不完全信息。 4、合作博弈(cooperative game):博弈论使用两个专门术语来区分协议具有强制力和不具有强制力的情况。若协议对参与人行为具有强制力,则称此类博弈为合作博弈。 5、非合作博弈(noncooperate game):个体参与人可根据其利益采取行动,则称此类博弈为非合作博弈。 第三章名词解释: 1、中间评估函数(intermediate valuation function):赋予非终点结支付的规则被称为中间评估函数。 2、先动优势(firstmover advantage):在博弈的过程中先做决策带来的优势。先动优势来自于将其自身置于一个优势地位以及迫使其他参与人接受它的承诺能力。 后动优势(second-mover advantage):在博弈的过程中后做决策带来的优势。后动优势源于自己可对他人选择做出的灵活性。 第四章名词解释: 1、占优策略(dominant strategy)、劣策略(dominated strategy): 每一个博弈中的参与者通常都拥有不止一个竞争策略,其所有策略的集合 构成了该企业的策略集。在参与者各自的策略集中,如果存在一个与其他竞争 对手可能采取的策略无关的最优选择,则称其为占优策略(Dominant Strategy),与之相对的其他策略则为劣势策略。 占优策略是博弈论(game theory)中的专业术语,所谓的占优策略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。 2、占优可解(dominance solvable): 在规模较大的博弈中,或许没有单个策略占优于其他所有的策略,但可能 也存在一些策略劣于其他某些策略。如果参与人发现自己处于这样一种博弈中,

博弈论复习题及标准答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。 (×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章 博弈论初步 第一部分 教材配套习题本习题详解 一、简答题 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒 困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211a a a a B 的支付矩阵=??? ???2221 1211b b b b 例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。 具体事例为: 73737373?? ?? ??

3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??? ???22211211a a a a B 的支付矩阵=11122122b b b b ???????? A 、 B 共同的支付矩阵=1111121222222121a b a b a b a b ?? ?????? 具体事例为: 76157323?? ?? ?? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合 代表的策略组合就是博弈的纳什均衡。 5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。 解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。 表10—1

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论习题及参考答案

《博弈论》习题 一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 博弈双方都失败 B.博弈双方都获胜A. C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈

复旦大学博弈论第六章习题

第六章习题 一、判断下列表述是否正确,并作简单分析 (1)完全但不完美信息动态博弈中各博弈方都不清楚博弈的进程,但清楚博弈的得益。 答:不一定,不是所有博弈方都不清楚博弈的进程,只要有一个博弈方都不完全清楚博弈的进程。 (2)不完美信息动态博弈中的信息不完美性都是客观因素造成的,而非主观因素造成。 答:错。信息不完美很多是人为因素所造成的,因为出于各自的动机和目的,人们在市场竞争或合作中常常会故意隐瞒自己的行为。 (3)在完全但不完美信息动态博弈中,若不存在混合策略,并且各博弈方都是主动选择且行为理性的,则不完美信息从本质上说是“假的”。 答:正确。因为只包含理性博弈方的主动选择行为,利益结构明确,而且不同路径有严格优劣之分,从不需要用混合策略的动态博弈来说,所有博弈方选择的路径都可以通过分析加以确定和预测,根本无须观察。从这个意义上说,这种博弈的不完美信息实际上都是假的。 (4)子博弈可以从一个多节点信息集开始。 答:不能从多节点信息集开始,因为多节点必然分

割信息集。 (5)不完美信息是指至少某个博弈方在一个阶段完全没有博弈进程的信息。 答:不是完全没有博弈进程的信息,而是没有完美的信息,只有以概率判断形式给出的信息。 二、用柠檬原理和逆向选择的思想解释老年人投保困难的原因。 答:“柠檬原理”是在信息不完美且消费者缺乏识别能力的市场中,劣质品赶走优质品,最后搞垮整个市场机制。“逆向选择”是在同样不完美市场和消费者缺乏识别能力的市场中,当价格可变时,价格和质量循环下降,市场不断向低端发展的机制。 老年人投保的分析:大致思路是由于信息不对称,费用越来越高,投保人的健康状况好的比例越来越小,最终发展成为只有身体不好的人才参加投保。如果允许调整费率,保险公司为了避免亏损降低风险,上调保费率,健康状况相对好一些的退出市场,整个市场状况恶化。…… 这就是逆向选择机制在老年保险市场上作用的结果。 三、用完全但不完美信息动态博弈的思想,讨论我国治理假冒伪劣现象很困难的原因。

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

博弈论习题及解答

※第一章绪论 §1.2 1. 什么是博弈论?博弈有哪 些基本表示方法?各种表示法 的基本要素是什么?(见教材) 2. 分别用规范式和扩展式表 示下面的博弈。 两个相互竞争的企业考虑同 时推出一种相似的产品。如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。 3. 什么是特征函数? (见教材) 4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子? 原因:个体理性与集体理性的矛盾。 例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡 1. 什么是纳什均衡? (见教材) 2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。 先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。然后用划线法求出该矩阵博弈的纯策略Nash均衡。 3. 求出下面博弈的纳什均衡。 由划线法易知,该矩阵博弈没有纯策略Nash均衡。 由表达式(2.3.13)~(2.3.16)可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1 将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。 解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)} 令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x) 作出三条直线,如下图,图中粗的折线,就是F(x)的图象

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈常包括下面的容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

《博弈策略与完美思维》2019章节测试题与答案

《博弈策略与完美思维》2019章节测试题与答案 第1章单元测试 1、博弈论中,参与人从一个博弈中得到的结果常被称为()。 答案:支付 2、根据博弈的参与人之间是否达成具有约束力的契约来分,博弈可分为()。 答案:合作博弈和非合作博弈 3、和威廉·维克瑞共同分享1996年诺贝尔经济学奖的是()。 答案:詹姆斯·莫里斯 4、每一个参与者对所有其他参与人的特征、策略空间和支付函数有准确的认识,这样的博弈为()。 答案:完全信息博弈 5、博弈的关键要素包括()。 答案:战略、参与人、信息、支付 第2章单元测试

1、在具有占优战略均衡的囚徒困境博弈中()。 答案:两个囚徒都会坦白 2、严格劣战略是指参与人的某一个战略()。 答案:相对于本人某个战略,得分是较低的 3、下列关于古诺模型的假设,说法正确的是()。 答案:某产品市场上仅有两家企业,高进入壁垒阻止了其他企业进入 4、下列说法正确的是下列说法正确的是 答案:购买实物的原始凭证,必须有验收证明、原始凭证必须记录真实,内容完整、有关现金和银行存款的收支凭证,如果填写错误,必须作废、一般原始凭证发生错误,必须按规定办法更正 5、一个博弈如果有多个纳什均衡,我们一般如何来实现某个具体的纳什均衡? 答案:帕累托上策均衡、风险上策均衡、聚点均衡、相关均衡第3章单元测试 1、下列描述哪个是正确的 ( ) 。 答案:策略与行动是两个不同的概念,策略是关于行动的详细计

划 2、下列说法正确的有()。 答案:资产负债表日后发生的调整事项如涉及现金收支项目的,均不调整报告年度资产负债表的货币资金项目和现金流量表正表各项目数字、资产负债表日后事项期间发生的“已证实资产发生减值损失”,可能是调整事项,也可能是非调整事项 3、子博弈精炼纳什均衡是哪一位博弈论专家提出的()。 答案:泽尔腾 4、里昂惕夫在 1946 年提出的劳资双方的博弈模型,属于什么类型的博弈? 答案:完全信息动态博弈 5、博弈树的基本结构包括()。 答案:结、枝、信息集 第4章单元测试 1、某一次性博弈中至少某一个局中人不完全了解另一个局中人的特征,即不知道某一参与人的真实类型,但是知道每一种类型出现的频率。这样的博弈是()。

博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题?

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈复习题及参考答案

第一章复习题 2,4,5,6,7 第一章参考答案 2、设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。如果设定博弈模型时不专门设定后两个方面,就是隐含假定是完全、完美信息和完全理性的非合作博弈。 4、“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整个、个体利益共同的最优。简单地说,“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。 现实中“囚徒的困境”类型的问题是很多的。例如厂商之间价格战、恶性的广告竞争,初中、中等教育中的应试教育等,其实都是“囚徒的困境”博弈的表现形式。 5、首先可根据博弈方的行为逻辑,是否允许存在有约束力协议,分为非合作博弈和合作博弈两大类。 其次可以根据博弈方的理性层次,分为完全理性博弈和有限理性博弈两大类,有限理性博弈就是进化博弈。 第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。 第四是根据博弈问题的信息结构,根据博弈方是否都有关于得益和博弈过程的充分信息,分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈和不完全信息动态博弈几类。 第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。 第六是根据博弈中博弈方的数量,可将博弈分为单人博弈、两人博弈和多人博弈。 第七是根据博弈方策略的数量,分为有限博弈和无限博弈两类。 9、(a )根据问题的假设,该博弈的得益矩阵和扩展形表示分别如下: 自 然 赚(35%) 亏(65%) 开 我 不开

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4,1 0,0 3,0 0,1 2,2 2,2 纯战略纳什均衡:( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡:( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡:( R, M ’ ) 子博弈精炼纳什均衡:( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2,2 2,2 3,0 0,1 0,1 3,0 六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。 求混合战略精炼贝叶斯均衡: 设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则: 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又 联立得 所以 L L M L L M L R L

4.3答案(见4.5) 4.4 表示方法 第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号; 第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a ) [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== (b ) [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案 (a ) [(,),(,),1/3,1/2]R R u d p q >= (b ) 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

相关文档
最新文档