高鸿业-微观经济学-第七版-课后答案-西方经济学18第十章博弈论初步

第十章博弈论初步

第一部分教材配套习题本习题详解

一、简答题

１．什么是纳什均衡？纳什均衡一定是最优的吗？

解答：（１）所谓纳什均衡，是参与人的一种策略组合，在该策略组合上，任何参与人单独改变策略都不会得到好处。

（２）不一定。如果纳什均衡存在，纳什均衡可能是最优的，也可能不是最优的。例如，在存在多个纳什均衡的情况下，其中有一些纳什均衡就不是最优的；即使在纳什均衡是唯一时，它也可能不是最优的，因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如：囚徒困境。

２．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡最多可有几个？为什么？

解答：在只有两个参与人（如Ａ和Ｂ）且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡最多可有四个。例如，当Ａ与Ｂ的支付矩阵可分别表示如下时，总的支付矩阵中所有四个单元格的两个数字均有下划线，从而，总共有四个纳什均衡。

A 的支付矩阵＝??????22211211a a a a

B 的支付矩阵＝???

???2221

1211b b b b

例如：a 11=a 12=a 21=a 22，b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。

具体事例为： 73737373??

????

３．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡可能有三个。试举一例说明。

解答：在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡可能有４个、３个、２个、１个和0个五种情况，所以可能有３个。例如，当参与人Ａ与Ｂ的支付矩阵可分别表示如下时，总的支付矩阵中恰好有三个单元格的两个数字均有下划线，从而，总共有三个纳什均衡。

A 的支付矩阵＝ ???

???22211211a a a a B 的支付矩阵＝11122122b b b b ???????

? A 、B 共同的支付矩阵＝1111121222222121a b a b a b a b ????????

具体事例为： 76157323??

４．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，如何找到所有的纯策略纳什均衡？

解答：可使用条件策略下划线法。具体步骤如下：首先，把整个博弈的支付矩阵分解为两个参与人的支付矩阵；其次，在第一个（即位于整个博弈矩阵左方的）参与人的支付矩阵中，找出每一列的最大者，并在其下画线；再次，在第二个（在位于整个博弈矩阵上方的）参与人的支付矩阵中，找出每一行的最大者，并在其下画线；然后，将已经画好线的两个参与人的支付矩阵再合并起来，得到带有下划线的整个博弈的支付矩阵；最后，在带有下划线的整个的支付矩阵中，找到两个数字之下均画有线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。

５．设有Ａ、Ｂ两个参与人。对于参与人Ａ的每一个策略，参与人Ｂ的条件策略有无可能不止一个？试举一例说明。

解答：例如，在如表１０—１的二人同时博弈中，当参与人Ａ选择上策略时，参与人Ｂ既可以选择左策略，也可以选择右策略，因为他此时选择这两个策略的支付是完全一样的。因此，对于参与人Ａ的上策略，参与人Ｂ的条件策略有两个，即左策略和右策略。

表１０—１

６．如果无论其他人选择什么策略，某个参与人都只选择某个策略，则该策略就是该参与人的绝对优势策略（简称优势策略）。试举一例说明某个参与人具有某个优势策略的情况。

解答：例如，在如表１０—２的二人同时博弈中，无论参与人Ａ是选择上策略还是选择下策略，参与人Ｂ总是选择左策略，因为他此时选择左策略的支付总是大于选择右策略。因此，在这一博弈中，左策略就是参与人Ｂ的绝对优势策略。同时下策略是Ａ的绝对优势策略。

表１０—２

７．混合策略博弈与纯策略博弈有什么不同？

解答：在纯策略博弈中，所有参与人对策略的选择都是“确定”的，即总是以100％

的可能性来选择某个策略，而在混合策略博弈中，参与人则是以一定的可能性来选择某个策略，又以另外的可能性选择另外一些策略。在这种情况下，参与人选择的就不再是原来的100％的确定策略（如上策略或下策略），而是一个概率向量（如以某个概率选择上策略，以另外一个概率选择下策略）。纯策略博弈可以看成是混合策略博弈的一种特例。

８．条件混合策略与条件策略有什么不同？

解答：例如，在一个只包括参与人Ａ与参与人Ｂ的二人同时博弈中，参与人Ａ的条件策略是Ａ在Ｂ选择某个既定策略时所选择的可以使其支付达到最大的策略。相应地，参与人Ａ的条件混合策略是Ａ在Ｂ选择某个既定的混合策略时所选择的可以使其期望支付达到最大的混合策略。

９．混合策略纳什均衡与纯策略纳什均衡有什么不同？

解答：在纯策略博弈中，纳什均衡是参与人的一种策略组合，在该策略组合上，任何参与人单独改变其策略都不会得到好处。

在混合策略博弈中，纳什均衡是参与人的一种概率向量组合，在该概率向量组合上，任何参与人单独改变其概率向量都不会得到好处。

10．设某个纯策略博弈的纳什均衡是有限的。试问：相应的混合策略博弈的纳什均衡会是无限的吗？试举一例说明。

解答：当纯策略博弈的纳什均衡为有限时，相应的混合策略博弈的纳什均衡既可能是有限的，也可能是无限的。例如，在只包括Ａ与Ｂ的二人同时博弈中，混合策略纳什均衡的“集合”可以是单位平面、三条线段、两条线段、一条线段、三个点、两个点和一个点，其中，前四种情况就意味着存在无限多个纳什均衡。

11．在完全信息动态博弈中，纳什均衡与逆向归纳策略有什么不同？

解答：与同时博弈一样，在序贯博弈中，纳什均衡也是指这样一些策略组合，在这些策略组合中，没有哪一个参与人会单独改变自己的策略。同样，在序贯博弈中，纳什均衡也可能不止一个。在这种情况下，可以通过逆向归纳法对纳什均衡进行“精炼”，即从多个纳什均衡中，排除掉那些不合理的纳什均衡，或者，从众多的纳什均衡中进一步确定“更好”的纳什均衡。经由逆向归纳法的精炼而得到的纳什均衡就是所谓的逆向归纳策略。

二、论述题

1．设某个纯策略博弈的纳什均衡不存在。试问：相应的混合策略博弈的纳什均衡会存在吗？试举一例说明。

解答：在同时博弈中，纯策略的纳什均衡可能存在，也可能不存在，但相应的混合策略纳什均衡总是存在的。例如，在表１０—３的二人同时博弈中，根据条件策略下划线法可知，由于没有一个单元格中两个数字之下均有下划线，故纯策略的纳什均衡不存在，但是，相应的混合策略纳什均衡却是存在的。

表１０—３

首先，分别计算Ａ与Ｂ的条件混合策略。

E A ＝3p 1q 1＋9p 1(1－q 1)＋7(1－p 1)q 1＋2(1－p 1)(1－q 1) ＝3p 1q 1＋9p 1－9p 1q 1＋7q 1－7p 1q 1＋2－2q 1－2p 1＋2p 1q 1 ＝7p 1－11p 1q 1＋5q 1＋2 ＝p 1(7－11q 1)＋5q 1＋2

E B ＝6p 1q 1＋2p 1(1－q 1)＋3(1－p 1)q 1＋8(1－p 1)(1－q 1) ＝6p 1q 1＋2p 1－2p 1q 1＋3q 1－3p 1q 1＋8－8q 1－8p 1＋8p 1q 1 ＝9p 1q 1＋8－5q 1－6p 1 ＝q 1(9p 1－5)－6p 1＋8

其次，分别计算A 和B 的条件混合策略。

p 1＝ []???

????>=<11/7011/71,011/7111

1q q q

q 1＝ []???

????>=<9/51

9/51,09/50

1p p p

最后，混合策略纳什均衡参见图１０—１中的ｅ点。

图１０—１

2．在下面的博弈树中（见图１０—２），确定纳什均衡和逆向归纳策略。

解答：纳什均衡和逆向归纳策略都是同一个，即与支付向量（１，３）相应的策略组合（决策１，决策３）。

图１０—２

3．用逆向归纳法确定下面的“蜈蚣博弈”的结果（见图１０—３）。在该博弈中，第１步是Ａ决策：如果Ａ决定结束博弈，则Ａ得到支付１，Ｂ得到支付０，如果Ａ决定继续博弈，则博弈进入到第２步，由Ｂ做决策。此时，如果Ｂ决定结束博弈，则Ａ得到支付０，Ｂ得到支付２，如果Ｂ决定继续博弈，则博弈进入到第３步，又由Ａ做决策，如此等等，直到最后，博弈进入到第9999步，由Ａ做决策。此时，如果Ａ决定结束博弈，则Ａ得到支付9999，Ｂ得到支付０；如果Ａ决定继续博弈，则Ａ得到支付０，Ｂ得到支付10000。

图１０—３

解答：首先考虑第9999步Ａ的决策。此时，Ａ肯定会结束博弈———结束博弈Ａ可以得到支付9999，否则只能得到0。于是，我们可以把该博弈中最后一条水平线段删除；其次考虑第9998步Ｂ的决策。此时，Ｂ也肯定会结束博弈，结

束博弈Ｂ可以得到,9998，否则只能得到0。于是，我们可以把该博弈中倒数第二条水平线段（以及它后面的最后一条垂直线段）也删除。这样倒推下来的结果是，任何一个人在轮到自己决策时都会决定结束博弈。因此，整个博弈的结果是：在第１步，Ａ就决定结束博弈，于是，Ａ得到１，Ｂ得到０。

4．在图10—3所示的情侣博弈中，如果将第二个支付向量（0，0）改为（0，1.5），纳什均衡和逆向归纳法策略会有什么变化？改为（0，1）呢？

解答：（1）当第二个支付向量不变，仍然为（０，０）时，有两个纳什均衡，即（足球，足球）和（芭蕾，芭蕾），逆向归纳策略为（足球，足球）。

（2）将第二个支付向量由（0，0）改为（0，1.5）后，纳什均衡和逆向归纳法策略都是（芭蕾，芭蕾）。

（3）如果将第二个支付向量改为（0，1），则纳什均衡仍然为（足球，足球）和（芭蕾，芭蕾），但逆向归纳法失效：当男方选择芭蕾时，女方也选择芭蕾，从而，男方可得到支付１，但是，当男方选择足球时，女方既可以选择足球，也可以选择芭蕾，如果女方选择足球，则男方可以得到更大的2，如果女方选择芭蕾，则男方只能得到更小的0。

5.在只有两个参与人且每个参与人都有三个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?

图１０—４

解答：在只有两个参与人且每个参与人都只有三个策略可供选择的情况下，纯策略的纳什均衡最多可有九个。例如，当参与人Ａ与Ｂ的策略不同，但各自的支付相同，则有九个支付相同的纳什均衡。

6.设有两个参与人x 和y 。x 有两个纯策略x 1 和x 2,y 有两个纯策略y 1 和y 2。当y 选择y 1 和y 2 时,x 选择x 1 得到的支付分别为x 11 和x 12,选择x 2 得到的支付分别为x 21 和x 22;当x 选择x 1 和x 2 时,y 选择y 1 得到的支付分别为y 11 和y 21,选择y 2 得到的支付分别为y 12和y 22。

(1)试给出相应的博弈矩阵。

(2)这种博弈矩阵的表示是唯一的吗? 为什么?

解答：(1)x 的支付矩阵＝ 11122122x x x x ?????? B 的支付矩阵＝11

1221

22y y y y ??

????

A 、

B 共同的支付矩阵＝ 1111121221212222x y x y x y x y ??

(2) 这种博弈矩阵的表示不是唯一的。也可以表示为以下形式：

7. 根据表10-1的二人同时博弈模型求: （1）参与人A 与B 的期望支付

（2）参与人A 与B 的条件混合策略。（3）纳什均衡。

表10 1

解答（1）分别计算Ａ与Ｂ的期望支付：

E A ＝3p 1q 1＋p 1(1－q 1)＋0(1－p 1)q 1＋2(1－p 1)(1－q 1) ＝3p 1q 1＋p 1－p 1q 1＋2－2q 1－2p 1＋2p 1q 1 ＝4p 1q 1－p 1－2q 1＋2 ＝p 1(4q 1－1)-2q 1＋2

E B ＝2p 1q 1＋p 1(1－

q 1)＋0(1－p 1)q 1＋3(1－p 1)(1－q 1) ＝2p 1q 1＋p 1－p 1q 1＋3－3q 1－3p 1＋3p 1q 1 ＝4p 1q 1－3q 1－2p 1＋3 ＝q 1(4p 1－3)－2p 1＋3

（2）分别计算A 和B 的条件混合策略。

[]11111q 1/4p =0,11/4

01/4q q ??

=???

f p

[]11111p 3/4q =0,1p 3/4

0p 3/4??

=???

f p

（3）混合策略纳什均衡见图中e 和m 点

8.根据表10-２的二人同时博弈模型求: （1）参与人A 与B 的期望支付

（2）参与人A 与B 的条件混合策略。（3）纳什均衡。 8.

表10 2

解答（1）分别计算Ａ与Ｂ的期望支付：

E A ＝3p 1q 1＋2p 1(1－q 1)＋3(1－p 1)q 1＋ (1－p 1)(1－q 1) ＝3p 1q 1＋2p 1－2p 1q 1＋3 q 1－3 p 1q 1+1－p 1- q 1＋p 1q 1 ＝-p 1q 1+p 1+2q 1＋1 ＝p 1(1－q 1)+2q 1＋1

E B ＝0p 1q 1＋p 1(1－q 1)＋2(1－p 1)q 1＋ (1－p 1)(1－q 1) ＝p 1－p 1q 1＋2 q 1－2 p 1q 1+1－p 1- q 1＋p 1q 1 ＝-2p 1q 1＋q 1＋1 ＝q 1(1－2p 1)＋1

（2）分别计算A 和B 的条件混合策略。

[]1111q 1p =0,1q =1???

[]11111p 1/2q =0,1p 1/2

0p 1/2??

=???

p f

（3）虚线MBC 为A 的条件混合策略曲线，实线MDNC 为A 的条件混合策略曲

线，混合策略纳什均衡为图中线段重合部分MD 段，重合部分MD 段部分上每一点都代表一个混合策略纳什均衡， C 点也是混合策略纳什均衡。纳什均衡为（（p 1，1-p 1），（q 1，1-q 1））=（[0，0.5]，[0.5，1]，(1，0) ），（（1,0）（0,1））

9. 根据图10 4的博弈树模型求:

(1)纳什均衡。 (2)逆向归纳策略。

决策3

参与人B d

决策1

决策4

参与人A a

决策3

决策2 c

参与人B

决策4

图10 4

解答(1)纳什均衡是(8,4),(4,8)。这个结论可以通过下划线方法得到。

也可以通过纳什均衡定义得到这个结论。若当前策略组合是d ，参与人A 选择对策1时，参与人B 改变策略，由决策3改为决策4，策略组合变为e ，显然参与人B 支付减少，参与人B 不会改变决策。

q 1

1 M D B

B 的条件混 A 的条件混合策略曲线合策略曲线

N C

0 1/2 1 p 1

若当前策略组合是d，参与人B选择决策3，参与人A也不会改变对策1的对策。所以d(8,4)是纳什均衡。同理，g点也是纳什均衡。

B的策略

决策3决策4

决策18,42,2 A的策略

决策2 1,14,8

(2)逆向归纳策略是(8,4)。

逆向归纳法第一步，在d和e中进行选择，删除e，选择d；在f和g中进行选择，删除f，选择g。逆向归纳法第二步，在d和g中进行选择，由于参与人A具有先行优势，参与人A选择决策1，参与人B只能选择决策3。所以d(8,4)是逆向归纳策略。

10. 根据图10 5的博弈树模型求:

(1)纳什均衡。(2)逆向归纳策略。

决策348

参与人B d

决策1b

决策411

参与人A a e

决策322

决策2c

参与人B

决策484

图105

解答(1)纳什均衡是(4,8) , (8,4)。这个结论可以通过下划线方法得到。

也可以通过纳什均衡定义得到这个结论。若当前策略组合是d，参与人A选择对策1时，参与人B

改变策略，由决策3改为决策4，策略组合变为e，显然参与人B支付减少，参与人B不会改变决策。若当前策略组合是d，参与人B选择决策3，参与人A也不会改变对策1的对策。所以d(4,8)是纳什均衡。同理，g点也是纳什均衡。

(2)逆向归纳策略是(8,4)。

逆向归纳法第一步，在d和e中进行选择，删除e，选择d；在f和g中进行选择，删除f，选择g。逆向归纳法第二步，在d和g中进行选择，由于参与人A具有先行优势，参与人A选择决策2，参与人B只能选择决策4。所以g(8,4)是逆向归纳策略。