效用函数与纳什均衡

效用函数与纳什均衡李保明

(山东大学产权研究所,济南,250100)

刘家壮

(山东大学数学与系统科学院,济南,250100)

摘　要　本文引入效用函数将博弈问题描述为收入形式和效用形式两种模型,使得纳什均衡与参与人效用函数联系起来,并得到结论:(1)效用函数的变化对纯策略纳什均衡不产生影响,却改变真混合策略纳什均衡;(2)效用函数严格拟凹时,真混合策略纳什均衡是稳定的;(3)效用函数严格拟凸时,真混合策略纳什均衡不存在.

关键词　效用函数,博弈论,纳什均衡

1.引言

近二十年来,博弈论在经济学领域产生重大影响,并有从根本方法上改写经济学的趋势.博弈论在经济分析中的广泛适应性是因为它更好地描述了经济问题,并为决策者提供了一套可丢行的决策方法.其中的关键概念纳什均衡为相互影响的决策者提供了博弈可能结果的一致性预测,也是理性决策者最优决策的结果,从而为决策者指明了决策方向.但是博弈论本身的缺陷阻碍了经济理论的发展,其中之一就是纳什均衡的多重性,由纳什均衡不唯一性导致经济(或博弈)问题的一致性预测结果很多,决策者仍然面临不确定性问题.如何在众多的纳什均衡中选择更为合理的一个?目前仍然博弈论中的理论难点.泽尔腾的子博弈完美纳什均衡和颤抖的手完美均衡以及梅耶森的适度均衡都是精炼纳什均衡所作的努力.但是仍不能得到满意结果(即唯一的均衡),考尔伯格和默顿提出稳定均衡的概念(Stable equilibria ),并说明没有单一的策略组合能满足所有要求,因此均衡解应是某些策略组合的集合而不是单一的策略组合,这似乎给均衡精炼下了一个“不能达到唯的”结论,然而这对博弈论在经济学上的应用和解决经济问题产生巨大障碍.海萨尼、泽而滕(Harsanyi ,Selten ,1988)提出纳什均衡选择的收入占优和风险占优分析方法,但它引起许多争议,并与Cooper ,Dejong ,Forsythe ,和Ross (1990)等人的实验结果不相符.尽管如此,参与人的决策总是选择一个策略,而不是多个策略,在下面的讨论中,我们引入效用函数描述参与人的这种选择.

在所有的博弈描述中,它都是由参与人、参与人策略和各种策略组合下的结果(参与人支付)所组成.根据博弈问题的不同,它还有不同的信息结构.对于完全信息的博弈,上述三要素是参与人的共同知晓的共同知识(Common knowledge ).但是,应该看到在博弈论描述的经济问题中,决策者(或称参与人)是根据其效用选择其策略的,参与人知道自己的效用函数却不能保证他知道其他参与人的效用函数,也就是说实际决策所需的效用函数不是参与人共知的共同知识;那么,作为共同知识的支付只能是各种策略组合下参与人的收入.在纳什(Nash ,

第17卷第4期2000年12月经　济　数　学MA THEMA TICS IN ECONOMICS Vo1117　No.4Dec.2000

收稿日期:2000-05-23

1950)定义中,他没有明确指明支付是收入还是效用,然而在讨论问题时又把它们混在一起.在后面的讨论中,我们可以看到两者的区分是很有意义的.现有的博弈结构没有完全揭示经济问题,还有描述参与人特征(比如对风险的态度等)的效用函数没有表达出来.这一问题导致了博弈论的重大缺陷即纳什均衡选择方面的困难.本文首先将效用函数引入博弈结构得到博弈问题新的描述形式,进而讨论不同效用函数导致纳什均衡的不同性质,尤其是混合策略纳什均衡的特征.2.博弈问题的新描述

描述经济问题的博弈论模型由参与人、策略和支付三要素组成,与原有的博弈论模型不同的是,我们根据支付是参与人的收入还是效用将博弈论描述分为博弈问题的收入形式模型和效用形式模型,收入形式模型是描述经济问题的中间模型,最终描述形式应是效用形式模型.

211　博弈问题收入形式模型

这种形式的博弈论模型和以前的描述没有区别,但为以后讨论问题方便,我们有必要严格表述一遍.

收入形式博弈模型由参与人、策略和收入组成,我们考虑有限博弈问题,它由以下因素组成:

(一)参与人集合N ={1,2,…,n},每一个参与人i ∈N 是博弈问题中的决策主体,其目的是其收入或期望收入最大化.

(二)参与人策略和策略组合,参与人i 的纯策略集合记为S i ={s 1i ,…,s k i i },所有参与人

的纯策略组成纯策略组合s =(s j i 1,…,s j n n ),其中j i =1,…,k i ,或简记为s ={s 1,…,s n },策略

组合的全体为S =Πn

i =1

S i .关于混合策略,参与人i 的混合策略是S i ={s 1i ,…,s k i i }上的概率分布即k i 维向量σi =(p 1i ,…,p k i 1),其中

p j i i Ε0,∑k i j i =1p j i i =1,其全体为M i ={(p 1i ,…,p k i i )|

∑k i j i =1p j i i =1},混合策略组合是由它们组成的m (m =k 1+k 2+…+k n )维向量σ=(σ1,

…σn ),其全体为M ={(σ1,…,σn })|σi ∈M i ,i ∈N }=Πn i =1

M i .当σi 的概率集中到一个纯策略s i 时,则它称为非真混合策略(improper mixed strategy )或称纯策略,记为σi =s i .否则,称为真混合策略(proper mixed strategy ).在混合策略中取概率为正的所有纯策略全体称为σi 的载体(carrier ),记为C (σi );若C (σi )=S i ,即在每一个纯策略的概率为正,则称σi 为完全混合策略(completely mixed strategy ).若所有的σi (i ∈N )均为纯策略,则它称为纯策略组合,并记为σ=s ;否则σ称为真混合策略组合(proper mixed 2strategy profile ).

(三)收入(Payoff ),参与人i 的收入不仅取决于自己的策略而且与其他参与人的策略有

关,它是策略组合的函数:对于纯策略组合s =(s j 11,…,s j n n ),其中j i =1,…,k i ,a i (s )=

a i (s j 11,…,s j 22,…,s j n n )是确定的实数,所有参与人的收入记为A =(a i (s ))s ∈S ,i ∈N ,并称为收

入矩阵.对于混合策略σ=(σ1,σ2,…,σn ),a i (σ)=a i (σ1,σ2,…,σn )是在{a i (s )|s ∈S }上

取值的随机变量,其数学期望为

Ea i (σ

)=∑k 1j 1=1∑k 2j 2=1…∑k n

j n =1a i (s j 11,s j 22,…,s j n n )p j 11p j 22…p j n

n 对于完全信息的博弈问题,上述三项均为共同知识,记为G =(N ,(S i )i ∈N ,(a i )i ∈N ),

—22— 经济数学第17卷

并称之为博弈问题的收入形式模型.我们在G 上定义纳什均衡,对任一i ∈N ,记σ=(σi ,…,σn )≡(σi ,σ-i ).定义1　策略组合σ3=(σ31,…,σ3n )是收入形式的纳什均衡,如果对任一i ∈N ,

Ea i (σ31,σ3-i )ΕEa i (σi ,σ3-i ),Πσi ∈M i

(1)成立.若σ3为纯策略组合,则称其为纯策略纳什均衡,否则称之为真混合策略纳什均衡.现有的结论都适用于收入形式的博弈问题,主要有以下几个方面的内容:

(一)纳什均衡的存在性

纳什于1950年最早给出博弈问题均衡的定义和其存在性的理论,从此开始纳什均衡的存在性就成了博弈论研究的一个主要方向,并取得了大量的研究成果.

纳什均衡存在性定理1(Nash ,1950)每一个有限博弈至少存在一个纳什均衡.

Debreu ,G licksberg 和Fan 等人研究了参与人的策略无限的情况,得到如下存在性定理.纳什均衡存在性定理Ⅱ(Debreu ,1952;G licksberg ,1952;Fan ,1952)在n 人博弈问题G 中,若每一个参与人的纯策略集合S i 是欧氏空间的非空紧致凸子集,且每一个收入函数a i (s )关于s 连续、关于s i 拟凹,则存在一个纯策略纳什均衡.

G licksberg 放松拟凹性条件得到混合策略的存在性.

纳什均衡存在性定理Ⅲ　(G licksberg ,1952)在n 人博弈问题G 中,若每一个参与人的纯策略集合S i 是欧氏空间的非空紧致凸子集,且每一个收入函数a i (s )关于s 连续,则存在一个混合策略纳什均衡.

放松收入函数连续的连续性条件,Dasguta 和Maskin 得到非连续博弈的纳什均衡的存在性.

纳什均衡存在性定理Ⅳ　(Dasguta ,Maskin ;1986)在n 人博弈问题中,若每一个参与人的纯策略集合S i 是有限维欧氏空间的非空紧致凸子集,每一个收入函数a i (s )关于s i 拟凹,关于s 上半连续,且具有连续最大值①,则存在一个纯策略纳什均衡.

(二)纳什均衡稳定性

根据纳什的定义,纯策略的严格纳什均衡是稳定的,即指在其他参与人采取纳什均衡的策略时,任一参与人的策略偏离均衡策略都有恢复到均衡策略的动力,但是真混合策略的均衡却是不稳定的.

(三)纳什均衡的多重性

纳什均衡概念的一个重要缺陷就是它的多重性,即许多博弈问题有多个纳什均衡,Wilson 研究了均衡的计算方法并提出著名的奇数定理.

奇数定理(Silson ,1971)几乎每一个有限博弈问题具有奇数个纳什均衡.

参与人和策略数量给定情况下,一个有限博弈问题由m Πn i =1k i 维向量(即收入矩阵)唯一确定,定理中的“几乎”是指除m Πn i =1k i 维欧氏空间中测度为零的集合外都成立.

(四)纳什均衡的精炼与选择

由于纳什均衡的多重性,剔除不合理的均衡或选择一个合理的均衡成了近年来博弈论发展的主要方向之一.这方面泽尔滕提出子博弈完美均衡(Selten ,1965)和颤抖的手完美均衡(Selten ,1975),以及克瑞普斯和威尔森的序贯均衡(Kreps ,Wilson ,1982)等概念进一步精炼了均衡概念.伯汉姆(Bernheim ,1984)和皮尔斯(Pearce ,1984)提出了剔除不合理策略的合理化过程和合理化策略.但是这些概念都有这样和那样的缺陷,不能保证其唯一性和存在性,它

—32—第4期李保明　刘家壮:效用函数与纳什均衡 ①a i (s )具有连续最大值是指a 3i (s -i )=max s i ∈S i a i (s i ,s -i )关于s -i 连续

们不能替代纳什均衡解决多重性问题.海萨尼、泽尔滕(Harsanyi ,Selten ,1988)提出纳什均衡选择理论,然而它们却不被实验结果所证实.

212　效用形式的博弈模型

参与人作为决策主体,他们选择策略的目标是效用最大化.一般地,参与人i 的收入a i (σ

)是取值于{a i (s )|s ∈S )}上随机变量,其全体记为 A ={a i (σ

)|σ∈Μ,i ∈N },参与人在 A 中的选择可定义为偏好序“Λ”,并有如下公理:

11自反性,任意σ∈M ,则a i (σ

)Λa i (σ).21完备性,任意σ,σ′∈M ,则a i (σ)Λa i (σ′)或者a i (σ′

)Λa i (σ).31传递性,任意σ,σ′,σ″∈M ,如果a i (σ)Λa i (σ′)和a i (σ′)Λa i (σ″

)都成立,则a i (σ)Λa i (σ″

).41连续性,对任一 σ∈M ,集合{σ∈M |a i ( σ)Λa i ( σ)}和{σ∈M |a i (( σ))Λa i (σ

)}是M 上的闭集.

51独立性,对任意σ,σ′,σ″∈M ,和α∈(0,1),如果a i (σ)Λa i (σ′

),则a i (ασ+(1-α)σ″)Λa i (ασ′+(1-α)σ″

).如果偏好序“Λ”满足公理124,根据德布鲁表示定理(Representation Theorem ),存在一个

连续效用函数u i ,并记为u i (σ)≡u i (a i (σ)),使得a i (σ)Λa i (σ′

)Ζu i (a i (σ))≥u i (a i (σ′))如果“Λ”还满足公理5,则u i 是一个预期效用函数,即

u i (σ

)==∑k 1j 1=1∑k 2j 2=1…∑k n

j n =1u i (a i (s j 11,s j 22,…,s j n n ))p j 11p j 22…p j n

n 定义了参与人的效用函数u i (i ∈N )后,一个经济博弈问题描述为:E =(N ,(S i )i ∈N ,(a i )i ∈N ,(u i )i ∈N ),它称为博弈问题的效用形式模型.在E 上定义纳什均衡:

定义2　策略组合σ3=(σ31,…,σ3n )是效用形式E 的纳什均衡,如果对任一i ∈N ,有

u i (a i (σ31,σ3-i ))Εu i (a i (σi ,σ3-i )),Πσi ∈M i

(2)成立.若σ3为纯策略组合,则称其为纯策略纳什均衡,否则称之为混合策略纳什均衡.

3.效用函数与纳什均衡的性质

311　效用函数

自从冯?诺依曼、摩根斯坦提出预期效用理论(Von Neumann ,Morganstein ,1944)以来,由于其公理表达简单而且规范,效用函数容量计算并且形式上较好地体现人们的风险行为类型(比如对风险的态度和程度可用效用函数的凸凹性及Arrow 2Pratt 测度来表示)等特征,不确定经济学的理论和应用研究一直是在此基本框架下进行的.现代博弈论也是在此基础上发展起来的.然而,预期效用理论中起关键作用的独立性公理假设并不总是成立,著名的Allais 悖论说明在某些情况下人们会系统地违反这一公理.目前寻找不含这一公理的效用函数正是数理经济学研究的热点课题,在这方面,Machina ,Quiggin 等人作了大量的工作.

博弈问题中的参与人与其他决策人一样受独立性公理的影响.我们研究预期和非预期效用框架下纳什均衡的性质变化.对于非预期效用,沿用Machina (1982)的方法,我们假设参与

人i 的非预期效用函数u i (a i (σ

))(1)(Frechet )可微的,(2)关于收入a i (σ)是一阶随机占优偏爱的且关于确定的收入是严格递增的.假设(2)也即,对任意的混合策略σ,σ′∈M ,若

a i (σ)一阶随机占优于a i (σ′),则u i (a i (σ))Εu i (a i (σ′));和对确定的a ,a ′Ε0,a >a ′,有

u i (a )>u i (a ′

).—42— 经济数学第17卷

312　纳什均衡的性质

我们先引入风险价格的定义.

定义3　对于效用函数u ,称R X 为随机收入(随机变量)X 的风险价格,如果有

u (X )=u (EX -R X ).

风险价格在经济和金融学中具有重要含义,它是人们为规避资产的风险所愿意付出的代价.

随机变量a i (σ3i ,σ3-i )和a i (σi ,σ3-i )的风险价格分别为R i (σ3i ,σ3-i ),R i (σi ,σ3-i )使得

u i (a i (σ3i ,σ3-i ))=φi (Ea i (σi ,σ3-i )-R i (σ3i ,σ3-i )),Πi ∈N.

R i (σi ,σ3-i )使得

u i (a i (σ31,σ3-i ))=φi (Ea i (σi ,σ3-i )-R i (σi ,σ3-i ),Πi ∈N

其中,φi (x )=u i (x )(Πx ∈R ,Πi ∈N )是严格递增的,因此效用形式的纳什均衡等价于下面形式的不等式:

Ea i (σ31,σ3-i )-R I (σ3i ,σ3-i )ΕEa i (σi ,σ3-i )-R I (σi ,σ3-i ),Πi ∈N.

(3)不等式(3)将效用形式的纳什均衡和收入形式的纳什均衡联系起来,而且从形式上可以看到两者是不相同的,差别就在于风险价格.

定理1　如果效用函数u i (Πi ∈N )满足假设条件(2),则收入形式博弈问题G 的纯策略纳什均衡必是效用形式博弈问题E 的纯策略纳什均衡;反之亦然.

证明:假设σ3=(σ3i ,σ3-i )是收入形式博弈的纯策略纳什均衡,因此,对任意的纯策略s i ,有

a i (σ3i ,σ3-i )Εa i (s i ,σ3-i )Πi ∈N

(4)对于混合策略σi ,a i (σi ,σ3-i )是取值于{a i (s i ,σ3-i )|s i ∈S i }上的随机变量,所以,

a i (σ3i ,σ3-i )一阶随机占优于a i (σi ,σ3-i ).根据假设(2),因此有

u i (a i (σ3i ,σ3-i ))Εu i (a i (σi ,σ3-i )),Πσi ∈M i

(5)即(σ3i ,σ3-i )是效用形式的纯策略纳什均衡.

反过来,假设(σ3i ,σ3-i )是效用形式的纯策略纳什均衡,即(3)式成立,σi 为纯策略s i ,则

R i (s i ,σ3-i )=0,同时R i (σ3i ,σ3-i )=0,因此由(3)式得到:

a i (σ3i ,σ3-i )Εa i (s i ,σ3-i )Πi ∈N

(6)

如果σi 为混合策略,σi =(p 1i ,p 2i ,…,

p k i i ),且∑k i j =1p j i =1,所以

Ea i (σi ,σ3-i )=

∑k i j =1p j i a i (s i ,σ3-i )Φa i (σ3i ,σ3-i )

也即σ3=(σ3i ,σ3-i )是收入形式的纳什均衡.证毕

此定理也说明纯策略的纳什均衡不随效用函数的变化而改变,甚至不管是预期效用函数还是非预期效用函数;也就是说,只要参与人的效用函数满足假设(2),不同参与人的博弈具有相同的纯策略纳什均衡.然而,混合策略的纳什均衡却不具有这一性质.

首先考虑预期效用形式的博弈问题,参与人预期效用函数的变化将改变看混合策略的纳什均衡.

例.考虑一个2人参加的博弈问题,其收入形式的描述为图1(a ).如果参与人的效用函数为u 1(x )=u 2(x )=x (即以收入作为效用,u ″1(x )=0说明参与人是风险中性的),则它有三个纯策略纳什均衡和四个真混合策略纳什均衡:((1,0,0),(1,0,0));((0,1,0),(0,1,0));

—

52—第4期李保明　刘家壮:效用函数与纳什均衡

((0,0,1),(0,0,1))和((0,01625,01375),(0,01444,01555));((01774,0,01225),(01757,0,01242));((01604,01277,01118),(01660,01106,01232));((01689,01310,0),(01800,01200,0)).收入形式模型:

参与人2参与人1

策略1

策略2策略3策略11100,2100

1100,01201150,060策略20150,1100

3100,51002100,2100策略3

0120,11200150,11004100,6100图1(a )

效用形式模型:

参与人2参与人1

策略1

策略2策略3策略119100,36100

19100,319627175,11160策略29175,19100

51100,7510036100,36100策略3

3196,221569175,1910064100,84100图1(b )

若参与人的效用函数变为u 1(x )=u 2(x )=20x -x 2(u ″1(x )<0,说明参与人是风险厌恶的),效用形式描述如图1(b ),它的纯策略纳什均衡不变,真混合策略纳什均衡变为:

((0,01625,01375),(0,01404,01595));((01716,0,01283),(01706,0,01293));((01549,01322,01128)(01613,01104,01281))和((01636,01363,0),(01775,01224,0)),可见,两者是不相同的.

这一例子说明,同样的博弈问题,不同的参与人会得不同的结果,这符合实际情况.许多经济学实验中同一博弈问题得到不同的博弈结果正是这种原因.这也说明,考虑纳什均衡选择问题时,混合策略的纳什均衡是至关重要的.

由于纳什均衡的预期效用形式定义和收入形式的定义类似,所以预期效用函数对纳什均衡的性质影响不大,比如它不改变纳什均衡的存在性和混合策略纳什均衡的非稳定性.

对于非预期效用形式的博弈问题,我们考虑严格拟凹和严格拟凸的两类用函数.它们将改变混合策略纳什均衡的非稳定性和存在性.Machina 考虑了大量的违反独立性公理的实验证据,并证明了几乎所有文献中出现的违反独立性公理的情形可用拟凹或拟凸的二次偏好函数来解释,Camerer (1989),Chew 和Waller (1986),以及Conlisk (1987)等人的实验也发现违反独立性公理的有力证据,并且其中的一半与拟凹的效用函数相符,另一半与拟凸的效用函数相符.在理论工作方面,Kreps 和Porteus (1979)等人曾提出证据表明效用函数的拟凸比拟凹更合理.

考虑参与人效用函数u i (σi ,σ-i )关于他自己策略σi 的拟凹(凸)性.u i (σi ,σ-i )关于策略σi 的严格拟凹性是指:对任意的σi ,σ′i ∈M i ,σi ≠σ′i 和σ-i ∈Πj ≠i

M i 有:u i (ασi +(1-α)σ′i ,σ-i )>min (u i (σi ,σ-i ),u i (σ′i ,σ-i ))

—62— 经济数学第17卷

成立,其中α∈(0,1).若-u i 关于σi 严格拟凹,则称u i 严格拟凸.

定理2　在博弈问题E 中,如果对任一参与人i ,其效用函数u i (σi ,σ-i )关于σi 是严格拟凹的,则博弈问题E 的真混合策略纳什均衡是稳定的.

证明:　设σ3是博弈问题的一真混合策略纳什均衡,它的稳定性是:任一参与人i ,σ3=(σ3i ,σ3-i )和Πσi ∈M i ,σi ≠

σ3i ,有u i (σi ,σ3-i )

现用反证法证明之.假设存在一个r 和σ′r ∈M r ,σ′r ≠

σ3r 使得u r (σ′r ,σ3-r )=u r (σ3r ,σ3-r ).

取σ∈(0,1),构造σ″r =ασ′r +(1-α

)σ3r ∈M r ,根据u r 的严格拟凹性,有,u r (σ″r ,σ3-r )>min {u r (σ′r ,σ3-r ),u r (σ3r ,σ3-r )}=u r (σ3r ,σ3-r ).

这与σ3=(σ3r ,σ3-r )是纳什均衡相矛盾.证毕

定理3　在博弈问题E 中,(1)如果某一参与人i 的效用函数u i 是严格拟凸的,则博弈问题E 的任一纳什均衡σ3=(σ3i ,σ3-i )中,σ3i 必是纯策略;(2)如果每一参与人i 的效用函数u i (σi ,σ-i )关于σi 都是严格拟凸的,则博弈问题E 没有真混合策略的纳什均衡.

证明:先证命题(1),用反证法,假设博弈问题E 的纳什均衡(σ3i ,σ3-i )中的策略σ3i 是真混合策略,则存在r (r Ε2)个大于零的数{p i 1i ,p i 2i ,…,p i r i }使得σ3i =∑r t =1s i t i p i t i ,且∑r

t =1p i t i =1,

根据效用函数u i (σi ,σ

3-i )关于σi 的严格拟凸,则u i (σ3i ,σ3-i )

这一不等式显然与(σ3i ,σ3-i )是纳什均衡相矛盾,命题得证.

根据命题(1),命题(2)显然成立.证毕

定理3导致一个重要结论,即博弈问题的收入形式模型不存在纯策略纳什均衡时,若参与人i 的效用函数u i (σi ,σ-i )关于σi 是严格拟凸的,则效用形式的模型E 不存在纳什均衡,这大大改变了纳什均衡存在性定理Ⅰ.

4.结论

通过上面的讨论,我们看到效用函数的变化对博弈问题的纯策略纳什均衡不产生影响,却改变真混合策略纳什均衡,甚至使其不存在.所以对只有一个纯策略纳什均衡的博弈问题来讲,无论参与人多么不同,他们有一个共同的纳什均衡,这一纳什均衡容易成为他们的一致性预期,这也是这类问题博弈结果容易达到纳什均衡的原因.因此,对于具有一个纯策略纳什均衡的博弈问题,我们不必要考虑参与人的效用特征.但是,对于收入形式含有多个纯策略纳什均衡或仅含有真混合策略纳什均衡的博弈问题(其实前者亦有真混合策略纳什均衡)来讲,参与人不同,博弈问题的真混合策略纳什均衡会发生变化,甚至会消失.这也是这类问题博弈的结果往往会得到不同的纳什均衡、甚至达到非均衡的原因.因此,要确定博弈问题的结果,必须考虑参与人的效用函数.参与人的效用函数的不同的会改变博弈问题的混合纳什均衡,进而影响博弈结果.所以研究纳什均衡的选择问题必须考虑参与人的偏好即效用函数.

—

72—第4期李保明　刘家壮:效用函数与纳什均衡

参　考　文　献

[1]　Camerer ,C.,An experimental test of several generalized utility theories ,Journal of Risk and U ncertainty ,2

(1989),61-104

[2]　Chew ,S.H.and Waller ,W.S.,Em pirical tests of weighted untility ,Journal of M athem atical Psychololgy ,

30(1986),55-72.

[3]　Conlisk ,J.,Verifying the betweennes axiom with questionnaire edidence ,or not :take your pick ,Economic

L etter ,25(1987),319-322.

[4]　Cooper ,R.,DeJong ,D.,Forsythe ,R.And Ross ,T.,Selection criteria in coordination games :some experimen 2

tal results ,A merica Economic Review ,80(1987),218-233.

[5]　Dasgupta ,P.And E.Maskin ,The existence of equilibrium in discontinuous economic games.1:Theory ,Pre 2

view of Economic S tudies ,53(1986),1-26.

[6]　Debreu ,D.,A social equilibrium existence theorem ,Proceeding of the N ational Academy of Seience ,38

(1952),886-893.

[7]　Fan ,K.,Fixed point and minmax theorems in locally convex topological linear spaces ,Proceeding of the N a 2

tional Academy of Science ,38(1952),121-126.

[8]　G ilicksberg ,I.L.,A further generalization of the kakutani fixed point theorem with application to nash equi 2

librium points ,Proceedings of the N ational Academy of Science ,38(1952),170-174.

[9]　Harsanyi ,J.and Selten ,R.,A General Theory of Equilibrium Selection in Games ,The MIT Press.1988.

[10]　Kreps.D.and Porteus ,E.,Tem poral Von Neumaun 2Morgensten and induced Pref erences ,Journal of Eco 2

nomic Theory ,20(1970),81-109.

[11]　Machina ,M.J.,Expected utility analysis without the independent axiom ,Economet rica ,50(1982),227-

323.

[12]　Nash ,J.,Equilibrium points in n 2person games ,Proceedings of the N ational Academy of Sciences ,36

(1950),48-49.

[13]　Wilson ,R.,Computing equilibrium of N 2person games ,S IA M Journal of A pplied M athem atics ,21(1971),

80-87.

[14]　Von Neumann ,J.and Morgenstern ,O.,Games and Economic Behavior Princeton University Press ,1944.UTIL ITY FUNCTION AN D NASH EQUIL IBRIUM

Li Baoming

(Institute of property ,S handong U niversity ,Jinan ,280100)

Liu Jiazhuang

(College of M athem atics ,S handong U niversity ,Jinan ,250100)

Abstract In this paper ,using utility functions we describe game as income and utility models ,establish relations of Nash equilibria and utility functions of players ,and obtain the conclusions :(1)changes of utility functions don πt alter the equlibria of pure strategies ,but do alter those of proper mixed stategies ;(2)when utility functions of players are quasiconcave ,the equlibria of proper mixed stategies are stable ;(3)when utility functions of players are quasiconvex ,the equilibria of proper mixed stategies do not exist.

K eyw ords Utility function ,game ,Nash equilibrium —82— 经济数学第17卷

平新乔《微观经济学十八讲》课后习题详解(策略性博弈与纳什均衡)

第10讲策略性博弈与纳什均衡 1．假设厂商A 与厂商B 的平均成本与边际成本都是常数，10A MC =，8B MC =，对厂商产出的需求函数是 50020D Q p =- （1）如果厂商进行Bertrand 竞争，在纳什均衡下的市场价格是多少？（2）每个厂商的利润分别为多少？（3）这个均衡是帕累托有效吗？解：（1）如果厂商进行Bertrand 竞争，纳什均衡下的市场价格是10B p ε=-，10A p =，其中ε是一个极小的正数。理由如下：假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ，那么必有10A p ≥，8B p ≥，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，A p 和B p 都不会严格大于10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足10A p ≤，10B p ≤。但是由于A p 的下限也是10，所以均衡时10A p =。给定10A p =，厂商B 的最优选择是令10B p ε=-，这里ε是一个介于0到2之间的正数，这时厂商B 可以获得整个市场的消费者。综上可知，均衡时的价格为10A p =，10B p ε=-。（2）由于厂商A 的价格严格高于厂商B 的价格，所以厂商A 的销售量为零，从而利润也是零。下面来确定厂商B 的销售量，此时厂商B 是市场上的垄断者，它的利润最大化问题为： max pq cq ε>- ①

其中10p ε=-，()5002010q ε=-?-，把这两个式子代入①式中，得到： ()()0 max 1085002010εεε>----???? 解得0ε=，由于ε必须严格大于零，这就意味着ε可以取一个任意小的正数，所以厂商B 的利润为： ()()500201010εε-?--????。（3）这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本，所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格，那么厂商B 的利润和消费者的剩余就都可以得到提高，同时又不损害厂商A 的剩余（因为A 的利润还是零）。 2．（单项选择）在下面的支付矩阵（表10-1）中，第一个数表示A 的支付水平，第二个数表示B 的支付水平，a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”，那么：表10-1 博弈的支付矩阵（1）1b >且1d < （2）1c <且1b < （3）1b <且c d < （4）b c <且1d < （5）1a <且b d <

博弈论与纳什均衡

《博弈论与纳什均衡理论》姓名张贺祺学号 2010010404 专业政治经济学指导老师张秉云

摘要博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法，也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。关键字：博弈论；纳什均衡；合作博弈；非合作博弈

目录摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) （一）博弈论的主要思想 (4) （二）博弈论的分类 (5) 三、经典案例 (7) （一）博弈论的经典案例 (7) （二）纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) （一）博弈论的重要影响 (8) （二）纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论一、引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。 1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。博弈论（Game Theory）:亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：（Nash equilibrium）又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。二、博弈论与纳什均衡的主要内容（一）博弈论的主要思想一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P：为局中人，博弈的参与者，也称为博弈方，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。决策人：在博弈中率先做出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者：在博弈二人对局中行动滞后的那个人，与决策人要做出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。他的策略可能依赖于决策人劣势的策略选择，因此对

平新乔《微观经济学十八讲》课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第 10 讲策略性博弈与纳什均衡跨考网独家整理最全经济学考研真题，经济学考研课后习题解析资料库，您可以在这里查阅历年经济学考研真题，经济学考研课后习题，经济学考研参考书等内容，更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验，从前辈中获得的经验对初学者来说是宝贵的财富，这或许能帮你少走弯路，躲开一些陷阱。以下内容为跨考网独家整理，如您还需更多考研资料，可选择经济学一对一在线咨询进行咨询。 1．假设厂商 A与厂商 B的平均成本与边际成本都是常数， MC A 10， MC B 8，对厂商产出的需求函数是 Q D 500 20p （ 1）如果厂商进行 Bertrand 竞争，在纳什均衡下的市场价格是多少？（ 2）每个厂商的利润分别为多少？（ 3）这个均衡是帕累托有效吗？解：（1）如果厂商进行 Bertrand 竞争，纳什均衡下的市场价格是 p B 10 ， p A 10 ，其中是一个极小的正数。理由如下：假设均衡时厂商 A 和 B 对产品的定价分别为 p A 和 p B ，那么必有 p A 10 ， p B 8 ，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，p A和 p B 都不会严格大于 10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足p A 10， p B 10。但是由于 p A 的下限也是10，所以均衡时 p A 10。给定 p A 10，厂商 B的最优选择是令 p B 10 ，这里是一个介于 0到2 之间的正数，这时厂商 B可以获得整个市场的消费者。综上可知，均衡时的价格为p A 10 ， p B 10 。（ 2）由于厂商 A 的价格严格高于厂商 B 的价格，所以厂商 A 的销售量为零，从而利润也是零。下面来确定厂商 B 的销售量，此时厂商 B是市场上的垄断者，它的利润最大化问题为： max pq cq ① 其中 p 10 ，q 500 20 10 ，把这两个式子代入①式中，得到： max 10 0 8 500 20 10 解得0 ，由于必须严格大于零，这就意味着可以取一个任意小的正数，所以厂商 B的利润为： 500 20 10 10 。（3）这个结果不是帕累托有效的。因为厂商 B 的产品的价格高于它的边际成本，所以如果厂商 B和消费者可以为额外 1 单位的产品协商一个介于 8 到10 之间的价格，那么厂商 B 的利润和消费者的剩余就都可以得到提高，同时又不损害厂商 A的剩余（因为A 的利润还是零）。

纳什均衡

纳什均衡简介纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。一个策略组合被称为纳什均衡，当每个博弈者的均衡策略都是为了达到自己期望收益的最大值，与此同时，其他所有博弈者也遵循这样的策略。纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是约翰·纳什在普林斯顿大学攻读博士学位时完成的。实际上，博弈论的研究起始于1944年冯·诺依曼（ Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“ 非合作博弈”做了明确的区分和定义。阿尔伯特·塔克（Albert tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。在概念和方法两方面，该论文都是作者的独立创造。” 纳什均衡例子博弈论中一个著名的例子就是囚徒困境。囚徒困境是一个非零和博弈，说的是两个嫌疑犯甲和乙私人民宅联手作案，被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑3个月，对方将被判刑10年；若两人都不招供则因未获证据但私人民宅将各拘留1年；如果两人均招供，每人将被判刑5年。于是，两个人同时陷入招供还是不招供的两难处境。结果是，尽管甲不知乙是否招供，但他认为自己选择“招供”最好，因而甲会选择“招供”，同样乙也会选择“招供”，两人各判5年。而两人都选择不招供，虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年；乙判刑三个月不招供

博弈论和纳什均衡

关于博弈论和纳什均衡你应该知道这些美股腾讯财经[微博]2015-05-25 10:05 我要分享 139 [摘要]纳什在与命运的博弈中找到均衡，纪念大师最好的方式就是尝试了解博弈论。腾讯财经综合报道（风生）奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸，两人均不幸遇难。事发当时，这辆出租车失控撞向栏杆，两人均被抛出车外。约翰-纳什因发表两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生，曾在麻省理工学院任教，晚年为普林斯顿大学担任数学系教授，死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名，1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。纳什在数学领域上取得多项突破，但他同时深受精神分裂症困扰，其生平故事在2001年被改编成电影《美丽心灵》，赢得包括最佳电影在内的4项奥斯卡奖项。尽管西维亚-纳萨斯（Sylvia Nasars）广为人知的小说《美丽心灵》（A Beautiful Mind）和改编自该书的、由拉塞尔-克罗（Russell Crowe）主演的

同名奥斯卡电影探究了纳什错综复杂的生平，但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界，人们普遍认为，与牛顿和爱因斯坦的数学理论相比，纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题，而纳什的数学却可以应用在生物学和社会学领域。如若不是精神疾病的困扰，纳什今天可能已与那些科学伟人齐名。尽管如此，他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就，他与约翰海萨尼（John Harsanyi）和莱茵哈德-泽尔腾（Reinhard Selten）一起获得了1994年诺贝尔经济学奖。什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰-纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。近代对于博弈论的研究，开始于策墨咯，波雷尔及冯-诺伊曼。1928年，冯-诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯-诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰-福布斯-纳什利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1 ?假设厂商A与厂商B的平均成本与边际成本都是常数，MC A=10， MC B =8，对厂商产出的需求函数是 Q D二500 -20 p (1)如果厂商进行Bertrand竞争，在纳什均衡下的市场价格是多少？ (2)每个厂商的利润分别为多少？ (3)这个均衡是帕累托有效吗？解：(1)如果厂商进行Bertrand竞争，纳什均衡下的市场价格是p B =10 一；，p A =10 , 其中；是一个极小的正数。理由如下：假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，p A和p B都不会严格大于10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足p A空10 , p B?「0。但是由于p A的下限也是10,所以均衡时P A =10。给定P A =10 ,厂商B的最优选择是令 P B =10- ；，这里：是一个介于0到2 之间的正数，这时厂商B可以获得整个市场的消费者。综上可知，均衡时的价格为P A =10 , P B =10 -；。 (2)由于厂商A的价格严格高于厂商B的价格，所以厂商A的销售量为零，从而利润也是零。下面来确定厂商B的销售量，此时厂商B是市场上的垄断者，它的利润最大化问题为： max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中，得到： max (10 —芯―)500 —20(10 —名卩解得；=0,由于；必须严格大于零，这就意味着；可以取一个任意小的正数，所以厂商 B 的利润为：||500-20 10 -; 10-;。 (3)这个结果不是帕累托有效的。因为厂商B的产品的价格高于它的边际成本，所以如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一；之间的价格，那么厂商B的利润和消费者的剩余就都可以得到提高，同时又不损害厂商A的剩余(因为A的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1 )中，第一个数表示A的支付水平，第二个数表示B的支付水平，a、b、c、d是正的常数。如果A选择“下”而B选择“右”，那么： (1) b .1 且 d ：：：1

纳什均衡的应用

纳什均衡的应用 1．考虑不对称的古诺双头垄断，市场反需求函数为Q p -=115，A 企业生产的固定成本为1000，B 企业没有固定成本，A 和B 两个企业的可变成本分别为2a q 和2b q 。（1）请写出A 公司的古诺反应函数的表达式。（2）请写出B 公司的古诺反应函数的表达式。（3）请求出纳什均衡时两个企业的产量和利润。 2．在贝特兰德模型中，假定每个企业的最大生产能力是K ，单位生产成本为c ＝10，需求为100，如果两个企业的价格相同，市场需求在二者之间平分；如果j i P P < (i ，j ＝1，2，i ≠j)，企业i 产量为Min{100-P i ，K}，企业j 的产量为Min[Max(0，100-P i -K)，K](即只有低价企业不能满足需求时，高价企业才生产，并且产量不超过生产能力)。 (1)求企业的得益函数； (2)假定300，即两国税收的替代系数。假定两国是同时决策，征税的边际成本为c 1，c 2>0，无固定成本。试求解该博弈问题的纳什均衡。 7．五户居民都可以在一个公共的池塘里放养鸭子。每只鸭子的收益v 是鸭子总数N 的函数，并取决于N 是否超过某个临界值N ；如果N N <，收益N N v v -==50)(；如果N N ≥时，0)(=N v 。再假设每只鸭子的成本为c ＝2元。若所有居民同时决定养鸭的数量，问该博弈的纳什均衡是什么？ 8．一群渔夫在一个特定有限的区域内集体作业。该区域捕鱼的回报依赖于整体的总作业时

纳什均衡

1.纳什均衡：给出对方的策略，你所选的是最优的（至少不比其它策略差），如果每个局中人都是这样，那么所构成的策略组合（对局），就称为纳什均衡。 2.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。 3.边际产量：当其他要素不变时，可变要素增加一个单位所带来的总产量的增加量。 4.生产成本：经营一个企业，为达到利润最大化，必须支付一些资金来维持运营，如建造厂房，采购机器及原料，雇用员工等支出都可视为厂家的生产成本。 5.帕累托标准：如果一种变化可以改善某些人的处境，同时对其他人都没有伤害。则这种变化是好事，应该给予实行。 6.恩格尔系数：是食品支出总额占个人消费支出总额的比重。一个家庭收入越少，家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大，随着家庭收入的增加，家庭收入中或者家庭支出中用来购买食物的支出将会下降。恩格尔系数是用来衡量家庭富足程度的重要指标。 7.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。 8.价格管制：是指政府对新药定价以及上市药品价格上涨实施严格的管制，企业不能自由定价，而是由政府和制药企业谈判决定新药的价格。 9.软着陆：当一个国家经过强劲的经济增长后，仍维持缓和的增长，并未因此转入衰退，即使“软着陆”。 10.硬着陆：一个国家的经济在高速增长的同时伴随着高度通货膨胀，使得经济迅速从增高长直接走入低增长甚至衰退。 11.通货膨胀：平均物价水平持续上扬的状态，通货膨胀率通常是以消费者物价指数（CPI）的变化率来表示。指数上升→物价上升，货币购买力下降。 12.再贴现率：一般商业银行可以直接向中央银行借贷的利率。所谓“贴现”：通过一定的方式把发生在未来（或不同时间）的费用和效益转化为现值的方式就叫贴现。 13.机会成本：在资源一定的情况下，多生产一个单位的某种产品，就要以少生产若干单位的另一种产品为代价。这种放弃若干单位另一种产品生产的代价，就是生产某种成品的机会成本。 14.需求价弹性价格：指在市场需求曲线的任何一点，价格每变动1%所导致的需求量变动的百分比。它是衡量产品需求量对产品价格变动的敏感指标。 15.生产函数（生产成本）：企业在每个时期投入的各种生产要素的数量与获得的产出品的数量之间的关系。 16.均衡及均衡价格：均衡：供给和需求达到平衡的状态。均衡价格：供需平衡时的价格。有时被称为市场出清价格。 17.资源的概念及分类：指用于生产能满足人类需要的东西的那些物品或劳务。分类：自由资源和经济资源 18.恩格尔曲线：某种商品的均衡购买量与消费者货币收入之间的关系。 1.药物需求与供给的特征：需求的特征：需求的不确定性、需求的最高优先性、需求的不可替代性、需求的外部效应性、需求缺乏弹性、需求的被动性、独特的需求三方结构供给的特征：高质量性、高技术性、高投入性、高风险性、高回报性、高度集中性 2.影响药品需求的因素有哪些：（一）一般经济学因素：1.经济发展水平；2.价格水平（1）是否实施医疗保障制度（2）医疗保障制度下保障的范围（3）医疗保障制度的报销制度和自付比例等（二）社会人口学因素（三）流行病学因素（四）临床医生和药师因素（五）医药技

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1．假设厂商A 与厂商B 的平均成本与边际成本都是常数，10A MC =，8B MC =，对厂商产出的需求函数是 50020D Q p =- （1）如果厂商进行Bertrand 竞争，在纳什均衡下的市场价格是多少？（2）每个厂商的利润分别为多少？（3）这个均衡是帕累托有效吗？解：（1）如果厂商进行Bertrand 竞争，纳什均衡下的市场价格是10B p ε=-，10A p =，其中ε是一个极小的正数。理由如下：假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ，那么必有10A p ≥，8B p ≥，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，A p 和B p 都不会严格大于10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足10A p ≤，10B p ≤。但是由于A p 的下限也是10，所以均衡时10A p =。给定10A p =，厂商B 的最优选择是令10B p ε=-，这里ε是一个介于0到2之间的正数，这时厂商B 可以获得整个市场的消费者。综上可知，均衡时的价格为10A p =，10B p ε=-。（2）由于厂商A 的价格严格高于厂商B 的价格，所以厂商A 的销售量为零，从而利润也是零。下面来确定厂商B 的销售量，此时厂商B 是市场上的垄断者，它的利润最大化问题为： max pq cq ε>- ① 其中10p ε=-，()5002010q ε=-?-，把这两个式子代入①式中，得到： ()()0 max 1085002010εεε>----???? 解得0ε=，由于ε必须严格大于零，这就意味着ε可以取一个任意小的正数，所以厂商B 的利润为：()()500201010εε-?--????。（3）这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本，所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格，那么厂商B 的利润和消费者的剩余就都可以得到提高，同时又不损害厂商A 的剩余（因为A 的利润还是零）。 2．（单项选择）在下面的支付矩阵（表10-1）中，第一个数表示A 的支付水平，第二个数表示B 的支付水平，a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”，那么：表10-1 博弈的支付矩阵

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石，对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。本文首先将博弈划分为不同的类型，并对主要的均衡概念进行了数学描述，最后对不同的均衡概念进行了比较。【关键词】博弈论；纳什均衡；重复博弈博弈论在现代经济学中占据着相当重要的位置，在微观经济学的本科教学环节中，如果将博弈论这一部分排除在外，那么教学内容是不完整的，并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制，对博弈论的内容进行全面深入地讲解难以做到，因此，将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中，最重要的当属博弈均衡的概念，这些概念的掌握有助于学生把握博弈论的整体框架，并对博弈论的后续学习至关重要。因此，本文将主要的博弈均衡概念进行分类和表述，并对不同的博弈概念进行比较，以期对博弈论的教学有所助益。一、博弈的主要类型博弈构成的基本要素包括：1、参与人（1～N）；2、各个参与人各自可选择的行动集合Ai={ai}；3、参与人i的策略Si，给定信息集，该策略决定在博弈的每一阶段他选择的行动；4、参与人的收益Ui （S1，S2…SN）。依据不同的分类标准，博弈可以被划分为不同的类型。 1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈，如猜硬币、投标等，静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择，典型的例子如对弈，动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。重复博弈是指同一个博弈（静态或动态）反复进行所构成的博弈过程，如体育比赛中的多局赛制等。 2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈，不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。 3、完美信息和不完美信息博弈在动态博弈中，一参与人完全了解在自己行为之前的博弈进程，则称此参与人为有完美信息的参与人，如果博弈中所有的参与人都具有完美信息，则称此动态博弈为完美信息的动态博弈。反之，如果在存在具有不完美信息的参与人（参

纳什均衡的重要影响及其问题局限

研究领域：微观经济学纳什均衡的重要影响及其问题局限高红阳（东北师范大学传媒科学学院，吉林长春 130117；吉林大学管理学院博士生，吉林长春 130022）摘要：纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，其对经济学以及其他社会科学甚至自然科学产生了重要影响。尽管纳什均衡理论及其应用得到了空前的肯定，但近年来纳什均衡分析却遭到了前所未有的质疑。论文从理性前提、犯错误、多重性、静态分析、动态分析、期望效用等六个角度论述了目前理论所存在的问题局限，而且将学界尝试解决上述问题的有限理性、好像理性、颤抖手均衡、聚焦均衡、风险占优均衡、帕累托最优均衡、防联盟均衡、相关均衡等方法一并加以讨论阐述。关键词：纳什；纳什均衡；局限博弈论（game theory）研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，纳什均衡（Nash Equilibrium）是博弈解的一般名称，是当前博弈理论体系的核心概念。从1994年纳什（Nash）、泽尔腾（Selten）和海萨尼（Harsanyi）三位博弈论专家获得诺奖，博弈论一直是十余年来学界最活跃的研究领域之一，被经济学、政治学、生物学、军事学等许多学科奉为重要的方法论基础。 1纳什均衡的重要影响 1.1纳什及纳什均衡的得来纳什1928年生于美国西弗吉尼亚州。关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是纳什在普林斯顿大学攻读博士学位时完成的。实际上，博弈论的研究起始于1944年冯·诺依曼（Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“非合作博弈”做了明确的区分和定义。图克（Tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。在概念和方法两方面，该论文都是作者的独立创造。” 1.2纳什均衡的重要影响纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，正如克瑞普斯（Kreps，1990）在《博弈论和经济建模》一书的引言中所说，“在过去的一二十年内，经济学在方法论以及语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面（谢识予，1999）：（1）改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等，均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域，改变了这些学科领域的内容和结构，成为这些学科领域的基本研究范式和理论分析工具，从而改变了原有经济学理论体系中各分支学科的内涵。（2）扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济

博弈论与纳什均衡

第22卷哈尔滨师范大学自然科学学报 Vol .22,No .42006 第4期 NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY 博弈论与纳什均衡郭　鹏 (中国矿业大学) 杨晓琴 (鸡西大学) 【摘要】　纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础. 关键词:博弈论;纳什均衡;非合作博弈收稿日期:2006-02-15 0　引言博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具. 简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(U tility ),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈. 1　博弈论的主要思想一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失. 博弈论模型可以用五个方面来描述:G ={P,A,S,I,U ) P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标. A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.

3-混合策略的纳什均衡

博弈论教学/混合策略的纳什均衡出自MyKnowledgeBase < 博弈论教学 Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡目录 ■1 复习 ■2 混合策略(Mixed strategy) ■2.1 举例/Example ■2.2 概念 ■2.3 纯策略和混合策略 ■2.4 混合策略的争议 ■3 混合策略的纳什均衡 ■3.1 基本概念 ■3.2 混合策略纳什均衡的存在性/纳什定理 ■3.3 学术争议与批评 ■4 混合策略纳什均衡举例 ■4.1 社会福利博弈Social Welfare Game ■4.1.1 博弈分析(方法1:收益无差异) ■4.1.2 博弈分析（方法2：图形分析法） ■4.1.3 博弈分析(方法3：导数(Derivative)极值法) ■4.2 普通例子 ■4.3 审计博弈(Tax Game) ■4.4 激励的悖论[5] ■4.5 求解纳什均衡的一般方法 ■5 多重纳什均衡 ■5.1 多重纳什均衡举例 ■5.1.1 夫妻之争 ■5.1.2 制式问题 ■5.1.3 市场机会博弈 ■5.2 多重纳什均衡分析 ■5.2.1 帕累托上策均衡（Pareto Dominated Equilibrium） ■5.2.1.1 帕累托最优Pareto optimality ■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.3 举例分析 ■5.2.2 风险上策均衡(Risk-dominant Equilibrium) ■5.2.3 聚点均衡(Focal Points Equilibrium) ■5.2.4 相关均衡 ■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义 ■7 作业 ■8 参考文献

对策论中的纳什均衡应用

对策论中的纳什均衡应用相对于对策论中的其他模型方法，博弈论是一种独特的处于各学科之间的研究人类决策行为的方法，或者是研究人们在互动情况下所采取的策略，在现实生活的选择中，我们会经常运用使用博弈去选择策略，无论是自觉的还是无意识的。本文主要探讨博弈博弈论中的纳什均衡在对策论中的应用，即在不确定条件下，人们所冒的风险很大，这种情况选择合适的战略就显得尤为关键和重要。 1.博弈论中的纳什均衡以博弈论中，以经济主体人的自利行为以及相应的市场反应作为研究的出发点，无论是消费者还是生产者，也无论是竞争形势还是垄断形势，基本上是经济主体人面对市场做出自己的最优决策。但是我们知道，作为主体人作出决策时，不但要面对市场，还要面对作为竞争对手的其他经济主体，因此主体人作出决策的后果，则是主体人自己的决策及竞争对手决策的共同的结果，这就是博弈，它有一个前提，即理性人的假定。纳什均衡是一种不确定条件下的博弈，即非合作、不完全信息下的博弈，又叫做非合作博弈均衡，是博弈论的一个重要术语，因约翰·纳什而得名。它的定义可以这样理解：假设有n个局中人参与博弈，在给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于、也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种策略组合：这种策略组合由所有参与人最优策略组成，即在给定另人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上是说是一种非合作博弈状态。 2.纳什均衡及其在对策论中的应用 2.1囚徒困境及其应用博弈论中一个很著名的例子——囚徒困境，就是一具典型的纳什均衡。两个小偷在行窃现场附近被抓获并被警方隔离拷问。每个小偷都必须选择是否坦白和揭发对方。如果两个小偷都不坦白，他们都将判刑1年，如果每个小偷都坦白并揭发对方，他们都将判刑10年，但是，如果一个坦白并揭发对方，而另

智猪博弈论与纳什均衡

智猪博弈理论介绍在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同)，而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择：

从矩阵中可以看出，当大猪选择行动的时候，小猪如果行动，其收益是1，而小猪等待的话，收益是4，所以小猪选择等待；当大猪选择等待的时候，小猪如果行动的话，其收益是-1，而小猪等待的话，收益是0,所以小猪也选择等待。综合来看，无论大猪是选择行动还是等待，小猪的选择都将是等待，即等待是小猪的占优策略。在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。这时候有所不为才能有所为！高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。博弈与制度由智猪博弈故事得到的启示在这个例子中，对小猪而言，无论大猪是否踩动踏板，不去踩踏板总比踩踏板好。反观大猪，明知小猪不会去踩踏板，但是去踩踏板总比不踩强，所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中，每一方都要想方设法攻击对方、保护自己，最终取得胜利；但同时，对方也是一个与你一样理性的人，他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学，博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说，博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问，因此也有人把它称为“对策论”。

纳什均衡的启示及其应用

纳什均衡的启示及其应用【摘要】本文介绍了博弈论中的纳什均衡——非合作博弈的概念、进化、原理和现象，并列举了纳什均衡理论在社会生活、经济生活以及企业管理等方面的应用和作用机理，从而论证了纳什均衡的理论研究意义和其在实践中的价值。【关键词】纳什均衡企业人才流失商业价格竞争环境污染贸易壁垒 “博弈”一词是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语。天才数学家纳什深入研究了非合作领域的博弈现象，对博弈论做出了杰出的贡献。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡是完全信息静态博弈解的一般概念，是最常见的均衡，是非合作对策中的一种自然趋向解。纳什均衡理论彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石。一、纳什均衡的进化 “纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。著名的“囚徒故事”中两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲，勿施于我。其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。博弈论在现实中的应用很多。首先，它是一种数学理论，可以用于经济学等领域；再者，它作为一种理论，并非产生直接