寻租理论三方博弈模型分析

寻租理论三方博弈模型分析
寻租理论三方博弈模型分析

第11期(总第216期) 2001年11月

财经问题研究

Research on Financial and Economic Issues

Number11(General Seri al No1216)

November,2001

寻租理论三方博弈模型分析

王性玉1,薛来义2

(11河南大学管理学院,河南郑州450000;21辽宁省人大,辽宁沈阳110032)

摘要:寻租活动导致资源的浪费和产生腐败,现有的政治学和经济学研究都存在着一定的不足,主要是研究对象的局限性和缺乏相互关系研究。本文以博弈论作为分析工具研究委托人、代理人、寻租者三方的合作及非合作博弈,在理性经济人和风险中性假设下,建立三方博弈模型,通过求解纳什均衡,给出各参数变量的政策含义,进而给出寻租、腐败现象的治理对策。

关键词:寻租;博弈;纳什均衡

中图分类号:F06114文献标识码:A文章编号:1000-176X(2001)11-0014-04

一、引言

从整个社会角度讲,人类追求自身经济利益的行为大致可分为两类:一类是生产性活动,如人们从事生产、研究与开发活动以及在正常市场条件下的公平交易活动等,这类活动一般会增进社会福利,推动社会的发展;另一类是非生产性(也叫分配性)活动,这些非生产性活动的大部分不仅不增加社会财富,反而会造成社会经济资源的白白浪费,如偷盗、行贿受贿等。

在现代社会中,更为常见且影响更广的非生产性活动是那种涉及到权钱交易的活动,即个人或利益集团为牟取自身经济利益,而对政府决策或政府官员行为施加影响的活动。1974年,美国经济学家安妮#克鲁格发表在5美国经济评论6上的一篇论文第一次用/寻租0这一概念对这种现象进行概括,戈登#塔洛克的5对寻租活动的经济分析6首次从理论上系统分析了这种非生产性经济活动。由于寻租是指那种利用资源并通过政治过程获得特权从而构成对他们利益的损害大于租金获得者收益的行为,这一概念的发现使长期停滞的政府行为的研究迅速繁荣起来。现在,寻租理论已跨越经济学而进入到政治学、社会学和对文化的研究领域,拥有越来越大的现实解释力。

在布坎南看来,政府的特许、配额、许可证、特许权分配等这些密切相关的词中每一个都意味着由政府造成的任意的或人为的稀缺,这种稀缺意味着租金的潜在性,又意味着寻租活动的可能性。寻租活动的共同特征是:一是它们造成经济资源配置的扭曲,阻碍了更有效的生产方式的实施;二是它们本身白白地浪费了社会的经济资源,使本来可以用于生产性活动的资源浪费在这些无益于社会发展的活动上;三是这些活动还会导致其他层次的寻租或避租。如果政府官员在这些活动中享受了特殊利益,他们的行为就会受到扭曲,因为这些特殊利益的存在会引发下一轮追求行政权力的非生产性竞争。由此可见,寻租活动不仅浪费了大量的经济资源,而且是社会腐败产生的根源之一。那么如何治理腐败,减少寻租现象的发生,就成了近年来经济学研究的一个热点问题。

寻租理论虽然从经济学角度为解释腐败提供了一种理论选择,把研究的范围扩大到了寻租者,较政治学研究腐败问题进了一步,但主

*收稿日期:2001-06-27

作者简介:王性玉(1963-),男,河南商丘人,副教授,西南交通大学经济管理学院博士生。

要以寻租者作为主体,腐败只是一种/管理资源制度0的伴生物,腐败的另一主体)))资源权力作用者不作为主要研究对象,公共权力(稀缺性公共资源处置权)的最终拥有者(委托人)这一主体与公共权力使用者(代理人)和公共权力需求者(寻租者)的关系问题研究甚少。更是忽视了他们行为之间的联动性和相互影响。本文主要以博弈论作分析工具,研究代理人和寻租者之间的非生产性活动的收益和成本,以及委托人如何针对这种非生产性活动产生的腐败问题进行检查和监督。在理性经济人和风险中性的假设下,建立三方之间的博弈模型,通过求解纳什均衡给出各参数变量的政策含义,进而给出寻租活动的治理对策。

二、模型假设与模型表述

寻租活动产生的腐败问题以及委托人对此的监管,构成了一个三方博弈。涉及到的主体(参与人)有委托人)))公共权力的最终拥有者;代理人)))公共权力的使用者,在我国为政府官员及公务人员,他们受人民的委托拥有公共权力的使用权或处置权;寻租者)))对公共权力所限制的资源以不法方式获取的需求者。代理人和寻租人之间的关系,表现为设租人与寻租人之间的合作博弈关系,到底是先设租后寻租或是先寻租后设租这些具体问题要视具体情况而定,只要双方有利可图,寻租活动就有可能发生,在合作剩余的分配中,双方通过讨价还价或达成一种默契来解决。当然设)租双方的合作剩余等于委托人的净损失,委托人为了自身利益的最大化,会对寻租活动进行检查和监管,并对它们处以适当的惩罚。

设A是委托人与代理人之间通过契约达成的权力委托变量,A的市场价值(例如通过拍卖的出租车牌照价格)为V,在一次权力交换中代理人以Y的价格让渡A于寻租者,那么,当

11V-Y=0时,我们说代理人对委托人尽职尽责。

21V-Y>0时,我们说代理人对委托人不尽责。如果寻租以Y的价格得到A,而给代理人行贿C,且代理人同意在接受C后以Y 的价格让渡权力变量A,则称代理人腐败,C 是委托代理契约之外的代理人收益,$=V-Y>0为委托人损失,一般情况下应有Y+C [V成立。

31V-Y<0不成立,需求者若在市场上能以V的价格购入A则不会以Y>V的价格从代理人处购入A。

博弈模型假设如下:

(1)代理人和寻租者进行寻租活动,且委托人不稽查。则代理人、寻租者、委托人的支付分别为C、V-Y-C、-(V-Y)。

(2)代理人和寻租者进行寻租活动,委托人稽查但不成功,则三者的支付分别为C、V -Y-C、-(V-Y)-S,其中S为稽查成本。

(3)代理人和寻租者进行寻租活动,委托人稽查且查证成功,对代理人收益C处以K 倍罚款。对寻租者收益(V-Y)处以L倍罚款,则三者支付分别为-(K-1)C、-(L -1)(V-Y)-C、KC+L(V-Y)-S。

(4)代理人和寻租者不进行寻租活动,委托人也不稽查,则三者支付分别为0、0、0。

(5)代理人和寻租者不进行寻租活动,委托人进行稽查,则三者支付分别为0、0、-S。

(6)P v为代理人和寻租者进行寻租活动的概率。

(7)P c为委托人进行稽查的概率。

(8)P A为委托人进行稽查且查证成功的概率。

在上述假设之下,代理人、寻租者和委托人三方博弈模型如下:

寻租活动

(P v)

正常工作

(1-P v)

委托人

稽查(P c)

证实违规

(P A)

未查出违规

(1-P A)

(1-P c)

-(K-1)C

-(L-1)(V-Y)-C

KC+L(V-Y)-S

C

V-Y-C

-(V-Y)-S

C

V-Y-C

-(V-Y)

-S

-S

15

寻租理论三方博弈模型分析

三、模型求解

11给定代理人参与寻租活动的概率P V的情况下,委托人进行稽查和不进行稽查的预期收入分别为:

P1=P V{1KC+L(V-Y)-S2P A+(1-P A)#(-V+Y-S)}+(1-P V)1-S

@P A-S(1-P A)2

P2=P V1-(V-Y)2+O@(1-P V)

当委托人进行稽查和不进行稽查的预期收益无差异时,就得到委托人在博弈均衡时代理人和寻租者进行寻租活动的最优概率。

令P1=P2,且B=1KC+L(V-Y)-S2P A +(1-P A)(-V+Y-S)

则,P V#B+(1-P V)(-S)=-P V(V-Y) ]P V#B+P V#S+(-S)=-P V(V-Y)

]P V#B+P V#S+P V(V-Y)=S

]P V=S

B+S+V-Y

=

S

P A1KC+(L+1)(V-Y)2

21在给定委托人稽查的概率P C的情况下,代理人参与寻租活动和正常工作的预期收入分别为:

P3=P C1-P A(K-1)C+(1-P A)C2+(1

-P C)C

P4=0

当代理人参与寻租活动和正常工作的预期收入无差异时,可得到代理人在博弈均衡时委托人进行稽查的最优概率。

令:P3=P4=0,则P C1-P A KC+P A C+C-

P A C2+C-P C C=0

]C=P C1P A KC-C2+P C C

=P C1P A K#C-C+C2=P C P A KC ]P*C=1

P A K

31在给定委托人稽查的概率P C的情况

下,寻租人进行寻租活动和不进行寻租活动的预期收入分别为:

P5=P C{P A1-(L-1)(V-Y)-C2+(1-P A)(V-Y-C)}+(1-P C)(V-Y-C)

P6=0

当寻租者进行寻租活动和不进行寻租活动的预期收入无差异时,可得到寻租者在博弈均衡时,委托人进行稽查的最优概率。

令P5=P6=0,则P C1(-P A(L-1)(V-Y) -P A C+V-Y-C-P A(V-Y-C)2+V-Y-C-P C(V-Y-C)=0

]V-Y-C=P C(V-Y-C)+P C P A(L-

1)(V-Y)+P C P A C-P C(V

-Y-C)+P C P A(V-Y-

C)=P C P A L(V-Y)

]P*C=V-Y-C

P A L(V-Y)

由此,我们所建立的博弈模型的混和战略纳什均衡为

P*V=S

P A1KC+(L+1)(V-Y)2,

P*C

=

1

P A K

或者是

P*V=

S

P A1KC+(L+1)(V-Y)2

,P*C

=

V-Y-C

P A L(V-Y)

四、均衡解的理论指导意义

11代理人和寻租者进行寻租活动均衡概率的指导意义。模型的均衡表示代理人和寻租者将以最优概率P*V选择违规操作并获取相应的额外收益,如果代理人和寻租者选择以概率P V>P*V进行违规操作,那么委托人的最优选择就是稽查,反之,就不进行稽查;如果代理人和寻租者选择以概率P V=P*V进行违规操作,那么委托人的最优选择就随机地选择稽查或者不稽查。

博弈模型的混合战略纳什均衡条件中,代理人和寻租者采取违规操作的最优概率P*V=

S

P A1KC+(L+1)(V-Y)2

,取决于S、P A、K、C、L、V、Y几个变量,其中采取违规操作时,寻租者的行贿成本或代理人收益C和寻租者收益V-Y独立于我们的模型之外,这里可以将它们视为固定不变,我们所能够通过各种方式去改变的是S、P A、K、L这四个变量,通过它们的

16财经问题研究2001年第11期总第216期

变化去影响代理人和寻租者的违规活动概率。由于代理人和寻租者采取违规操作的最优概率同稽查成本S成正比,同P A、K、L成反比例关系,因此设法降低稽查成本S,提高对代理人和寻租者的惩罚系数K、L,以及改进稽查质量以提高对违规活动的查证效率P A,将会有效地降低代理人和寻租者进行违规活动的频度。

21委托人进行监督稽查均衡概率的指导意义。对委托人而言,选择最优的概率进行稽查取决于代理人或寻租者的价值取向,以及寻租活动中利益最大化的倾向性。

(1)代理人利益最大化倾向的情况。如果寻租活动中,把代理人的利益放在第一位,寻租者的利益放在第二位,则委托人将以最优概率

P*C=

1

P A K选择稽查。如果委托人选择以P C>

P*C的概率进行稽查,那么代理人的最优选择为正常工作,不接受寻租者的贿赂;如果委托人选择以P C

机地进行违规操作。从P*C=

1

P A K

中看出,这时

委托人最优稽查的概率取决于P A、K两个变量,最优稽查概率与P A、K成反比。因此,设法改进稽查质量以提高查证效率P A和加大对代理人违规收益的惩罚系数K,可有效降低委托人的最优稽查概率。

(2)寻租者利益最大化倾向的情况。如在寻租活动中,把寻租者利益放在第一位,代理人利益放在第二位,则委托人将以最优概率P*C= V-Y-C

P A#L(V-Y)

选择稽查。如果委托人选择以P C >P*C的概率进行稽查,那么寻租者的最优选择为不进行寻租活动;如果委托人选择以P C> P*C的概率进行稽查,那么寻租者的最优选择是进行寻租活动,行贿于代理人,以取得租金收益;若P C=P*C,那么寻租者将随机地进行寻租活动。由于寻租者的寻租成本C和寻租收益V-Y独于概率P*C的分析之外,将其作为固定常数看待。因此,为了降低委托人的最优监管概率P*C,只有在改进稽查质量以提高查证效率P A和加大对寻租人寻租活动的惩罚系数L上下功夫。

最后需要说明的是本模型进行的博弈分析假定是一次性的静态博弈,且没有考虑代理人的契约收入(工资)的高低,如果把工资收入这个变量考虑进去,且如果委托人对其的处罚涉及到官员或公务员的职位问题,则代理人在参与寻租腐败等活动时,就要考虑它的机会成本,也可得出高薪可以养廉的结论。

(3)实际在政治经济生活中的三方博弈是动态的,不论是委托人还是代理人以及寻租者,他们在不断地重复博弈中会愈来愈理性化,会不断优化各自的行动策略。我们对此问题的分析除了要在既定的博弈结构之下,找出最优监管的均衡概率,更要在现有博弈结构之外作文章,如建立举报奖励制度,进行政治、经济体制的改革和创新等,当然对此问题的讨论已不在本文之列了。

参考文献:

[1]郑利平1腐败问题的经济学分析[M]1北京:中

共中央党校出版社,20001

[2]张维迎1博弈论与信息经济学[M]1上海:上海

三联书店,上海人民出版社,19961

[3]王性玉1反腐养廉博弈模型分析[J]1河南大学

学报,2001,(4)1

[4]卢现祥1寻租经济学导论[M]1北京:中国财政

经济出版社,20001

[5]Eric Rasmusem:Game and Informution[M]1Oxford:

Blackwell Publion19941

[6]戈登#塔洛克1对寻租活动的经济学分析[M]1

成都:西南财经大学出版社,19991

(责任编辑:吴旭东)

17

寻租理论三方博弈模型分析

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

用博弈论分析生活中的现象

上海第二工业大学 2012-2013学年第二学期 用博弈论分析生活现象论文

博弈论分析生活中现象 博弈论它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域,主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,博弈论就是分析博弈行为和博弈决策的一门科学。其实博弈现象不只现身于经济领域对于我们日常生活中也是处处可见的,所以博弈论的思想不仅仅能够用来分析经济从而获得最大的盈利,我们也可以尝试将博弈论的思想运用到生活实践中从而获得最优的策略。 比如某一天你觉得应该是你女朋友的生日,但又不能肯定,如果是女朋友的生日的话,你可以送一束花,女朋友会特别高兴,你不送花,女朋友会埋怨你忘了她的生日如果不是女朋友的生日的话,你可以送女朋友一束花女朋友感到意外的惊喜,你不送花结果生活同往常一样。 生日非生日 买花 1 ,1 2 ,1 不买花-1,-1 0 ,0 确定今天是女朋友的生日或确定今天不是女朋友的生日,但你的最好行动都是买花。 谈到博弈论我们不得不说到囚徒困境,其内容大致为两名罪犯A 和B隔离审讯。如果两个都不招,因为证据不充分,两人都只能判1年。如果一方招了,属立功表现,功罪相抵,无罪释放;而另一方则属抗拒从严,判10年刑但如果两人都招了,则各判 5 年。结果大家都知道:两个人争先恐后地招了,结结实实地各判了5年。两个犯

人陷入的就是囚徒困境, A B 招不招 招 5 ,5 无罪释放,10 不招10,无罪释放 1 ,1 其结果就是A和B都招,判5年刑。如果两人协商后选择不招,但如果A或B其中一人招了,另一人就会判10年,而招的一人就会无罪释放,这样的诱惑足以让两名罪犯违背两人协议。而选择招。这样最有可能就是俩人都招。 人际交往中的博弈 人与人之间的相互矛盾和相互冲突的关系实际上就是一种博弈关系。矛盾冲突的结果也有三种情况负和游戏、零和游戏和正和游戏。“负和游戏”是一种两败俱伤的游戏故也称为双输博弈。在人与人的交往时由于相互的冲突和矛盾不能达到统一交际双方都不让步,最后使交际活动不能展开,结果是交际的双方都从中受损两败俱伤。如果是朋友,也会因不断发生“负和游戏”而逐渐疏远,夫妻间经常出现“负和”现象感情自然会受到影响。交际中之所以经常会发生“负和博弈”现象,大多是因为心胸狭窄,遇事爱使性负气,必然会出现“负和”局面。如果不使性负气,而是互相谅解,与人交往采取合作态度,便能使有矛盾和冲突的交际活动朝好的方向发展。在交际中如果遇到了和交际对象发生冲突的时候能够想着退一步海阔天高,采取一种和对方合作的态度就一定能避免交际中“负和游戏”的发生。至于“零和游戏”这种简单的“你输我赢”的思考方式往往会给人们带来更大的麻烦。其实在人与人之间的交往中双方的关系并不是简单

公众、媒体、政府三方在舆情中的三方博弈

公众、媒体、政府三方在舆情中的三方博弈——基于于欢案一审阶段爆发期和蔓延期的舆情研究 @小丽塔呀

目录 一事件背景 (1) 二相关理论 (2) 1、前十效应 (2) 2、博弈论 (2) 三数据收集与分析 (3) 3.1选择时间节点 (4) 3.2公众评论与媒体信息的摘取 (5) 四舆论场的产生 (6) 4.1政府舆论场的产生 (6) 4.2媒体舆论场的产生 (6) 4.3民间舆论场的产生 (7) 五三方舆论场的博弈 (7) 5.1媒体舆论场与公众舆论场 (7) 5.2媒体舆论场与政府舆论场 (12) 5.3民间舆论场与政府舆论场 (15) 5.4 小结 (18) 六总结 (18) 七参考文献 (19)

公众、媒体、政府三方在舆情中的三方博弈 ——基于于欢案一审阶段爆发期和蔓延期的舆情研究 摘要:本文利用文献法、内容分析、词频分析等方法,对于欢案一审阶段舆情的爆发期及蔓延期中政府、媒体及公众三方之间的博弈及博弈结果进行研究分析,发现:在三方博弈中,公众舆论对于政府及媒体的场域发展起着重要作用等。关键词:于欢案;民间舆论场;媒体舆论场;政府舆论场;博弈论 一事件背景 4·14聊城于欢案是指2016年4月14日14时,发生在山东省聊城冠县的刑事案件。 吴学占追债女企业家苏银霞,并多次对其进行极端的辱骂、殴打,苏银霞多次拨打110和市长热线,但都未得到有效帮助。2016年4月14日,苏银霞之子于欢因无法忍受讨债人员对其母的侮辱,情急之下用水果刀致使杜志浩等四名催债人员被捅伤。 其中,杜志浩因未及时就医导致失血性休克死亡,另外两人重伤,一人轻伤。 2017年2月17日,山东省聊城市中级法院一审以故意伤害罪判处于欢无期徒刑。 2017年5月27日,该案二审公开开庭审理。山东省高级人民法院采取微博直播的方式通报庭审相关信息。经过一天的庭审,参加诉讼各方充分发表意见后,法庭宣布择期宣判。 2017年3月24日9时,《南方周末》官网发布文章《刺死辱母者》文章随后被多家网媒转发 2017年3月24日17时,@猫扑发布事件相关微博,获得过千转发 2017年3月25日10时,@新京报发布事件相关微博,引发热议,截至27日,微博转发量达四万余次 2017年3月25日13时,@头条新闻、@财经网等多家媒体官微相继发布相关微博,@于海青、@徐昕等大v也参加事件讨论。事件开始持续发酵2017年3月26日10时,@山东高发官微发布《关于于欢故意伤害一案的情况通报》,再一次引发热议,@新京报、@Vista看天下、@人民日报等媒体接

合作博弈

合作博弈 博弈论又称为对策论,是一门应用极其广泛的学科,它既是一个数学分支,又属于经济学和管理科学范畴,其应用涉及经济学、管理学、社会科学以及计算机科学等众多学科领域。在过去的几十年中,博弈论在国内外发展迅速,既有对传统非合作博弈的突破,更有新的理论分支,比如合作博弈、模糊合作博弈等的飞速发展。如今,博弈论在经济学中的地位日益凸显,已经成为一种标准用于衡量生产活动的经济性。 博弈论发展至今的种类繁多,可以根据不同标准进行不同分类。按博弈中的参与者采用的对策能否在博弈开始前确定,可以将博弈分为策略型博弈和展开型博弈。根据博弈的周期是否与时间长短有关,分为动态博弈和静态博弈。如果一场博弈活动中,参与者之间互不关联,参与者在进行博弈时禁止任何形式的信息往来,同时禁止参与者互相签订任何形式的强制性约定,则称这种博弈为非合作博弈(non-cooperative game);合作博弈(cooperative game)则是指参与者在进行博弈前可以互相沟通,交换信息,共同完成博弈过程,合作博弈中相互合作的参与者通常称之为一个联盟。本文主要针对合作博弈进行讨论。 合作博弈理论主要关系的是联盟(即参与者集合),协调他们的行动并且经营他们的收益。因此,合作博弈研究的重点问题是如何在组成联盟的成员之间分配他们的额外收益(或节省的费用)。分配该额外收益的结果或方法称为合作博弈的解。由于合作博弈的解能够适用于复杂或者运算量较大的系统,因此合作博弈解法在电力工业中的应用已经得到国内外学者的广泛研究,其模型涵盖输配电竞价、电网建设招投标、输电定价、系统费用分摊等领域。与采用传统的非合作博弈模型求解相比,合作博弈解可以为市场中的参与者提供良好的经济信号,刺激参与者互相竞争获得更大的利益。 通常情况下,生产活动中的参与者(或局中人)通过某种协定形成联盟,各联盟之间的参与者通过协商并联合行动,来实现联盟整体利益的最大化,进一步实现个体利益的最优分配。参与者在追求整体和个体利益最大化的同时,也受到相互之间协定的约束,从而避免自身获取利益的行为造成其他参与者利益的损失。由于参与者采用合作博弈方法进行生产活动时,各自分配的利益能够被全体参与者所接受,因此对合作博弈方法的研究很有必要。 令N为参与者(这些参与者考虑不同的合作可能性)的非空有限集合,即{} =,每个子集S看作是参与者不同的合作组成的一个联盟,则联盟N n 1,2,3,..., ∈。对于每一个联盟S,其中的参与者均通过协商采取一致的策略行动,为S N 实现该联盟的总利益最大而互相合作。集合N称为大联盟,集合φ称为空联盟。

有限资源下的三方博弈分析

有限资源下的三方博弈分析 摘要:从现代管理理论和博弈论的角度分析“三个和尚没水喝”的现象,可以引伸出对资源配置率和劳动生产率等一系列管理有效性问题的研究,有限资源约束下的三方博弈现象就是其中的一个研究对象?运用博弈论方法对上述问题进行了全新的释义,并建立了对应的分析模型? 关键词:资源;博弈;经济理性人;纳什均衡 近年来国际上各类经济学文献中出现频率最高的关键词之一就是博弈论(Game Theory)?博弈论已经受到理论界越来越高的重视,成为现代经济学最新发展中一个特别引人注目的学科,很多经济学家都转而从博弈论的角度来解释众多的经济现象和经济行为?此外,博弈论也成为现代管理科学的基础和核心,符合纳什均衡原则的管理机制已是制度设计和管理创新的目标? 同时也不可否认,博弈论在我国经济管

理领域的研究尚处于起步阶段?例如在不少 经济管理案例中,“三个和尚没水喝” 这 一中国传统小寓言是作为管理问题的典型 对象进行详尽分析的,但是迄今为止学者们 都着眼于定性的阐述,缺少与现代实际经济 活动背景联系密切的定量剖析和计算?本文 针对这一问题,从“三个和尚没水喝”的现 象入手,对有限资源约束下的三方博弈进行 了分析,建立了相应的对策模型,并给出了 问题的详尽解释? 1 相关文献理论综述 近些年来,国内每年都有不少学者就 “三个和尚没水喝”所蕴含的深层哲理发 表学术观点? (1)资源配置说? 有学者认为庙是一个组织,和尚?扁担 和水桶是组织可支配的资源,而水是组织可 支配资源最终配置的成果,理想状态下水是 可持续使用的?对于“一个和尚有水吃”的 现象,组织所投入的一个和尚的经营成果接 近“一副扁担和两只水桶最大化使用效率”的理想状态,属于管理学中的高效配置;对

从非合作博弈走向合作博弈

作者简介:阮宇,女,(1990.8-),汉族,现为云南师范大学哲学与政法学院硕士研究生,研究方向为法律社会学。 摘要:本文通过对非合作博弈与合作博弈两种形式的特征比较,以及在当今社会所出现的社会问题中如何运用两种博弈理论来进行分析,并且结合现实生活当中的微观社会关系来深入探讨从合作博弈走向合作博弈的条件和后果 关键词:非合作博弈合作博弈集体理性 中图分类号:f301.22 文献标识码:a 文章编号:1006-026x(2013)07-0000-02 一、文献综述 非合作博弈与合作博弈这两种博弈方式都是研究个体的微观决策是如何做出来的,也就是在受限条件下怎样做出最优的决策,决策的时候会受到其他参与人的影响和总用,也就是说在博弈的过程当中,行动者所能得到的利益做不仅取决于自己的决策和主观偏好还受到其他参与人的决策和偏好。那么在博弈当中有两种博弈方式倍受广大学者的青睐并且做出了探讨,从这两种类型的名称来看都并不是称得上完美的决策,所以必定有因为条件的不同而做出相对的最优选择,给人们提供一种思维方式从而能够至少降低人们做出系统性错误决策的概率。 非合作博弈关心的是策略,研究参与人在博弈中怎样做出决策,这是一种微观类型的理论,它涉及准确描述发生了什么;而合作博弈关心我们期望得到怎样的结果,往往不管过程如何,不关心该合作过程是否符合理性,人们认为合作博弈的发生主要是靠各方参与人共同达成的一直承诺来保证共同的得益并能够分配各方的得益。从以上的描述来看,非合作和合作博弈的最大不同点在于行为层次的不同,是微观与宏观的区别,是个体和集体的区别,是信息不对称与制度设置约束的区别。 那么用抽象理论分析现实社会现象,人们是怎样从微观的个体层次的非合作的博弈走向了宏观集体主义的合作博弈呢,在现实生活当中,我们最常看到由于这两种决策行为的摇摆不定所出现的冲突,比如说群体外部的压力促使内部的矛盾重新得到消解走向了凝聚一体,虽然依然存在小矛盾但依然能抛弃冲突转向外部的侵犯,这种有问题的凝结在外人看来被认为是很不理性的,在个体微观层次来看同样是不可取的。笔者认为,这关键的前提就是人们所提出来的制度设置具有的约束力,这种制度设置让合作博弈参与各方都获取了完全的信息,从而能够形成联盟,在这种格局当中强调的是集体理性,在这种集体理性当中各方获取各方的利益达成目标。非合作博弈与合作博弈不同在于没有协议的存在,并且彼此之间信息不对称,所以需要时时刻刻保持对决策的准确把握,用微观的理性行为相互作用达成合作的目的。 张湛彬以博彩行为从非合作博弈走向合作博弈的政府选择偏好来说明由于博彩主体追求的主要是自身的利益而忽略了集体的利益,在没有约束力的规则下最优选择就是去参与赌博,假设政府也不出面干涉,私人的利益熏心就会鼠目寸光,制造很多骗局给社会带来消极影响,最终受害的依然是个体的利益,政府如果能够全面禁止博彩行为,全社会都会遵守就形成了那是均衡。但是对于博彩活动来说那是均衡很难形成,因为由于政府的打击,赌徒的疯狂,双方信息不对称,政府可能受到各方面的条件限制打击不力,而赌徒因为有机可乘而更加猖狂,双方的较量最终无法落下帷幕,所以政府会一直完善对于赌博行为的规定从而能够对其进行制度化管制。该作者认为政府的选择偏好能够对这种局势形成影响从而能走向合作博弈(虽然人们认为某些手段是不理性的),比如对某些地区或者某些赌博合法化。该例子更具体揭示出非合作博弈和合作博弈的特征并展现出二者转化的条件,即制度设置的保证促成。 同样是对社会问题当中的博弈分析,周仲秋,何静以中国拆迁困局为例,说明如何从非合作博弈走向共商共赢,该文认为拆迁困局是中国城市化发展进程中多次非合作博弈结果积聚的集中爆发与呈现,拆迁成困难是在于博弈标准的缺失,过程中助推力及博弈的非合作化,

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

战略风险投资博弈模型分析

战略风险投资博弈模型分析 本文此处将通过对风险投资公司投资处于成长阶段创新企业的活动的分析和研究,提出信号传递博弈模型的企业价值评估方法。通过信号传递博弈模型来分析企业向风险投资公司传递信号(企划书)对价值评估结果的影响,给风险投资公司进一步量化风险和预期投资收益提供思路和参考。 4.1 如何对风险投资目标企业进行价值评估 目前国际上对一个成熟的企业的价值评估一般分为以下五个步骤:分析历史绩效、预测绩效、资本成本评估、连续价值评估、计算并解释结果。这几个步骤有些因为创新企业还远未成熟而无法进行,比如历史绩效分析时很可能财务数据不健全,目标市场价值权数选取时也因为主观预测成分很大而具有很大风险性;最重要一点,由于创新企业急需要注入大笔资金才能继续生存和发展,风险投资公司必须在尽量短的时间内作完考查工作,因为时间价值可谓创新企业的生命价值,错过发展时机肯定是要牺牲的。在这尽量短的时间内,创新企业需要一定的融资技巧,而且有很强的信息优势,风险投资公司除应在投资合约中对其进行约束之外,也要根据自己的观察结果给企业定价,以作为谈判和投资的基础。本文拟引入信息经济学中信号传递博弈模型的企业价值评估方法,风险投资公司结合以往投资经验和统计结果对相应估计结果进行调整,以便客观评估企业的价值及是否值得投资。作为创新企业经营者一方面应利用信息优势影响评价结果,另外对企业有初步的估价以免在价格谈判中贱卖了企业,所以该模型对谈判双方都具有一定的实际价值。 4.2 信号传递博弈模型介绍 信号传递模型(Signaling Games)是一种比较简单但有广泛应用意义的不完全信息动态博弈。在这类博弈中,有两个参与人,i= 1,2,参与人1称信号发送者,参与人2为信号接受者;参与人1的类型是私人信息,参与人2的类型是公共信息。博弈顺序如下: (1)“自然”首先选择参与人1的类型θ∈Ω,此处Ω={θ1,…,θK}是参与人1的类型空间,参与人1知道θ,但参与人2不知道,只知道参与人1属于θ的先

博弈模型

有趣味的博弈论模型 按语: 本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页;在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”;2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”(请看最后附录),这篇科普文章名列首位,我们还有一篇文章名列第七。如果读者有兴趣可以去看看,或等我有时间找出来。我觉得,把新兴科学应用通俗易懂的语言写出来,有利于科学知识普及。这也应该是一个科学工作者的责任。 在自然界和人类社会经济等领域中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论,它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是,有三次诺贝尔获奖者是博弈论的杰出科学家,他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家,1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。 博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和研究了许多博弈模型,比较著名的有三个模型:囚徒困境、“雪堆”博弈和“少数者”博弈,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家了解博弈论及其应用概况。 “囚徒困境”模型 囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕,分别关在不同的屋子里,如果双方都拒绝承认同伴的罪行,则由于证据不足两人都会被轻判(收益为);为此,警方设计了一个机制:如果一方出卖同伴,而另一方保持忠 诚,则背叛者将无罪释放(收益为T ) ;坚持忠诚的一方将被重判(收益为);如果双方都背叛了对方,则双方都会被判刑(收益为R S P ) 。这里假设上述收益参数满足下面的条件:。对每个参与者来说,如果对手坚持忠诚,则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ;如果对手选择背叛,则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见,无论对手采取哪种策略,自己的最佳策略就是背叛,双方都选择背叛称为囚徒困境的唯一“纳什均衡”(纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖);同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下,理性参与者面临着两难的困境。 自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

博弈模型分析

1.3 管理型医疗概念研究 - 概念提出 - 博弈关系杨燕绥/王瑶平 - 分析模型岳公正 管理型医疗中的博弈关系:模型分析 (暂题) 概括地讲,管理型医疗是一种主要由医院(或者医生)、患者(或者受益人)、医疗保险管理机构(或者医疗保险经办机构)、政府四方参与的管理过程,是建立在互惠基础上的进行多方合作的医疗社会管理机制。由于经济发展水平、人文环境、行政管理具体情况等的不同,各个国家和地区的管理型医疗的结构和内容应当有其特点,具体操作方式和方法也很自然地存在差异。但是,从逻辑实质看,各个国家和地区存在着诸多差异的管理型医疗在本质上都是一个由医院、患者、医疗保险管理机构、政府四方围绕医疗服务定价、服务标准和成本控制等问题进行协商、规范和监督的管理过程。 本节的研究内容:1、对于管理型医疗中的博弈关系进行划分;2、对于管理型医疗中主要的博弈关系进行分析。 1 管理型医疗中博弈关系的划分 一般分析,医疗保险涉及的主体主要由医院、患者、医疗保险管理机构、政府四方组成。但是,在通常情况下,医疗保险在实际操作上涉及的主体还包括参保人、缴费人、受益人、基金管理公司、基金托管机构、医疗服务机构(营利和非营利)、药店、类似医生协会和药品协会的NGO组织、社会保障部门和卫生部门、监督评价机构等等。如何将这些组织和机构协调起来,从而降低医疗费用,提高医疗服务的质量是管理型医疗的主要内容。

图1-3—1 医疗保险的运行关系1 依据图1-3—1分析,医疗保险的运行中,包括了多元主体(医院、医疗保险经办机构、雇主、雇员、药店等)之间复杂的多维的相互制约与相互影响的关系。 1、医院和医疗保险经办机构的关系; 2、医院和受益人的关系; 3、医疗保险经办机构和受益人的关系; 4、医疗保险经办机构和药店的关系; 5、受益人和药店的关系; 6、医疗保险经办机构和政府的关系; 7、医疗保险经办机构和雇主(企业)的关系; 8、医疗保险经办机构和雇员(患者、投保人)的关系; 9、雇主和雇员的关系; 1杨燕绥著:《劳动与社会保障立法国际比较研究》,第239页,中国劳动社会保障出版社,2001年

博弈论理论经典讲解

博弈论经典案例 冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅 引用 光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典 案例. <案例一:囚徒困境> 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析. 在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。 这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年. <案例二:智猪博弈> 这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的 成本,支付水平分别为5和1.其他情形可以类推. 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得! <案例三:性别战>

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5

博弈论论文--非合作博弈论

非合作博弈论 博弈论也叫对策论,是现代微观经济学的基础领域之一,主要研究在彼此互动的情形下个人是如何做决策的。近年来它已经被广泛地应用于商业、政治、社会学等其他社会科学的分析中。博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。 1944年冯·诺依曼与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈—“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,妙笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。 1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发

博弈论经典案例

博弈论经典案例: 案例一 囚徒困境 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 囚徒困境博弈[Prisoner's dilemma] A╲B 坦白抵赖 坦白-8,-8 0,-10 抵赖-10,0 -1,-1 对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 案例二 智猪博弈 一、经济学中的“智猪博弈”(Pigs’payoffs)这个例子讲的是: 假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。

博弈论案例分析1

一、经济学中的“智猪博弈”(Pigs’payoffs) 故事背景:猪圈里有一头大猪和一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。 原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就像“智猪博弈”

博弈均衡模型及其举例

博弈联均衡模型 博弈论模型图示 博弈可划分为合作博弈和非合作博弈,1人们一般讲到的都是指非合作博弈,它有四种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。这四种均衡中最为基本的是纳什均衡。2 完全信息静态博弈——纳什均衡、 完全信息动态博弈——子博弈精炼纳什均衡 不完全信息静态博弈——贝叶斯纳什均衡、、 不完全信息动态博弈——精炼贝叶斯纳什均衡, 与上述相对应的是、、、。这四种均衡中最为基本的是纳什均衡。 完全信息静态博弈(纳什均衡) 债务人 强硬妥协 1这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合作博弈;反之就是非合作博弈。合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的最优决策,其结果是否有效率则是不确定的。 2所谓纳什均衡,指的是所有参与人最优选择的一种组合,在这种组合下,给定其他人的选择,没有任何人有积极性做出新的选择。纳什均衡的哲学思想是:给定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。当博弈中的所有参与人事先达成一项协议,给出每个人的行为规则。在没有外在强制力约束时,当事人是否会自觉地遵守这个协议?或者说这个协议是否可以自动实施?如果当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡。参见张维迎:“经济学家看法律、文化与历史”,载张维迎《产权、政府与信誉》,三联书店2001年版。

博弈论模型

1. 囚徒困境 这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发 现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情 形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他 们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这 两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就 可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪 来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会 得到奖赏。 那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看, 他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。 但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔 丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也 意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一 理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保 持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个 逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。 企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打 交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互 之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对 方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪, 就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着 控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是 9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1

相关文档
最新文档