囚徒困境和一报还一报

年代提出的概念：“囚徒困境”及“一报还一报策略”

两个罪犯准备抢劫银行，但作案前失手被擒。警方怀疑他们意图抢劫，苦于证据只够起诉非法持有枪械，于是将其分开审讯。为离间双方，警方分别对两人说：若你们都保持沉默(“合作”)，则一同入狱年。若是互相检举(互相“背叛”)，则一同入狱年。若你认罪并检举对方(“背叛”对方)，他保持沉默，他入狱年，你可以获释(反之亦然)。

结果两人都选择了招供。孤立地看，这是最符合个体利益的“理性”选择(以为例：若招供，自己招供获刑年，不招供获刑年；若不招供，自己招供可以免刑，不招供获刑年。两种情况下，选择招供都更有利)，事实上却比两人都拒不招供的结果糟。由囚徒困境可知，公共生活中，如果每个人都从眼前利益、个人利益出发，结果会对整体的利益(间接对个人的利益)造成伤害。

为解决“囚徒困境”难题，美国曾组织竞赛，要求参赛者根据“重复囚徒困境”(双方不止一次相遇，“背叛”可能在以后遭到报复) “一报还一报”策略是这样的：我方在第一次相遇时选择合作，之后就采取对方上一次的选择。这意味着在对方每一次背叛后，我方就“以牙还牙”，也背叛一次；对方每一次合作后，我方就“以德报

德”一次。(这让我想起《论语·宪问》中，有人问孔子：“以德报怨，何如？”孔子反问：“何以报德？以直报怨，以德报德。”)该策略有别于“善良”的“永远合作”或“邪恶”的“永远背叛”对策，及对方一旦“不忠”，我方就不再给机会，长久对抗的策略。

如果你选择“永远背叛”策略，你或许会在第一局拿到最高分，但之后的各局可能都只能拿到低分，最后虽然可能“战胜”不少对手，但由于总分很低，最终难逃被淘汰出局的命运。所以除非很难与对方再次相遇，不用担心其日后的反应，才可选择对抗与背叛；否则，在长期互动、博弈的关系中，“一报还一报”是最佳策略：它是善意的，从不首先背叛；它不迂腐，不管过去相处多好，仍然对背叛有反应；它是宽容的，不因一次背叛而选择玉石俱焚。

在美国密歇根大学政治学和公共政策教授罗伯特·阿克塞尔罗

德的著作《合作的进化》中，还对“一报还一报”下了更深刻的脚注：第一次世界大战时，如果两军实力相当，强行进攻只会被歼灭，结果双方都会选择掘战壕对峙。横竖消灭不了对方，为减少无谓伤亡，两军对垒最有效策略也是“一报还一报”，其四大原则是：

一、友善()：对方未让步自己可先行让步；

二、报复()：若对方违反合作关系，必须报复，给予对方清晰的回应；

三、宽恕()：若对方浪子回头，愿意让步，就要既往不咎；

囚徒困境案例分析

囚徒困境解说例子 1950年，由就职于兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。若二人都保持沉默（相关术语称互相“合作”），则二人同样判监1年。若二人都互相检举（相关术语称互相“背叛”），则二人同样判监8年。用表格概述如下：解说如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。

1囚徒困境

囚徒困境简介囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。囚徒困境最早是由美国普林斯顿大学数学家曾克1950年提出来的。他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论，这个故事后来成为博弈论中最著名的案例。故事内容是：两个嫌疑犯(A和B)作案后被警察抓住，隔离审讯；警方的政策是“坦白从宽，抗拒从严”，如果两人都坦白则各判8 年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年；如果都不坦白则因证据不足各判1年。从图表里我们可以看到，整体来说，都抵赖是最优选择，总共只需要关两年。可会出现这个结果吗？答案是不会。首先看A，如果B选择坦白，那么他也应该选择坦白，这样只要关八年，否则都要关十年；如果B选择抵赖，那么他还是应该选择坦白，因为这样他就可以直接回家啦，不用关一年了。所以无论B怎么选择，A都应该选择坦白。这个分析对B来说也是一样，他也应该选择坦白，所以最终他们两个肯定都会被关八年，多么可怜啊，这就是人们著名的“囚徒困境”。囚徒困境的主旨为，囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作考量。囚徒困境的应用许多行业的价格竞争都是典型的囚徒困境现象，每家企业都以对方为敌手，只关心自己的利益。在价格博弈中，只要以对方为敌手，那么不管对方的决策怎样，自己总是以为采取低价策略会占便宜，这就促使双方都采取低价策略。如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。在国内的家电大战中，虽然不是两个对手之间的博弈，但由于在众多对手当中每一方的市场份额都很大，每一个主体人的行为后果受对手行为的影响都很大，因此，其情景大概也是如此。如果清楚这种前景，双方勾结或合作起来，都制定比较高的价格，那么双方都可以因为避免价格大战而获得较高的利润。但是往往这些联盟处于利益驱动的“囚徒困境”，双赢也就成泡影。五花八门的价格联盟总是非常短命，道理就在这里。并不是每次个人的“理性选择”都能让自我利益最大化，也许会让你陷入一个“囚徒困境”。大量例子说明，在“囚徒困境”中，常常是先动手的一方会占一些优势。那么，“先下手为强”吧。

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考二、囚徒困境的解释如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。实际上囚徒困境在我们的实际生活中也有很多，下面举两个进行说明

三、经济学例子：关税战两个国家，在关税上可以有以两个选择: 提高关税，以保护自己的商品。（背叛）与对方达成关税协定，降低关税以利各自商品流通。（合作）当一国因某些因素不遵守关税协定，独自提高关税（背叛），另一国也会作出同样反应（亦背叛），这就引发了关税战，两国的商品失去了对方的市场，对本身经济也造成损害（共同背叛的结果）。然后二国又重新达成关税协定。（重复博弈的结果是将发现共同合作利益最大。）四、商业例子：广告战商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。此二公司可以有二选择：互相达成协议，减少广告的开支。（合作）增加广告开支，设法提升广告的质量，压倒对方。（背叛）若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。除了这些还有的很多类似的例子，比如说公共产品的提供，商家的价格战等等，在这里就不多赘述了。五、“囚徒困境”现象的意义和启示通过以上几个关于囚徒困境的例子，特别是作为经济管理学院的学生，我们可以将博弈论的一些知识运用好，更好的指导我们的经济生活。理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。在经济发展中，我们应该认识到“看不见的手”还有更多内涵，有待我们去发掘。本文主要通过对该理论的分析，从中发现对企业经营管理活动的有义启示。第一，在市场竞争过程中，一名优秀的经营者，无论做任何决策还是考虑问题应该有战略眼观，特别是在做出对企业乃至行业今后发展的竞争策略时，从长远出发，做正确的决断。第二，保存对手就是保存自己。在市场竞争中，让竞争对手发展就是自己发展，本着求同存异的思想，共谋发展，避免恶性竞争，避免两败俱伤的情况。第三，市场竞争不是纯粹的竞争，在义和利之间应该如何取舍，是一位有战略眼观的企业家该做的第一个选择。 2杜兰：走出“囚徒困境”《通信企业管理》[J] 2003年第4期，第31页

博弈论中经典案例--“囚徒困境”

博弈论中经典案例--“囚徒困境” 博弈论中有一个经典案例囚徒困境” 。两个共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年;若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱十年;若互相揭发，则因证据确实，二者都判刑八年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。囚犯可以做出如下选择：1、供出他的同伙（即与警察合作，从而背叛他的同伙），2、保持沉默（也就是与他的同伙合作，而不是与警察合作）。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。 A 犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A 犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A 犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就

“囚徒困境”引发的思考

“囚徒困境”引发的思考 “囚徒困境”博弈是图克（Tucker）1950年提出的一个著名的博弈模型，是完全信息静态博弈的典型例子。一、基本模型囚徒困境博弈的基本情况如下：警察抓住了两个合伙犯罪的罪犯，但却缺乏足够的证据指证他们所犯的罪行。如果其中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟，并给他们同样的选择机会；如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判1年徒刑；如果两人中有一人坦白认罪，则坦白者从轻认罪，立即释放，而另一人则将重判8年徒刑；如果两人同时坦白认罪，则他们将被各判5年监禁。如果分别用－1、－5和－8 表示罪犯被判刑1年、5年和8年的得益，用0表示罪犯被立即释放的得益，则两囚徒的得益矩阵如下：囚徒2 坦白不坦白囚徒1 坦白－5，－5 0，－8 不坦白－8，0 －1，－1 在上图中，“囚徒1”、“囚徒2”分别代表本博弈中的两个博弈方，也就是两个罪犯；他们各自都有“不坦白”和“坦白”两种可选择的策略；因为这两个囚徒被隔离开，其中任何一人在选择策略时都不可能知道另一人的选择是什么，因此不管他们决策的时间是否真正相同，我们都可以把他们的决策看作是同时做出的。其中矩阵中第一个数字代表决策结果后囚徒1的得益，第二个数字代表决策结果后囚徒2的得益。博弈的结果是：由于这两个囚徒之间不能串通，并且各人都追求自己的最大利益而不会顾及同伙的利益，双方又都不敢相信或者说指望对方有合作精神，因此只能实现对他们都不理想的结果（各判5年），并且这个结果具有必然性，很难摆脱，因此这个博弈被称为“囚徒困境”。［1］二、关于完全理性的思考囚徒困境博弈的一个假设是博弈方都是完全理性。完全理性来源于经济学中的理性人假设，即博弈方都以个体利益最大化为目标，且有准确的判断选择能力，也不会“犯错误”。以个体利益最大为目标被称为“个体理性”，有完美的分析判断能力和不会犯选择行为的错误称为“完全理性”。完全理性包括追求最大利益的理性意识、分析推理能力、识别判断能力、记忆能力和准确行为能力等多方面的完美性要求，其中任何一方面不完美就不属于完全理性。［1］我们可以看出，这是一个要求非常严格的假设。即便如此，完全理性仍在一个方面没有做出规定（至少是没有意识到或明确地规定出来），就是思维方式，也即是博弈方是以将问题分解的方式来思考问题呢，还是以系统的整体的方式来思考问题的。我引用《第五项修炼》上的一段话来表达这两种思维方式的不同。自幼我们就被教导把问题加以分解，把世界拆成片片段段来理解。这显然能够使复杂的问题容易处理，但是无形中，我们却付出了巨大的代价——全然失掉对“整体”的连属感，也不了解自身行动所带来的一连串后果。于是，当我们想一窥全貌时，便努力重整心中的

博弈论经典案例“囚徒困境”以及其拓展

博弈论经典案例“囚徒困境”以及其拓展发表于：分类：未分类博弈论（）对人的基本假定是：人是理性的（，或者说自私的）,理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。 “囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ和Ｂ都选择抵赖，各判刑１年，显然比都选择坦白各判刑８年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个"攻守同盟"，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。在经济学方面的实例: 一．电信价格竞争根据我国电信业的实际情况，我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商与, 他们在电信某一领域展开竞争，一开始的价格都是。（中国电信）是老牌企业，实力雄厚，占据了绝大多数的市场份额；（中国联通）则刚刚成立不久，翅膀还没有长硬，是政府为了打破垄断鼓励竞争而筹建起来的。正因为是政府扶植起来鼓励竞争的，所以得到了政府的一些优惠，其中就有的价格可以比低％。这一举动，还不会对产生多大的影响，因为的根基实在是太牢固了。在这样的市场分配下，、可以达到平衡，但由于在价格方面的优势，市场份额逐步壮大，到了一定程度，对造成了影响。这时候，该怎么做？不妨假定：降价而维持，则获利，损失，整体获利；维持且也维持，则获利，获利，整体获利；维持而降价，则损失，获利，整体获利；降价且也降价，则损失，损失，整体损失。

囚徒困境(博弈论的经典案例)

囚徒困境（博弈论的经典案例）学习管理学或经济学的人一定都了解一些博弈论方面的知识。在博弈论中有一个经典案例--囚徒困境，非常耐人回味。囚徒困境，说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。----那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上

意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。当然，在现实世界里，信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。让我们看看冷战时期两个超级大国将自己锁定在一场40年的军备竞赛中，其结果对双方都毫无益处。还有各国的贸易保护主义的永恒倾向。----但是，无论在自然界还是在人类社会，合作都是一种随处可见的现象。那么，问题就出现了：到底是何种机制促使生物体或者人类进行相互合作呢？----这个问题的答案大部分归功于美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家，对合作的问题久有研究兴趣。为了进行关于合作的研究，他组织了一

囚徒两难困境启示

囚徒两难困境启示 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙（即与警察合作，从而背叛他的同伙），或者保持沉默（也就是与他的同伙合作，而不是与警察合作）。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根

据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。当然，在现实世界里，信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。博弈，讲的是多人决策的策略问题。囚徒困境的故事提示我们，参与决策的多方最好保持合作的状态，各方所得利益的总和方可最大化。然而现实生活中背叛所带来的诱惑虽然很大，但结果不总是尽人意的。故事中参与决策的两个囚徒，被警察隔离开了，无法沟通。现实生活中，被隔离而无法沟通的现象的确也有，但更多的是因时间或地域问题决策各方不具备沟通的条件，或者虽有沟通的条件，但决策各方没有彼此的信任，即便沟通也是一个没有信任的沟通，我们姑且叫它为“假沟通”吧。决策各方在不具备沟通条件或者难以建立具备信任的沟通时，各方就会在决策中追求个人或者单方面利益的最大化。就像上面所说的，没有互信，即便具备沟通的条件，也是没有意义的。如何建立互信？在合作过程中，各方有猜疑心里也不为怪，至于彼此是否有诚意合作而不是尔虞我诈，各方都希望是用事实说话。现实社会中，很多这种多方决策的问题不是一次性的，参与决策

第四卷囚徒困境案例

第四卷囚徒困境案例 “囚徒困境”案例说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。 1 在博弈论中有一个经典的广泛流传的案例--囚徒困境案例，这个博弈案例非常耐人寻味。 “囚徒困境”案例说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。现在有两个囚犯，他们分别是A和B,囚犯A不是个傻子，他马上意识到，他根本无法相信他的同伙B不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但囚犯B也意识到，他的同伙A也不是傻子，也会这样来设想他。所以两个囚犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，囚犯A反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。

“囚徒困境”的引申与启示

龙源期刊网 https://www.360docs.net/doc/8118782955.html, “囚徒困境”的引申与启示作者：丁华来源：《职业时空》2007年第01期周洋韩雪峰什么是囚徒困境亚当·斯密讲了这样一个故事：有两个因巨额盗窃而正在服刑的囚犯A和B。区检察官c 正在调查一宗悬而未决的银行抢劫案，并且他相信A和B就是罪犯。区检察官c正在计划竞选州长，所以希望A和B认罪，因为这样会在他的记录中增加一项重要的定罪案件。他依靠监狱警卫的帮助，对A和B的牢房进行了突击搜查，发现了隐藏的武器和毒品。他知道可以利用这一信息控告他们犯有藏匿武器与毒品的小罪而使之被判刑，他将A和B隔离起来并分别对他们作出了如下承诺：如果无人坦白银行抢劫，他将以藏匿武器与毒品罪起诉并使两人各被再判2年监禁：如果两人都认罪，则都因银行抢劫罪而被再判5年监禁；如果只有一人坦白并将对方揭发出来，则对坦白者的抢劫银行与藏匿武器与毒品行为不予起诉并释放他，而没有坦白的人则会因抢劫银行与藏匿武器与毒品而被再判20年监禁。那么，这两个囚犯该怎么办呢?从表面上看，他们应该互相合作。如果选择抵赖，他们俩都能得到最好的结果。但他们不得不仔细考虑对方可能采取什么选择。对囚徒困境的引申与分析警惕公权力的滥用。在上边的囚徒困境中，区检察官构造了一种情势，使得个人对自己利益的追求会导致对A和B都不利的结果，两个囚徒都会坦白，从而每个人都达到一个双方都认为是差于双方都不坦白的结果。事实上，检察官所构造的这个困境对A和B的激励是如此的强烈，以至于很容易想象A和B被迫承认抢劫银行，甚至即使他们是清白的。我国“文革” 中坦白从宽、抗拒从严的政策之所以能使一大批人承认自己的“罪行”，其奥妙即在于此。个人理性与集体理性的冲突。囚徒困境反映了一个很深刻的问题，这就是个人理性和集体理性的冲突，即理性人的个人理性行为可能导致集体非理性。很显然，A和B双方都抵赖(各

博弈论经典案例“囚徒困境”以及其拓展

博弈论经典案例“囚徒困境”以及其拓展 05-06-13 10:57 发表于：《没有范的世界》分类：未分类博弈论（game theory）对人的基本假定是：人是理性的（rational，或者说自私的）,理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。 “囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ和Ｂ都选择抵赖，各判刑１年，显然比都选择坦白各判刑８年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个"攻守同盟"，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。在经济学方面的实例: 一．电信价格竞争根据我国电信业的实际情况，我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争，一开始的价格都是P0。A（中国电信）是老牌企业，实力雄厚，占据了绝大多数的市场份额；B（中国联通）则刚刚成立不久，翅膀还没有长硬，是政府为了打破垄断鼓励竞争而筹建起来的。正因为B是政府扶植起来鼓励竞争的，所以B得到了政府的一些优惠，其中就有B的价格可以比P0低10％。这一举动，还不会对A产生多大的影响，因为A的根基实在是太牢固了。在这样的市场分配下，A、B可以达到平衡，但由于B在价格方面的优势，市场份额逐步壮大，到了一定程度，对A造成了影响。这时候，A该怎么做？不妨假定： A降价而B维持，则A获利15，B损失5，整体获利10； A维持且B也维持，则A获利5，B获利10，整体获利15；

教学案例20：囚徒困境

教学案例20：囚徒困境【案例呈现】警察局抓住了两个合伙犯罪的嫌疑犯，但获得的证据并不十分确切，对于两者的定罪量刑就取决于他们对于犯罪事实的供认情况。为防其相互间串供，两疑犯被分别拘捕、隔离审问，他们面临着认罪策略的选择问题。摆在他们面前的选择无非两种：坦白或不坦白。按照全世界通用的政策，坦白从宽，抗拒从严，所以若两人均坦白，则可以从轻处理，分别被判刑8年；若两人中有一人坦白而另一人拒不坦白，则坦白者可判5年，拒不坦白者将从重处罚被判10年；当然，若两人拒不交代，而警方手中又无足够的证据可以指控犯罪嫌疑人，那他们只能按妨碍公务罪各被判1年。因此，对两个囚徒来说，最佳结果是两人都不坦白，各判1年。但由于两个囚徒没有条件串供，他们并不确定对方是否会坦白，所以对于囚徒A 而言，不管囚徒B采取何种策略，他的最佳策略都是交代。对于囚徒B而言也是如此。最后，两个囚徒决策时都以自己的最大利益为目标，都会选择交代，结果是两人各判8年。【案例点评】人生的内容是由复杂多样的社会关系和社会活动构成的。个人与社会之间是辩证统一的关系。一方面，社会离不开个人，个人是构成社会的前提；另一方面，个人也离不开社会，社会是个人生存和发展的基础。个人与社会的关系，归根结底是个人利益与社会整体利益的关系。所以，每个人在追求或维护个人利益时，不能仅从个人的需要出发，还应适当考虑他人和社会群体的利益。因为若是损害了他人和群体的利益，也有可能损害自己的需要和利益。囚徒困境作为博弈论中一个具有代表性的例子，就充分演绎了个人与社会之间的同进步同退步、紧密的双向利益关系，反映了个体行为与集体行为选择之间的矛盾和冲突。即当每个人都以自己的最大利益为目标采取行为时，行为的结果反而是无法实现最大利益的。因此该案例提示大学生：只有从全局、整体出发，必要时为社会做出一定的牺牲，才能创造出个人与社会共同进步的双赢结果。【教学建议】本案例可用于第三节第三目“促进个人与社会的和谐”的教学，用来解释个人与社会之间的辩证统一关系，明确个人在社会中的定位。

囚徒困境和一报还一报

年代提出的概念：“囚徒困境”及“一报还一报策略” 两个罪犯准备抢劫银行，但作案前失手被擒。警方怀疑他们意图抢劫，苦于证据只够起诉非法持有枪械，于是将其分开审讯。为离间双方，警方分别对两人说：若你们都保持沉默(“合作”)，则一同入狱年。若是互相检举(互相“背叛”)，则一同入狱年。若你认罪并检举对方(“背叛”对方)，他保持沉默，他入狱年，你可以获释(反之亦然)。结果两人都选择了招供。孤立地看，这是最符合个体利益的“理性”选择(以为例：若招供，自己招供获刑年，不招供获刑年；若不招供，自己招供可以免刑，不招供获刑年。两种情况下，选择招供都更有利)，事实上却比两人都拒不招供的结果糟。由囚徒困境可知，公共生活中，如果每个人都从眼前利益、个人利益出发，结果会对整体的利益(间接对个人的利益)造成伤害。为解决“囚徒困境”难题，美国曾组织竞赛，要求参赛者根据“重复囚徒困境”(双方不止一次相遇，“背叛”可能在以后遭到报复) “一报还一报”策略是这样的：我方在第一次相遇时选择合作，之后就采取对方上一次的选择。这意味着在对方每一次背叛后，我方就“以牙还牙”，也背叛一次；对方每一次合作后，我方就“以德报

德”一次。(这让我想起《论语·宪问》中，有人问孔子：“以德报怨，何如？”孔子反问：“何以报德？以直报怨，以德报德。”)该策略有别于“善良”的“永远合作”或“邪恶”的“永远背叛”对策，及对方一旦“不忠”，我方就不再给机会，长久对抗的策略。如果你选择“永远背叛”策略，你或许会在第一局拿到最高分，但之后的各局可能都只能拿到低分，最后虽然可能“战胜”不少对手，但由于总分很低，最终难逃被淘汰出局的命运。所以除非很难与对方再次相遇，不用担心其日后的反应，才可选择对抗与背叛；否则，在长期互动、博弈的关系中，“一报还一报”是最佳策略：它是善意的，从不首先背叛；它不迂腐，不管过去相处多好，仍然对背叛有反应；它是宽容的，不因一次背叛而选择玉石俱焚。在美国密歇根大学政治学和公共政策教授罗伯特·阿克塞尔罗德的著作《合作的进化》中，还对“一报还一报”下了更深刻的脚注：第一次世界大战时，如果两军实力相当，强行进攻只会被歼灭，结果双方都会选择掘战壕对峙。横竖消灭不了对方，为减少无谓伤亡，两军对垒最有效策略也是“一报还一报”，其四大原则是：一、友善()：对方未让步自己可先行让步；二、报复()：若对方违反合作关系，必须报复，给予对方清晰的回应；三、宽恕()：若对方浪子回头，愿意让步，就要既往不咎；

囚徒困境的生活实例分析

囚徒困境的生活实例分析中南财经政法大学工商管理学院博弈论对人的基本假定是：人是理性的,理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。 “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。问题可以总结为：在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ和Ｂ都选择抵赖，各判刑１年，显然比都选择坦白各判刑８年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个"攻守同盟"，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。从自私自利的角度出发，选择认罪是最好的这种说法是有缺陷的，因为两个人都可能会得到8年的监禁期。即使是最狡猾的方法也不能把你救出监狱。但是如果你期望你的同伙与你合作，那你最好的选择将是认罪。然而，如果你的同伙知道了你的计划，他也会认罪，此时最好的方法是你们两个合作。这就是这个悖论的关键所在。如果从整体来看，对于两个囚犯而言，最好的结果是两人合作，其它的任何选择都是不好的。实例分析 1：一．电信价格竞争根据我国电信业的实际情况，我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争，一开始的价格都是P0。A（中国电信）是老牌企业，实力雄厚，占据了绝大多数的市场份额；B（中国联通）则刚刚成立不久，翅膀还没有长硬，是政府为了打破垄断鼓励竞争而筹建起来的。正因为B是政府扶植起来鼓励竞争的，所以B得到了政府的一些优惠，其中就有B的价格可以比P0低 10％。这一举动，还不会对A产生多大的影响，因为A的根基实在是太牢固了。在这样的市场分配下，A、B可以达到平衡，但由于B在价格方面的优势，市场份额逐步壮大，到了一定程度，对A造成了影响。这时候，A该怎么做？不妨假定： A降价而B维持，则A获利15，B损失5，整体获利 10； A维持且B也维持，则A获利5，B获利10，整体获利15； A维持而B降价，则A损失10，B获利15，整体获利5； A降价且B也降价，则A损失5，B损失5，整体损失10。从A角度看，显然降价要比维持好，降价至少可以保证比B好，在概率均等的情况下，A降价的收益为15×50％－5×50％＝5，维持的收益为5×50％－10×50％＝－2．5，为了自身

囚徒困境

经济学中的囚徒困境举个例子：两囚徒被指控是一宗罪案的同案犯。他们被分关在不同的牢房且无法互通信息。各囚徒被要求坦白罪行。如果两囚徒都坦白，各将被判入狱5年；如果两人都不坦白，则很难对他们提起刑事诉讼，因而两囚徒可以预期从轻发落为入狱2年；另一方面，如果一个囚徒坦白而另一囚徒不坦白，坦白的这个囚徒就只需入狱1年，而另一个将被判入狱10年。如果你是这两个囚徒之一，你会怎么做——坦白还是不坦白？微观经济学中有一个纳什均衡理论，讨论的是在市场中，包括竞争和垄断市场，各个厂商的行为及均衡，个人感觉很有趣，想和大家分享一下。上面的例子其实是一个博弈论中被称为囚徒困境（prisoners ‘ dilemma ）的例子，它是纳什均衡中的一个典型例子，它很好的阐明了寡头垄断的厂商面临的问题。寡头垄断：只有几个少数的厂商相互竞争，且新厂商的进入是受到阻碍的市场。我们认为，各个厂商的产品可以有差别，也可以没有差别，汽车，钢铁，航空等行业都是寡头垄断的例子。经营一个寡头垄断企业很复杂，这是因为定价，产量，广告和投资决策都包含了重要性的策略性考虑。因为只有少数厂商在竞争，各厂商必须考虑他的行为对他的竞争对手有什么影响，以及他的对手大概会如何反应。我们回到囚徒困境中来，两个囚徒正陷于困惑的状态，他们面临着的是，如果他们均同意不坦白，那么各人只需入狱2年，但他们不能相互共谋，并且即使能够共谋，他们能够相互信任吗？如果囚徒1不坦白，他就要冒着被他先前的同谋犯利用的危险。无论怎么说，不管囚徒1怎么选择，囚徒2坦白总是优选方案。同样，囚徒1坦白也是优选方案，所以囚徒2必须担心要是不坦白，他就会被利用。因此，两囚徒大概都会坦白并入狱5年。囚徒2 囚徒困境的支付矩阵就像我们的囚徒一样，各厂商都有一种背叛的和削价与它的竞囚徒 1 坦白 -5，-5 -1，-10 不坦白 -10，-1 -2，-2

囚徒困境在管理学的运用

囚徒困境在管理学上意义与运用几个月前看了一本James Miller 写的《Game Theory at Work》，一直想写读后感的，可是一直没肯花时间。现在总算有心情写了。这本书看了之后收获相当大，理解了许多以前不知道的概念。比如说以前看电影《美丽心灵》，听说了纳什均衡这么个概念，可是一直不知道它是什么意思，现在总算懂了。还有些现象生活中常见，却一直没有仔细全面对其思考过，现在看了书，理解又深了一个层次。比如说逆向选择原理：追女生的时候，如果你猴急猴急得，那十有八九会失败；如果你若即若离的，那可能就要论到对方猴急了。找工作也是，如果你面试时，表现的特别向往这个公司，面试官就会怀疑你的能力；反过来，是公司死乞百赖非要你去，你就会后悔自己工资开低了。不过，博弈论中最著名的一条原理应当是囚徒困境，很多经济方面的书也会专门讲解这个原理。一、囚徒困境先引用经济学家曼昆（N. Gregory Mankiw）的《经济学原理Principles of Economics》中的描述说明一下啥叫囚徒困境：警方有充足的证据证实邦妮（Bonnie）和克莱德（Clyde）犯有非法持有枪支的轻罪，如果这项罪名成立，他们将被判入狱1年。警方同时怀疑这两人犯有抢劫银行的重罪，但缺乏相应的铁证。于是警方将两人分别关在隔离的审讯室进行审讯。警方对嫌疑人进行了相同的讯问：“因非法持有枪支，现在就可以判你1年徒刑。如果你承认抢劫银行并指控你的同伙，你将被豁免诉讼并得到释放。你的同伙将因此坐牢20年。但是，如果你们两人都坦白罪行，因为我们不需要你的呈堂证词并省去审判的费用，你将被判8年徒刑。”（注意，美国法律允许犯罪嫌疑人主动承认控罪以换取较轻的刑罚。）邦妮和克莱德该怎么办呢？我们假设着两个罪犯都是自私和理性的。先考虑邦妮的决定。她是这样考虑的，“我不知道克莱德会怎样做。如果他保持沉默，我的最佳策略是坦白，这样我可以马上得到释放而不用坐1年的牢房。如果他坦白，我最好的策略还是坦白，我将坐牢8年而不用坐牢20年。因此，无论克莱德怎样做，我最好坦白。” 克莱德也会有与邦妮同样的想法：无论邦尼怎么选择，坦白都是我最好的选择。因此两个罪犯都会坦白并揭发对方，一起在牢里呆上8年。如果他们两个都保持沉默，只要1年就会出去，但是理性的博弈使他们共同选择了对他们来说最坏的结局。囚徒困境在日常生活中其实非常普遍。比如说一个小镇上有两家生产饮料的公司，如果他们两个都不做广告，那么他们平分市场，都会赚到一大笔利润。可是因为每家公司都会认为，做广告吸引客户使自己的最优选择，所以两家公司都会做广告。最后他们还是评分市场，但利润都交给了广告商，谁也没赚到钱。二、摆脱囚徒困境当我们遇到相似的情形时，还是有可能从囚徒困境中摆脱出来的。签订协定就是最好的摆脱囚徒困境的方法。比如说两个小朋友干了坏事，被老师叫去之前通常会约定好，谁都不许出卖对方。这样老师就调查不出他们更多的不了记录，对两个人的惩罚都会比较轻。

现实中的囚徒困境现实案例

现实中的囚徒困境现实案例-优势策略均衡-免费搭车(博弈策略) 1、家电价格战：由于彩电行业是寡头控制的，9大厂商控制了70%的市场份额，这样的博弈互动特征更为突出。1999年4月，长虹为扩大市场宣布彩电产品降价，各整个行业市场造成巨大震动，随即康佳、TCL、创维达成默契：建立彩电联盟。直到4月20日上午，康佳仍然表示不降价，但是当晚即改变主意，使得TCL和创维措手不及，价格战立即蔓延开来。大家都降价对于各自的扩大市场没有多大帮助，反而使得利润都被削弱了，1996~2000年，彩电行业发生大的价格战达到8次以上，整个行业的利润被极大削减，全行业进入亏损，信息产业部统计价格战使行业利润减少147亿元。价格战于人于己都不利，为什么还打价格战呢？这是一个简单的囚徒困境博弈形势。双方作好的结果都是降价，降价都是“优势策略”。大家可能会想到成立价格联盟，但是事实是：2000年6月9日，TCL、海信、创维、厦华、乐华、金星、熊猫、西湘9家厂商歃血结盟，召开了彩电联盟峰会，实际上是一纸空文，当年8月康佳响应长虹的降价20%口号，率先脱离9家同盟会，价格战在次开打。所以，任何同盟都敌不过“先下手为强”的背义利益来的真实。 2、军备竞赛：冷战时期的美苏军备竞赛都是各自的优势策略，双方都无法信任对方不搞军事发展，都担心自己被设计而陷入危险，所以即使曾经出现了“盟约”，最后还是不得不撕毁。 3、公共资源的过度使用：哈丁（Hardin）于1968年在《科学》杂志上发表的论文《公共地悲剧》经常被引用，表达了这样一个思想：如果人们都只关注个人福利，公共资源就会被过度使用。例如：《公共草地牧羊》一片公共草地可以养羊，但是随着羊的数量增加，草地对羊的贡献价值再下降，假设养2只羊，每只可以带来100元的价值，养3只羊，则每只可以得到60元的价值，到了养4只以后，每只的价值只有40元。如果共有2个养殖户，可以各自选择养1只还是2只时，盈利表显示各自的优势策略是养2只，共4只，所以草地作为公共资源只能产生4x40=160远的价值，远低于2x100=200的贡献，这就是公共资源过度利用，而最后各人利益也被消减了。也说明了对公共财产界定私有产权的重要性。