博弈名词解释

博弈名词解释
博弈名词解释

一、名词解释:

1、零和游戏——游戏者有输有赢,但整个游戏的总成绩永远为零。

2、纳什均衡——只有在这一点上,任何一人单方面改变选择,他只会得到较差的结

果。这一点就是纳什均衡。

3、帕累托最优——指资源分配的一种状态,在不使任何人境况变坏的情况下,不可能再

使某些人的处境变好。说得更经济学点,群体所有的社会资源的配置已将整个群体的效用最大化了,没人能够在不减损别人的利益的同时改善自己的利益。

二、简答题

1.博弈的四个要素是什么?

1.博弈要有2个或2个以上的参与者(Player)。

2.博弈要有参与各方争夺的资源或收益(Resources或Payoff)。

3. 参与者有自己能够选择的策略(Strategy)。

4. 参与者拥有一定量的信息(Information)。

2.什么是触发策略?触发策略有何优点

如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略(Trigger strategy),或称冷酷策略

好的策略必须具有的一个特点是“清晰性”,针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。

如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。

3.请描述“囚徒困境”的案例。

两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”:如果两人都坦白则各判8年;

如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年;

如果都不坦白则各判1年。

从表面上看,他们应该互相合作,保持沉默。但他们不得不仔细考虑对方可能采取什么选择。甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。

甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。无论乙招与不招,我的最佳选择都是招认。还是招了吧。

自然,乙也同样精明,也会如此推理。

4.请举例说明理性决策的困境。

分钱博弈

一个宾馆服务员捡到了100元,他想据为己有;可是另一个服务员看到了,于是威胁如果不分给他一部分,他就要向领班报告,在那种情况下,这笔钱就要上缴,谁也得不到。

A提方案时要猜测B的反应,A会这样想:根据“理性人”的假定,A无论提出什么方案给B——除了1分钱都不给B这种极端的情况,B只有接受,因为B接受了还有所得,而不接受将一无所获——当然此时A也将一无所获。

此时理性的A的方案可以是:留给B一点点比如1分钱,而将99.99元归为己有,即方案是:99.99:0.01。B接受了还会有0.01元,而不接受将什么也没有。

三、论述题:

1.麦当劳和肯德基为什么总是相邻设店?

假设有条完全笔直的公路,连接城市A到城市B之间的交通。这条公路上每天行驶着大量的车辆,并且车流量在公路上是均匀分布的。假设麦当劳和肯德基要在这条公路上选择一个位置,招揽来往车辆。

一个合乎逻辑的假定:通常情况下,车辆总是乐意到距自己最近的快餐店购买食物。

从资源的最佳配置来看,麦当劳、肯德基应该分别开在1/4、3/4处是最优。在这种均匀散布的情况下,每家快餐店所有拥有的客户从距离最近的城市到两家快餐店的中心为止,因此都拥有1/2的顾客量,同时对于开车的人们总体来说,这种策略的选择,车辆到快餐店的总的距离最短。

肯德基与麦当劳都是百年老店,自然是精明之至,从经济学上就是具有经济理性,总是希望自己的生意尽可能地红火,至于其他人的生意的好坏则与己无关。

出于这种理性,肯德基肯定会想到:如果将店铺从3/4点处向左移一点,将从麦当劳抢夺走部分顾客,这对于肯德基单方面来说无疑是一个好主意。

当然麦当劳也不甘示弱,作为一个“理性人”,麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。

肯德基与麦当劳都是百年老店,自然是精明之至,从经济学上就是具有经济理性,总是希望自己的生意尽可能地红火,至于其他人的生意的好坏则与己无关。

出于这种理性,肯德基肯定会想到:如果将店铺从3/4点处向左移一点,将从麦当劳抢夺走部分顾客,这对于肯德基单方面来说无疑是一个好主意。

当然麦当劳也不甘示弱,作为一个“理性人”,麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。

2.请举例说明一次博弈和多次博弈的区别。

就恋爱博弈来看,男女双方在交往的过程,随时都在博弈,因为相爱的过程中任何一个时点都是有可能分手的。用博弈论的术语来说,这是一种囚徒困境的重复博弈。无数爱情故事中的悲欢离合、精彩跌宕正是这个博弈模型的表现。

素不相识一对男女的一夜情是一次性囚徒困境博弈

3.请举例说明逆向选择的困境,并说明走出逆向选择的途径?

保险市场上的逆向选择现象相当普遍。不同投保人的风险水平可能不同。有些人可能有与生俱来的高风险,比如他们容易得病,或者有家族病史;而另一些人可能有与生俱来的低风险,比如他们生活有规律,饮食结构合理,或者家族寿命都比较长。这些有关风险的信息是投保人的私人信息,保险公司无法完全掌握。

如果保险公司对所有投保人制定统一保险费用(这属于总体保险合同),由于保险公司事先无法辨别潜在投保人的风险水平,这个统一的保险费用只能按照总人口的平均发病率或平均死亡率来制定,所以它必然低于高风险投保人应承担的费用,同时高于低风险投保人应承担的费用,从而使得低风险投保人由于保险费用过高而退出保险市场,保险市场上只剩下高风险的投保人,即出现高风险投保人驱逐低风险投保人的逆向选择现象。

其结果是保险公司的赔偿概率将超过根据统计得到的总体损失发生的概率,这将导致保险公司出现亏损甚至破产。

逆向选择的困境,解决的途径除有三个:

一是“信号传递”;二是“信息甄别”;三是制度设计。

四、案例分析:

1.某城市政府采购办公用品,每年招标,只挑选两个供应商。政府每个月采购一次,两个供应商每个月就当月采购商品报价。实行“价低者得”原则,如两供应商报价相同,则订单分为均等的两半,两供应商各得50%。如报价不同,则全部订单给价低者。请问这两个供应商应如何报价?为什么?

两供应商相互合作,共同报一相同高价,获取最大利润,自是双方的最优策略。

两供应商共同合作了11个月,但在第12个月,两供应商知道这是今年最后一次,对方很

有可能背叛。与其对方背叛,不如自己背叛。

两供应商知道第12次对方会背叛,那么第11次不如我就背叛,因为第11次采用合作的态度并不会促使对方在第12次时合作。

同理,第10次、第9次……第1次,每一次都应该背叛。

因此双方不可能合作共同报高价,而是相互竞争地报低价。

2.假设你是一个处于古战场前线的士兵,当面对敌方的阵线时你采取何种策略最佳?如果己方获胜,你的贡献不太可能是决定性的,你倒是冒着有可能受伤或者牺牲的风险;

如果敌方取胜,你伤亡的可能性就更大了。于是唯一合理的结论是:逃跑。如果每个士兵都如此推理的话,恐怕战争就不存在了。请说明为什么大多的士兵并没有逃跑?上述是一个典型的囚徒困境的推理,这样的事情当然不会发生,大多的士兵并没有逃跑,这是因为有比上面简单推理更多的东西,至少对逃跑士兵的处决,就使得逃跑的代价比起与战友同生共死来得严重。对那些缺乏意志与勇气的士兵,军队中往往会通过惩罚临阵逃脱来激发他们的斗志。

大部分军队中,假如有士兵在战士逃跑,他就会被就地正法。因此,退缩就会被枪毙,对士兵逃跑造成了巨大压力。临阵退缩遭受惩罚也意味着一种无耻的死,那么,选择勇往直前更具吸引力。

还有每个士兵,拥有对自己的国家的自豪感,使得他们会坚持作战下去。而不是想到轻易地逃跑。再说,战场中,士兵之间是多次博弈,一定程度上可能成为契约集体。而且在军队中存在威胁和惩罚,使得士兵不敢轻易背叛做逃兵。。因此,士兵们在策略选择上,会比较慎重,会考虑,因此而产生的后果可能增加交易成本。而不使简单的自私自利的选择逃跑。

3.仅1985年至2000年的15年里,中央就下达“减负令”49次。减轻中小学生过重负担喊了20多年,实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。请说明数十道“减负令”难见效,中小学生课业负担不减反增的原因。

上述问题中,学生事实上被置于囚徒困境。囚徒困境是一个博弈论中的词汇,主要说做出选择时,个体理性和群体理性的关系。而个人,又总是在为自身利益最大化的追求来做出自己的选择。他们明知,朝着整体利益做选择时,对自己有利。但人的私心总希望自己占多一些便宜,此时做出选择,却不是好的选择。所以虽然下达多次减负令,而事实上没每个学校、每位家长、每个学生都会基于自身利益最大化的角度考虑,最终导致合作无法产生。

减负之后,不少家长会这样想:假定其他孩子减负玩耍,我家孩子在家苦读,将来考大学会有优势。假定其他孩子也在家苦读,我家孩子就得加倍苦读,否则就会在将来的高考为别人垫底了。于是,家长对孩子的学习发而抓得更严。还有,学生自己也会想:别人都补课,我总不能不补。加上学校为了提高升学率,也不得不竞相增加学生的可与作业。

事实上,减负并不减负,其原因是显然的,只要进大学还要考,中学生还只能走高考这一条独木桥。负是难减的,所谓上有政策,下有对策。

博弈论(整理过名词解释和简答)

名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响 6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。 13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件: (1)决策结x是单结信息集; (2)在一个信息集的决策结必须是同一个决策结的后续结。 14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。 15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动; 动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。 17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。 18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。 19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。

博弈论 考试

四、名词解释(每小题3分,共15分) 参与人(player) 指的是博弈中选择行动以最大化自己效用(收益)的决策主体,参与人有时也称局中人,可以是个人,也可以是企业、国家等团体; 策略(strategy) 是参与人选择行动的规则,如“以牙还牙”是一种策略; 信息(information) 是指参与人在博弈中的知识,尤其是有关其他参与人的特征和行动的知识;支付(payoff)函数 是参与人从博弈中获得的效用水平,它是所有参与人策略或行动的函数,是每个参与人很关心的东西; 结果(outcome) 是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来表示;均衡(equilibrium) 是所有参与人的最优策略或行动的组合。 静态博弈 指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动; 动态博弈 指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 博弈 就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 零和博弈: 也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同 变和博弈: 零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。 完全信息静态博弈 即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。 上策: 不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略 上策均衡: 一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 严格下策: 不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略

博弈名词解释

一、名词解释: 1、零和游戏——游戏者有输有赢,但整个游戏的总成绩永远为零。 2、纳什均衡——只有在这一点上,任何一人单方面改变选择,他只会得到较差的结 果。这一点就是纳什均衡。 3、帕累托最优——指资源分配的一种状态,在不使任何人境况变坏的情况下,不可能再 使某些人的处境变好。说得更经济学点,群体所有的社会资源的配置已将整个群体的效用最大化了,没人能够在不减损别人的利益的同时改善自己的利益。 二、简答题 1.博弈的四个要素是什么? 1.博弈要有2个或2个以上的参与者(Player)。 2.博弈要有参与各方争夺的资源或收益(Resources或Payoff)。 3. 参与者有自己能够选择的策略(Strategy)。 4. 参与者拥有一定量的信息(Information)。 2.什么是触发策略?触发策略有何优点 如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略(Trigger strategy),或称冷酷策略 好的策略必须具有的一个特点是“清晰性”,针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。 如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。 3.请描述“囚徒困境”的案例。 两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”:如果两人都坦白则各判8年; 如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年; 如果都不坦白则各判1年。 从表面上看,他们应该互相合作,保持沉默。但他们不得不仔细考虑对方可能采取什么选择。甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。 甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。无论乙招与不招,我的最佳选择都是招认。还是招了吧。 自然,乙也同样精明,也会如此推理。 4.请举例说明理性决策的困境。 分钱博弈 一个宾馆服务员捡到了100元,他想据为己有;可是另一个服务员看到了,于是威胁如果不分给他一部分,他就要向领班报告,在那种情况下,这笔钱就要上缴,谁也得不到。 A提方案时要猜测B的反应,A会这样想:根据“理性人”的假定,A无论提出什么方案给B——除了1分钱都不给B这种极端的情况,B只有接受,因为B接受了还有所得,而不接受将一无所获——当然此时A也将一无所获。 此时理性的A的方案可以是:留给B一点点比如1分钱,而将99.99元归为己有,即方案是:99.99:0.01。B接受了还会有0.01元,而不接受将什么也没有。 三、论述题:

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

博弈论名词解释

- 博弈名词解释 1.博弈论: 根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论。 2.参与人(局中人)(players ):在一场竞赛或博弈中,每一个有决策权的参与者成为一个“多局中人。只有两个局中人的博弈现象称为“两人博弈”, 而多于两个局中人的博弈称为人博弈”。 :一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即略(strategies)3.策 一个局中人的一个可行的自而是指导整个行动的一个方案,方案不是某阶段的行动方案, 如果在一个博弈中局中人称为这个局中人的一个策略。始至终全局筹划的一个行动方案, 都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 ):参与人有关博弈的知识,特别是有关自然的选择,其他

参information 4.信息(与人的特征和行动的知识。:,参与人从博弈中获得的效用水平,它是所有参与人取定5.支付(payoff )函数的一组策略的函数。 ):博弈者感兴趣的要素的集合。6.结果(outcome 参与人同时选择或虽非同时选择但后行动者并不知道先行动静态博弈:在博弈中,7. 者采取了什么具体行动。 且后行动者能够观察到先行动者所参与人的行动有先后顺序,8.动态博弈:在博弈中,选择的行动。 :属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益9.零和游戏(零和博弈)博弈各方的收益和损失相加总和永远为“零”。双方不存在合作必然意味着另一方的损失, 整个社会的零和博弈的结果是一方吃掉另一方,的可能。一方的所得正是另一方的所失,利益并不会因此而增加一分。两个人下棋、或是打乒乓球。 和博弈:又叫非零和博弈,是指各博弈方的得益之和是一个非零的常数。自己的所得10.常并不与他人的所失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人“双赢”的可能,进而合作。在恋爱中一方受伤也可能“损人不利己”,所以博弈双方存在 也有可能双方一的时候,对方并不是一定得到满足。也有可能双方一起能得精神的满足。起受伤。通常,彼此精

博弈论复习题及答案

博弈论复习题及答案 Pleasure Group Office【T985AB-B866SYT-B182C-BS682T-STT18】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些基本特点是什么 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈请求出其中的纳什均衡

答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险有什么办法可以解决道德风险问题 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 F 2 B 2 F 1 B 1 答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H 选择F1和N 选择F2,以及H 选择B1和N 选择B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和“R ”的行动,其收益如下:当A 选左,B 选L 时,A 的收益为2 ,B 的收益为3;当A 选左,B 选R 时,A 的收益为1 ,B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1;当A 选右,B 选R 时,A 的收益为N H

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论与日常生活(期末考试复习题)

《博弈论与日常生活》期末复习题 一、填空题: 1、1944年美国普林斯顿大学著名数学教授冯·诺依曼和著名经济学家摩根斯坦共同创作的《博弈论与经济行为》出版,标志着现代博弈理论的基本形成。 2、“纳什均衡”与“囚徒困境”共同组成了现代非合作博弈论的坚实基石。 3、走出囚徒困境的最有效的方法就是合作。 4、夏普里值方法的核心是付出与收益成比例。 5、“请问爆的是哪只胎?”的故事给我们的启示是聪明反被聪明误。 6、猎鹿博弈所反映的问题是,合作能够带来最大的利益。 7、“搭便车”行为是现代经济社会中的常见现象,可以利用智猪博弈进行分析和解读。 8、马太效应就是“强者恒强,弱者恒弱”;任何个体、群体或地区,一旦在某一方面获得成功和进步,就会产生一种积累优势,就有更多的机会取得更大的成功和进步。 二、判断题: 1、根据博弈论的定义,一场博弈一般要包含的最重要的四个基本要素是:利益、信息、策略和均衡。(×) 2、根据“前景理论”,如果要向他人传递几个好消息,应该把它们单独公开。(√) 3、“QWERTY”键盘是历史是排列最科学的方式。(×) 4、在很多时候,“妥协”会被认为是软弱的表现,是懦夫的行为,但其实“妥协”是非常实际、灵活的智慧,在斗鸡博弈中有很好的体现。(√) 5、在枪手博弈中,活下来可能性最大的是枪法最好的甲。(×) 6、海盗分金博弈中,最科学合理的分配方式就是平均分配金币。(×) 7、所谓“柠檬市场”过去是指专门出售柠檬的市场,现在专指“二手车市场”。(×) 三、名词解释: 1、纳什均衡:纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),

博弈论名词解释

1、博弈:是指代表不同利益主体的决策者,在一定的环境条件和规则下,同时或先后、一次或多次从各自允许选择的行动方案中加以选择并实施,从而取得各自相应结果的活动。 2、参与人:也称局中人或博弈方。是指博弈中能独立决策、独立行动并承担决策结果的利益主体。 3、行动:是参与人在博弈的某个时点的决策变量。 4、博弈信息:是参与人在博弈中的知识。包括博弈的环境条件、博弈的规则、自然的“安 排”、其他参与人的特征及行为、博弈的结果、进程等等。 5、策略:是指各博弈方可选择的行动方案,亦称战略。 6、纯策略:指一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动。 7、混合策略:指一个策略规定参与人在给定信息情况下以某种概率分布随机地选择不同的 行动。 8、支付函数:也称得益,是指博弈方(参与人)策略实施后所获得的效用水平。 9、结果:是指博弈分析者所探寻的各种要素的集合,比如策略组合、支付向量等。 10、纳什均衡:是指在对方策略确定的情况下,每个参与人的策略都是最好的,此时没有人 愿意单独改变自己的策略。 11、两人博弈:就是参与人是两方的博弈。 12、多人博弈:是参与人有三个或三个以上的博弈。 13、零和博弈:每个支付向量的“总和”始终等于零的博弈称为零和博弈。 14、常和博弈:我们把每个支付向量的“总和”始终等于某个常数的博弈称为常和博弈。 15、变和博弈:我们把每个支付向量的“总和”并不相同的博弈称为变和博弈。 16、静态博弈:我们把所有参与人同时或可看作同时选择策略的博弈称为静态博弈。 17、动态博弈:我们把各参与人不是同时,而是先后、依次进行选择、行动,而且后选择行 为的参与人通常能观察到先进行选择、行为的参与人的选择、行为的博弈称为动态博弈。 18、重复博弈:就是同样结构的博弈重复进行多次。 19、完全信息博弈:如果所有策略组合下的支付向量都是共同知识,我们就说这一博弈是“完 全信息”的,称为完全信息博弈。 20、不完全信息博弈:如果并非所有策略组合下的支付向量都是共同知识,我们就称这一博 弈为“不完全信息博弈” 21、纳什定理:如果允许混合策略,那么每个有限博弈都有纳什均衡。

博弈论基础复习

《博弈论基础》复习大纲 一、名词解释(5×2=10分) 策略型博弈 它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡 指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略 局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈 博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树 对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈 是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈 指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。 行为策略 是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法 逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略 又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 一般地,将一个参与人所拥有的所有私人信息称为他的类型。 静态贝叶斯均衡 是一种与类型有关的策略组合,其中每个局中人在给定自己类型和其它局中人策略的情况下最大化自己的期望效用函数。

信号博弈 是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡 信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡 信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 联盟 设},,2,1{I =ζ为局中人集合,则其中任意一非空子集ζ?S 为一个联盟。 特征函数 特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 核 多人合作博弈中所有不被超优的分配的集合。 核仁 合作博弈核仁解所依据的基本思想是:在分配属于核仁的条件下,最不理想的联盟也要优于任何其它分配向量的最不理想的联盟。 二、 判断题(5×1=5分) 三、 简答题(4×7=28分) 策略型博弈的基本要素。 策略型博弈的基本要素有: 局中人:即博弈的参与者,可以是自然人﹑企业﹑政府﹑社团等。 策略:指每个局中人在博弈中可选择采用的行动方案。 支付:指每个局中人从各种策略组合中获得的收益。 什么是纳什均衡?你是如何理解的? 纳什均衡及其理解: 在一个博弈过程中,无论其它局中人的策略选择如何,局中人都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,局中人谁都没有动机单方面偏离该状态,那么这个组合就被定义为纳什均衡。 1.是完全信息静态博弈的解的一般概念。 2.每一个严格占优战略均衡一定是纳什均衡,反之不然。

博弈论的复习资料

名词解释: 1,共同知识:是指所有当事人对该事件都知道,并且也所有当事人都知道其他当事人也知道这一事件,并且所有当事人都知道所有当事人都知道这一事件。那么该事件就是共同知识。 2,先动优势:在序贯情侣博弈中,任何一方率先采取行动可能得到的好处,都比他或她后行动可能得到的好处大。这种局中人先动得益大于后行得益的情况,叫做先动优势。3,后动优势:后行动的得益比先行动的得益大的情况 4,信息集:我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。 ?单点集:我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。 ?触发策略:即只要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。 ?冷酷策略:双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛。即任何局中人的一次性不合作将触发永远不合作。 ?礼尚往来策略:开始的时候和冷酷策略一样,即双方从合作开始,在以后的每个阶段,如果你的对手在最近的一次博弈中还是采取合作策略,则你继续跟他合作; 如果你的对手在上一阶段的博弈中采取背叛策略,则你在下次的博弈中采取背叛策略惩罚他,但是如果你的对手在下一次博弈中改邪归正,采用合作策略,则你在下次继续博弈中还是跟他合作。 触发策略是带有奖励和惩罚措施的一种博弈机制。在这个机制中,惩罚措施是其中的关键。注意:(1),一个信息集罩住的必须是同一个局中人的决策点。 ?必须是同一个局中人在同一个时点的决策节点。

博弈论复习题及答案

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另

外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题? 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 F 2 B 2 F 1 B 1 答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H 选择F1和N 选择F2,以及H 选择B1和N 选择B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和“R ”的行动,其收益如下:当A 选左,B 选L 时,A 的收益为2 ,B 的收益为3;当A 选左,B 选R 时,A 的收益为1 ,B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1;当A 选右,B 选R 时,A 的收益为0 ,B 的收益为2。请画出该博弈的博弈树,并求出该博弈的均衡解。 N H

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论名词解释

博弈名词解释 1.博弈论: 根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论。 2.参与人(局中人)(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。 3.策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 4.信息(information):参与人有关博弈的知识,特别是有关自然的选择,其他参与人的特征和行动的知识。 5.支付(payoff)函数:,参与人从博弈中获得的效用水平,它是所有参与人取定的一组策略的函数。 6.结果(outcome):博弈者感兴趣的要素的集合。 7.静态博弈:在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。 8.动态博弈:在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 9.零和游戏(零和博弈):属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。双方不存在合作的可能。零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。两个人下棋、或是打乒乓球。 10.常和博弈:又叫非零和博弈,是指各博弈方的得益之和是一个非零的常数。自己的所得并不与他人的所失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在“双赢”的可能,进而合作。在恋爱中一方受伤的时候,对方并不是一定得到满足。也有可能双方一起能得精神的满足。也有可能双方一起受伤。通常,彼此精神的损益不是零和的。 11.变和博弈:也称非常和博弈,则是指随着博弈参与者选择的策略不同,各方的得益总和也不同。如在同一个股票市场,面对同样的大盘走势,伴随着投资者的投资策略不同,有可能大部分人赚钱而小部分人亏钱,也有可能小部分人赚而大部分人亏,甚至还有可能所有人都赚或都亏。 12.占优策略:占优均衡(dominant equilibrium),指不论其他参与者做何种策略选择,每个参与者的最佳策略都是唯一的,其结果为占优均衡。每一个博弈中的企业通常都拥有不止一个竞争策略,其所有策略的集合构成了该企业的策略集。在企业各自的策略集中,如果存在一

博弈论第一章习题

博弈论练习一 班级学号姓名 一、名词解释(20分) 博弈 零和博弈 完全信息静态博弈 纳什均衡 混合策略 纳什定理 动态博弈 子博弈 子博弈完美纳什均衡 逆推归纳法 二、填空题(10分) 1.根据博弈中的得益可以把博弈分为:()、()和()。 2.根据博弈的过程可以把博弈分为:()、()和()。 3.纳什均衡的价值主要在于它有一些重要的性质,()就是其中最重要的性质之一。4.分析完全信息静态博弈的方法包括:()、()、()和()。 5、纳什均衡分析在动态博弈的失效与动态博弈各博弈方策略中选择行为的()问题 是联系在一起的。

三、判断题(4分) 1. 各博弈方混合策略纳什均衡的得益大于纯策略纳什均衡的得益。( ) 2. 在具有有限的博弈方和策略集的博弈中,纳什均衡不一定存在。( ) 3. 动态博弈中各博弈方不会同时作出选择。( ) 4. 博弈方的理性是影响动态博弈的重要因素。( ) 四、单项选择题(10分) 1.根据各博弈方的得益信息,我们可以把博弈分为:( )。 A .零和博弈、常和博弈和变和博弈 B .完全信息博弈和不完全信息博弈 C .静态博弈和动态博弈 D .完美信息博弈和不完美信息博弈 2.根据是否所有博弈方都对选择前的博弈过程完全了解,我们可以把博弈分为:( )。 A .零和博弈、常和博弈和变和博弈 B .完全信息博弈和不完全信息博弈 C .静态博弈和动态博弈 D .完美信息博弈和不完美信息博弈 3.( )可以排除不可信威胁。 A .纳什均衡 B .帕雷托上策均衡 C .子博弈完美均衡 D .风险上策均衡 4.颤抖手均衡是理解( )中偏离子博弈完美纳什均衡行为最为重要的思想之一。 A .完全信息静态博弈 B .完全理性动态博弈 C .完美信息动态博弈 D .有限理性博弈 5、寻找子博弈完美均衡的方法一般是( )。 A .划线法 B .箭头法 C .上策均衡分析 D .逆推归纳法 五、计算分析题(50分) 1.夫妻博弈:(10分) 丈夫 时装 足球 妻子 时装 足球 (1)求博弈的纯策略纳什均衡(4分) (2)求博弈的混合策略纳什均衡(4分) (3)比较纯策略纳什均衡与混合策略纳什均衡夫妻的得益。(2分)

博弈论(整理过名词解释和简答)

博弈论(整理过名词解释和简答)

一、名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响

6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。

博弈论(整理过名词解释和简答)

一、名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响 6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。 13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件: (1)决策结x是单结信息集; (2)在一个信息集的决策结必须是同一个决策结的后续结。 14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。 15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动; 动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。 17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。 18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。 19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。

经济博弈论复习

《经济博弈论》复习精要 一.题型分值: 1.名词解释:4分* 5 = 20分; 2.判断题:2分* 10 = 20分; 3.简答题:7分*3=21分; 4.计算题:9分*1+10分*3=39分. 二.名词解释(4分* 5 = 20分,5题,共20 题) 1.博弈:指策略对抗,或策略有关键作用的游戏;博弈即一些个人、队组或其它 组织,面对一定的坏境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相 应结果的过程。 2.博弈论(Game Theory):指系统研究各种各样博弈中参与人的合理选择及其 均衡的理论,该理论思想的主要特征是博弈中各 参与人的策略和得益相互依存、相互依赖。 3.策略:博弈中各博弈方的选择内容(每个博弈方可选策略不一定完全相同, 即不一定对称) 4.得益:各博弈方从博弈中所获得的利益(利润、收入、量化的效用、社会 效益、福利等,有效用,有损失) 5.上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的 上策,必然是该博弈比较稳定的结果。 6.严格下策:不管其它博弈方策略如何变化,给一个博弈方带来的收益总是 比另一策略给他带来收益小的策略。(严格下策反复消去法)7.划线法:指用策略之间的相对优劣关系,而不是绝对优劣关系来进行博弈 选择以求纳什均衡的方法。(划线法的思路是先找出每个博弈方针 对其他博弈方所有策略(或策略组合)的最佳对策,然后再找出相 互构成最佳对策的各博弈方策略组成的策略组合,即纳什均衡) 8.纳什均衡:使每个参与人的策略是对其他参与人策略的最优反应的策略组合。 9. 反应函数:指一博弈方对另一博弈方每种可能的决策内容的最佳反应决策所 构成的函数。 10.帕累托上策均衡:指多重纳什均衡中给所有博弈方带来的得益都大于其他所 有纳什均衡带来的得益的那个纳什均衡。 11. 风险上策均衡:如果所有博弈方在预计其他博弈方采用各种策略的概率相同 时,能给博弈方带来最大期望得益,且被各博弈方偏爱策 略组合。 12.逆推归纳法:指从动态博弈的最后一个阶段博弈方的行为开始分析,逐步 倒推回前一个阶段相应博弈方的行为选择,一直到第一个 阶段的分析方法。 13.子博弈:指由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构 成的,有初始信息集和进行博弈所需要的全部信息,能够 自成一个博弈的原博弈部分。 14.子博弈完美纳什均衡:指如果一个完美信息的动态博弈中,各博弈方的策

相关文档
最新文档