基于博弈论计算机网络对抗问题研究

基于博弈论计算机网络对抗问题研究
基于博弈论计算机网络对抗问题研究

收稿日期:2014-01-08修回日期:2014-03-17

基金项目:

国家自然科学基金(71031007);国家“八六三”基金资助项目(2011AA7114019;2012AA7114059)作者简介:王长春(1983-),男,江西吉安人,博士。研究方向:网络安全、体系对抗。

*摘

要:针对日益普遍和多样的网络攻击行为,如何对网络各种攻防过程进行分析已逐渐成为热点研究方向。

在对计算机网络对抗问题复杂性表现和产生根源进行探讨基础上,从完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈4个视角,对计算机网络对抗问题进行分类论述,对各解决方法进行了综合比较,并对今后的研究进行了展望。

关键词:计算机网络对抗,复杂性,博弈论,人为因素中图分类号:TP393

文献标识码:A

基于博弈论计算机网络对抗问题研究*

王长春,陈志杰

(空军装备研究院雷达所,北京100085)

Survey on Computer Network Operation Based on Game Theory

WANG Chang-chun ,CHEN Zhi-jie

(Radar Institute ,Air Force Equipment Academy ,Beijing 100085,China )

Abstract :

In order to deal with prevalent and various network attack ,it has attracted much attention how to analyze the network operation.According to describe the complex phenomena and explore the cause ,this article surveys the state of the art in computer network operation from four dimensions.We also present the challenges which are still worth to further research in the area.

Key words :

network operation ,complexity ,game theory ,human factor 0引言

随着计算机技术的迅猛发展,社会活动和人类

生活在各种计算机设备、网络的支撑下步入了信息化时代。随着各国军队大量信息化武器装备的研制、使用,作为信息产生、传输、控制、处理主体的网络也已经成为军事信息系统的神经中枢,网络的性能、状态直接关系到军队的战斗力,影响到整个战争机器。作为信息对抗的一个重要组成部分,计算机网络对抗已经成为了继陆、海、空、天、电之外的第六维敌我交战的主战场[1]。

目前关于计算机网络对抗主要存在3种观点。①“争夺说”,认为计算机网络对抗是在信息网络环境中,以网络为目标,围绕信息侦察、信息欺骗、信息攻击,为争夺网络信息优势而进行活动的总称;②“程序说”,认为计算机网络对抗是利用网络病毒

武器为主的程序攻击活动的总称;③“攻防说”,认

为计算机网络对抗是研究如何防御敌方攻击破坏己方网络系统和如何攻击破坏敌方网络系统的理论与技术的一门科学。概括起来,计算机网络对抗可以描述为:在网络空间中,利用敌方网络系统的安全缺陷,侵入敌方网络,窃听、伪造或破坏敌方信息,降低、破坏敌方网络的使用效能,同时保护己方网络的安全,使其可以正常发挥效能而采取的各种措施的总和。计算机网络对抗的焦点是网络信息资源的机密性、完整性、可用性和可控性,对抗的目标是夺取制网络信息权。

网络攻击是一种人为行为,它形成的根本原因与人的利益驱动具有很大的关系,博弈论可以较好地描述网络攻防中“人”的因素对事态发展的影响。因此,基于博弈论网络攻防分析技术将是一个充满前景的研究方向。然而,目前这方面研究还没有完整

文章编号:1002-0640(2015)

03-0001-05Vol.40,No.3Mar ,2015

火力与指挥控制

Fire Control &Command Control 第40卷第3期2015年3月

1··

(总第40-)

的综述见诸报道。

1计算机网络对抗复杂性分析

1.1计算机网络对抗复杂性表现

系统的复杂性来源于我们对系统的不认识,计算机网络对抗显示出不为我们认识的诸多方面,本文将从不确定性、适应性和非线性来讨论其复杂性。

1.1.1不确定性

一方面,随着网络技术的广泛使用,众多作战单元通过无线电台、光纤光缆、卫星通信等媒体,进行着有线连接和无线连接,计算机网络对抗是真正意义上的全天候、全时辰连续作战,它几乎不受任何外界自然条件的制约。另一方面,对任何一个主权国家来说,领土、领空、领海都可以通过一定的边界进行确定,但网络空间与有形的物理空间不同,它是一个开放系统,几乎不受地域的任何限制,只要是网络所能覆盖的地方都是计算机网络对抗可及空间。

1.1.2适应性

网络攻击者可以运用网络侦查手段探测攻击目标的突破口,然后利用信息收集手段分析、挖掘攻击目标的脆弱点,并利用渗透入侵手段,实施多种攻击,直到实现对对方网络的破坏与控制。同时,网络防御者会利用各种网络安全预警技术,动态监测分析各种攻击事件,并对已受到的攻击能快速作出响应,在最短的时间内修复系统,最大限度地减少对己方网络的影响。

1.1.3非线性

涌现是有层次的,不同层次将产生不同的涌现效果,上一层次的涌现必由下面层次的涌现产生。在计算机网络对抗过程中,网络内局部的一个微小扰动,例如有人释放一个病毒,要是没有相应的预防机制,就会出现大面积的病毒感染现象,甚至人在网上的一次误操作都会涌现为雪崩式的灾难。1.2计算机网络对抗复杂性产生根源

复杂性产生的根源多种多样,任何单一因素都不能产生真正的复杂性,多种因素交织在一起才有可能形成真正的复杂性。本文将从技术和人两个视角来挖掘计算机网络对抗复杂性产生的根源。

1.2.1技术因素

一方面,从网络通信平台、网络协议到网络应用服务,从操作系统、系统软件、程序设计语言到应用软件,从系统安全配置、用户操作到安全管理等,“先天”都存在这样或那样的安全漏洞,只不过发现时间的早晚不同,对系统造成的危害程度不同而已。例如,操作系统、数据库或应用程序往往由几万行、几十万行程序代码编写而成,IBM的研究人员根据统计调查指出,这些程序平均每一千行代码中就可能存在一个Bug。

1.2.2人为因素

在计算机网络对抗领域里,人、网、环境相结合,形成了一个系统。在这个系统中,人以资源使用者的身份出现,是系统的主体,处于主导地位,系统的资源(包括软硬件、通讯网、数据、信息内容等)则是客体,而计算机网络作为“神经系统”通过反馈环路中把机器和人结合了起来。在计算机网络对抗过程中,攻击者会采取多种攻击技术和手段,探测发现系统脆弱性和漏洞,不断加以利用,以达到增大网络系统安全风险的目的。同时,防御者也会采取多种防御技术和手段,扫描发现网络系统中漏洞,并及时修补漏洞,降低己方网络系统的脆弱性。攻防双方的相互依赖关系如同两股相互纠缠的绳索,看起来有迹可循,实则难以准确把握。计算网络对抗过程中攻防双方的决策相互依赖关系如图1所示。

图1计算机网络对抗行动的相互依赖关系

计算机网络对抗的本质是网络背后人与人之间的对抗。而经过几十万年的进化与演变,人的心理、行为、思维都表现出极为复杂的运动形态,已远非一般的机械、物理、化学甚至生物的相互作用所能表达,同其他无“人”系统相比,“人”在环路的系统是一个典型的复杂适应系统。

从上文分析可知,由于技术因素和人的因素使得计算机网络对抗行动的演化充满了不确定性、适应性和非线性等复杂系统特征。从整体上看,笔者认为,技术因素是计算机网络对抗复杂性的基础,而人的因素才是计算机网络对抗复杂性的核心。

2计算机网络对抗博弈模型研究

计算机网络对抗是一个复杂而具有挑战性的问题,然而相互依赖的网络攻击者与防御者与

进行

火力与指挥控制2015年第3期2

··

0380

(总第40-)

博弈的双方之间存在异曲同工之处,这一属性激发了许多研究人员致力于将博弈论引入到计算机网络对抗领域。基于博弈计算机网络对抗建模思想是将网络攻防双方作为局中人,双方所采取的攻防手段作为策略集合,网络所处状态为博弈状态,各个状态采取行动所获得的利益为局中人的收益值。下面,首先从博弈论视角来对相关研究进行总结,接着进一步对4类计算机网络对抗博弈模型进行综合分析。

2.1基于完全信息静态博弈的计算机网络对抗

Jormokka等人运用博弈论对信息战进行建模[2],并针对恐怖分子博弈、为恶者博弈、故意破坏者博弈、背叛博弈4种计算机网络对抗情景进行研究,分析得到大胆对抗策略如何获得优势?混合博弈策略如何减少优势?过度占优策略可能导致对抗结果反弹等结论。Basar采用一个方差扭曲变量R(γ,δ,μ)来描述网络干扰过程的效用函数[3],其中,γ,δ,μ分别表示转发策略、接受者策略和干扰者策略。由于接受者、转发者和干扰者目标函数之间的冲突关系,最后得到一个鞍点(γ*,δ*,μ*)作为最优策略。具体来说,干扰者最优策略是选择一个泄露信号线性函数的干扰信号,或者根据区域参数选择一个独立高斯噪声信号。转发者最优策略是通过线性转换将输入信号进行放大,接受者最优策略是利用Bayes 进行估计。Kashyap运用零和交互信息博弈对MIMO 高斯信号衰退进行研究[4],发现译码器鞍点策略是循环转发一些对称的复杂高斯信号,干扰者最优策略是注入一个对称循环高斯信号,且不管干扰者是否有权使用信道输入都能对通信网络造成很大损失。Carin等人针对关键私人信息基础设施和公共基础设施防御问题[5],运用博弈框架提出一种计算机安全最优投资策略定量风险评估方法。Bistareli等人提出了一种定性与定量相结合的信息安全投资评估方法[6],分别计算攻击者和防护者的投资回报率,进而为管理员进行安全投资提供依据。

2.2基于不完全信息静态博弈的计算机网络对抗

Saad等人运用联合博弈模型对无线网络物理层安全性问题进行建模,考虑在限定安全费用基础上,使其安全容量最大化[7]。研究发现如果物理层安全的联合博弈问题存在最优策略,那么其最优稳定分割策略为D c,否则,其最优稳定分割策略为D hp。王浩云提出一种不完全信息条件下P2P网络节点行为策略模型[8],分析网络中各类型节点自身策略调整算法以及采取背叛策略的条件,并模拟节点行为的演化过程。Liu等人[9]为推断攻击者意图、目

标和策略,采取经济学激励概念建立分布式拒绝服务攻击与网络管理者之间的博弈模型,并运用网络宽带参数来对攻击和防御策略效果进行测度。接着,针对64台主机组成的网络,运用NS-2仿真平台对计算机网络对抗Bayesian博弈模型进行验证,得到攻防策略与所采用入侵检测系统精确性有关,也与攻击者行动的关联性有关。Huseyiin等学者提出了一种基于博弈论的经济优化模型[10],将组织和攻击者看作博弈双方,且博弈双方所获支付是关于IDS和防火墙系统的性能参数、组织特征参数以及攻击者特征参数的函数。Liu等人针对移动自组织网络的入侵检测问题,运用Bayesian博弈模型对攻防双方进行建模[11],分析静态情境下的纳什均衡策略,得到一些有管理意义的结论。

2.3基于完全信息动态博弈的计算机网络对抗

Zhu运用随机非零和动态博弈模型对N个防御机制和M个攻击者进行建模,在单位时间内,防御者会选择一个入侵检测配置,攻击者也会选择一定的攻击行动[12]。在建模过程中,作者提出安全容量来定义最坏情况下优化策略赘i=max

h

min

s

V i*(s),其中s为系统状态,V i*为当系统达到均衡时候计算机最优收益集合。作者认为安全容量是系统可达到安全目标的最大值,它可以区分现实安全目标和非现实安全目标,并且最优目标可行性可以视为给定安全容量下的可达性。Lye等人针对Web服务器、文件服务器、工作站和外部环境组成的网络[13],提出一个七元组的网络攻防行动博弈模型,分析攻击Web服务器、拒绝服务攻击、窃听数据3种情景下18个网络状态的演化关系,并且运用Matlab工具箱求解得到攻防双方在各个网络状态上的均衡策略。Lin等人为了对网络化信息系统的现在和未来安全状态进行评估[14],提出一个系统威胁和脆弱性的马尔可夫博弈分析框架,运用该框架管理者可以选择最优修复策略使系统损失值最小。Nguyen等人假设网络节点薄弱性、安全性是相互关联的,运用“线性影响网络”来对两个有向赋权网络的交互关系进行建模[15],并运用仿真方法对网络入侵检测过程研究,得到系统存在虚警时攻防双方的最优策略。Arora利用博弈模型研究漏洞信息发布政策如何影响厂商行为和对最优化发布漏洞信息的启示。通过研究发现[16],尽早发布漏洞信息可以促使厂商更快地发布补丁程序,但不一定是最优策略。文献[17-19]提出由网络连接关系、脆弱性信息等输入信息到网络攻防博弈模型的快速建模方法,根据模型对网络攻击成功率、平均攻击时间、潜在攻击路

王长春,等:基于博弈论计算机网络对抗问题研究

3

··

0381

(总第40-)

径等进行安全分析与评价,并通过一个典型的企业网络攻防过程验证了模型有效性。

2.4基于不完全信息动态博弈的计算机网络对抗

Alpcan等人从优化和控制两个视角研究网络堵塞、无线传感器能量控制策略设计问题,发现在博弈问题求解过程中得到庸俗策略和混乱策略是不可避免的,认为通过设计一个价格反馈控制系统可以使控制策略更加具有鲁棒性,进而使系统演化过程更加具有可控性[20]。Alpcan和Basar运用一个零和马尔可夫安全博弈模型对网络恶意攻击和入侵检测系统进行建模[21]。文中假设对攻击者策略只有部分信息或者间接信息,并且运用马尔可夫决策过程的价值迭代、minmax-Q、朴实Q-学习算法对问题进行了数值实验。Bloem等人假设响应函数是关于费用的严格单调凸函数,运用连续博弈对入侵检测问题进行建模[22],通过将攻防策略离散化后原问题就变成了一个具有约束条件的整数规划问题。针对网络病毒传播问题,Chen建立了一个最小-最大零和博弈模型,分析得到防御者最优策略是在整个IP空间内和整个计算网络空间内均匀地分配防御力量,攻击者最优策略是均匀地进行扫描[23]。Patcha等人将移动自组织网络中攻击节点和入侵检测系统之间的相互关系视为一种对抗博弈关系[24],建立一个多阶段动态非合作博弈模型。在Bohme和Moore研究中[25],作者从经济学视角建立了一个网络安全投资问题的动态交互模型,这个模型可以反映防御者和攻击者之间交互关系,并且攻击者总是试图对最薄弱的地方进行攻击。北京理工大学胡光俊将入侵者与诱骗系统视为博弈模型中的局中人,结合不完全信息动态博弈理论[26],探讨计算机网络对抗环境下诱骗系统各阶段信息获取策略的特点。中国科学技术大学贾春福针对网络攻防中的不确定性和动态性,提出一种基于不完全信息的动态博弈网络攻防模型,证明其均衡策略的存在性[27]。哈尔滨工业大学姜伟博士在对网络攻防策略分类及其成本量化基础上[28],提出网络主动对抗的静态和随机博弈模型,并给出各种模型的求解算法。

2.5计算机网络对抗模型综合比较

笔者认为在对计算机网络对抗问题进行建模时,所选择模型与以下两个因素有关:①信息量。防御者对攻击行为特征所掌握信息量越多,那么模型中的不确定性就越少,所建立的模型就可以越简单;②响应速度。当防御者发现网络中存在攻击行为时,如果防御者采取响应策略的反应时间很长,那么网络状态可能已经发生变化,甚至已经造成了无可挽回的后果。根据这两个因素,将基于博弈论的计算机网络对抗行动模型划分9个区域,如图2所示。

图2计算机网络对抗博弈模型选择依据

在第9个区域,防御者对攻击者行为具有完全信息,并且可以及时地对攻击行动做出响应,这个时候防御者应该采取主动防御策略对系统进行加固,并且可以选择完全信息动态博弈模型对问题进行建模。在第1区域,防御者对攻击行为特征所掌握的信息很少,并且防御者的响应速度很慢,对于这种情景可以选择不完全信息静态博弈模型对问题进行建模。因为该模型不需要掌握网络攻击行动准确信息,并且可以帮助我们寻找得到最优的被动防御策略。在区域7,防御者对攻击者行为具有完全信息,但是由于防御策略的延时性,使得选择完全信息静态博弈模型对问题进行建模,这样既可以克服防御延时问题,又可以充分利用对防御行动所掌握的信息,从而制定出比区域1更优的被动防御策略。在区域3,由于防御者响应时间很短,因此,可以运用不完全信息动态博弈模型对问题进行建模。最后在灰色区域2,4~6和8,如果在这些区域需要运用博弈论对计算机网络对抗问题进行建模,那么需要根据实际问题综合考虑各个模型的优劣。例如,在区域4,需要综合比较区域7中完全信息静态博弈模型和区域1中不完全信息静态博弈模型,这种综合比较的过程与许多因素有关,如不确定性、精确性、敏感性等。

3总结与展望

在计算机网络对抗中,人以资源使用者的身份出现,是系统的主体,处于主导地位,网络资源则是客体,计算机网络对抗系统是一个开放的复杂系统。本文在对计算机网络对抗问题复杂性表现和产生根源进行探讨基础上,按照博弈模型的4种类型对计算计算机网络对抗问题进行了分类梳理,并对

火力与指挥控制2015年第3期4

··

0382

(总第40-)

模型特点进行综合比较。基于博弈论计算机网络对抗问题研究是一个年轻而又迅速发展的领域,目前的研究工作还限于局部范围,没有形成一套系统的理论和方法。总体来说,下一步发展应包括以下几个方面:

(1)攻击者模型的建立。攻击和破坏行为是有意图的行为,因此,人为因素的随机分析是一个关键问题,特别是攻击者学习能力和决策模型将很有意义。攻击模型的建立主要存在两个困难:一方面网络攻击是攻击者发起的有意图的破坏行为,人们很难精确刻画这些攻击行为的人为意图;另一方面网络的巨大规模和复杂结构使得建立网络攻击模型异常的困难。

(2)攻防博弈策略模型。目前大多数基于博弈论计算机网络对抗问题研究模型存在以下局限性[29-31]:①只考虑完美信息情况,并且假设防御者总是能够发现攻击者,这与现实不符;②假设状态转移的概率是固定的,并且这些转移概率是由专家过去经验判断得到;③目前博弈论模型都是假设局中人是同时做决策的;④大多数模型不能随着研究问题规模和复杂性的增大而进行升级。

(3)定义计算机网络对抗评价指标。计算机网络对抗行动策略的收益量化标准始终是一个公认难题,不同网络应用背景有着不同的量化方法和标准,如何给出一个科学合理的量化评估标准将是今后研究的一个重点。

参考文献:

[1]Major G,William T.Cyberspace Operations:Air Force Space Command Takes the Lead[J].High Frontier,2009,5(3):3-5.

[2]Jormakka J,Molsa J V E.Modeling Information Warfare as a Game[J].Journal of Information Warfare,2005,4(2):

112-25.

[3]Basar T.The Gaussian Test Channel with an Intelligent Jam-mer[J].IEEE Transactions on Information Theory,1983,29(1):152-157.

[4]Kashyap A,Basar T,Srikant R.Correlated Jamming on MI-MO Gaussian Fading Channels[J].IEEE Transactions on

Information Theory,2004,50(9):2119-2123.

[5]Carin L,Cybenko G,Hughes J.Quantitaitve Evaluation of Risk for Invenstment Efficient Strategies in Cybersecurity:

the Queries Methodology[J].IEEE Computer,2008,41(8),21-26.

[6]Bistareli S,Fioravanti F,Peretti P.Defense Tree for Economic Evaluation of Security Investments[C]//Proceedings of the

First International Conference OU Availabifity,Reliability and Security,2006.

[7]Saad W,Han Z,Basar T.Physical Layer Security:Coalitional Game for Distributed Cooperation[C]//International Sympo-sium on Modeling and Optimization in Mobile,Ad Hoc,and Wireless Network,Seoul,USA,2009.

[8]王浩云,张顺颐,赵振东.基于不完全信息博弈的P2P网络节点行为策略模型[J].应用科学学报,2008,26(5): 448-454.

[9]Liu P,Wang Z.Incentive Based Modeling and Inferecne of Attacker Intent,Objectives and Strategies[C]//Proceedings

of the10th ACM Coputer and Communcations Security Con-

ference.Washington,DC,2003.

[10]Cavusoglu H,Mishra B,Raghunathan S.The Value of IDS in IT Security Architecture[J].Information Systems Re-

search,2005,19(1):28-46.

[11]L iu Y,Comaniciu C,Man H.A Bayesian Game Approach for Intrusion Detection in Wireless and Hoc Networks[C]//

ACM Internatinal Conference Proceeding Series,Pisa Italy,

2006.

[12]Zhu Q,Tembine H,Basar https://www.360docs.net/doc/e64057902.html,work Security Conguration:

A Nonzero Sum Stochastic Game Approach[C]//IEEE Pro-

ceedings of American Control Conference,Baltimore,MD,

2010.

[13]Lye K W,Jeannette W.Game Strategies in Network Security [J].International Journal of Information Security,2005,4

(1):71-86.

[14]Chen X L,Tan X B,Zhang Y.A Markov Game Theory Based Risk Assessment Model for Network Information

Systems[C]//International Conference on Computer Sci-

ence and Software Engineering,HuBei,China,2008.[15]Nguyue K C,Alpcan T,Basar T.Stochastic Games for Secu-rity in Networks with Interdependent Nodes[C]//Proceed-

ings of International Conference on Game Theory for Net-

work,Istanbul,USA,2009.

[16]Arora A,Telang T,Xu H.Timing Disclosure of Software Vulnerability for Optimial Social Welfare[R].Carnegie

Mellon University,2004,67-98.

[17]王元卓,林闯,程学旗.基于随机博弈模型的网络攻防量化分析方法[J].计算机学报,2010,33(9):1-15.[18]蔡红柳,田磊,高朦.多Agent的网络对抗系统仿真建模[J].四川兵工学报,2012,33(12):90-93.

[19]林闯,王元卓,杨扬.基于Petri网的网络可信赖性分析方法研究[J].电子学报,2006,34(2),322-332.

[20]Alpcan T,Pavel L.Nash Equilibrium Design and Optimiza-tion[C]//International Conference on Game Theory for Net-

works,Game Nets,USA,2009.

[21]Alpcan T,Baser T.An Intrusion Detection Game with Lim-ited Observations[C]//Proceedings of the12th International

王长春,等:基于博弈论计算机网络对抗问题研究

(下转第10页)

5

··

0383

(总第40-)

等手段,从多方获取情报信息,并进行加工处理,形成战场态势,提供给火力突击力量,辅助其优化打击目标、灵活安排战术。

该模式兼顾了信息流量、信息质量和传输时间等流转价值,在一定程度上优化了传输路径,增加了传输流量,提高了传输质量,减少了传输时间,是最常采用的信息流转模式之一。

4结束语

体系作战信息流转模式涉及军队体制编制、武器装备、综合保障等问题,并伴随兵力构成、作战阶段的改变而改变。本文在构建信息流转模式时,仅考虑信息流量、信息质量和传输时间等因素,具有一定局限性,后续将采用数学推导和计算机仿真的方法,定量研究信息流转作用机理和作用过程,使信息流转模式更好地适应复杂多变的战场环境,满足体系作战信息高效流转需求。

参考文献:

[1]李骥.火力作战目标决策分析[J].指挥控制与仿真,2013,35(3):23-26.

[2]Akella R,Bruce https://www.360docs.net/doc/e64057902.html,rmation Flow Analysis of

Energy Management in a Smart Grid[J].Lecture Notes in

Computer Science,2011(1):263-276.

[3]王道华,马明辉,孙海峰.指挥信息系统支撑体系作战信息流转问题研究[J].军事通信学术,2011(1):5-8.[4]张超,王云宪,刘洋.信息火力战制胜机理探析[J].军事学术,2012(8):28-29.

[5]Sommerlade L,Amtage F,Lapp O,et al.On the Estimation of the Direction of Information Flow in Networks of Dynamical

Systems[J].Journal of Neuroscience Methods,2011(196):

182-189.

[6]陶九阳,张东戈,赵普山.适应性指挥控制关系网的度分布[J].系统工程理论与实践,2012,32(8):1808-1813.[7]宋广收.信息化条件下如何加快战场信息流转[J].信息对抗学术,2012(2):70-72.

[8]Taghdiri M,Snelting G,Sinz https://www.360docs.net/doc/e64057902.html,rmation Flow Analysis Via Path Condition Refinement[J].Lecture Notes in Com-

puter Science,2011(1):65-79.

[9]Akella R,Tang H,Bruce M.McMillin.Analysis of InForma-tion Flow Security in Cyber–physical Systems[J].Interna-

tional Journal of Critical Infrastructure Protection,2010(3):

157-173.

[10]张杰勇,姚佩阳,周翔翔,等.基于DLS和GA的作战任务-平台资源匹配方法[J].系统工程与电子技术,

2012,34(5):947-954.

(上接第5页)

Symposium on Dynamic Games and Applications,Sophia

Antipolis,France,2006.

[22]Bloem M,Alpcan T,Basar T.Intrusion Response as a Re-source Allocation Problem[C]//IEEE Conference on De-

scision and Control,USA,2006.

[23]Chen Z.Modeling and Defending Against Internet Worm Attacks[D].Georgia Institute of Technology,2007.[24]Patcha A,Park J.A Game Theoretic Approach to Modeling Intrusion Detection in Mobile Ad Hoc Network[C]//Pro-

ceeding of the IEEE Workshop on Information Assurance

and Security,USA,2004.

[25]Bohme R,Moore T.The Iterated Weakest Link:A Model of Adaptive Security Investment[C]//In Workshop on the E-

conomics of Information Security,2009.

[26]胡光俊,闫怀志.基于动态博弈的网络诱骗信息获取策

略研究[J].科技导报,2005,23(1):32-34.

[27]贾春福,钟安鸣,张炜.网络安全不完全信息动态博弈模型[J].计算机研究与发展,2006,43(2):530-533.[28]姜伟,方滨兴,田志宏.基于攻防随机博弈模型的网络安全测评和最优主动防御[J].计算机学报,2009,32(4):

817-827.

[29]Borkovsky R N,Doraszelski U,Kryukov Y.A User’s Guide to Solving Dynamic Stochastic Games Using the Homotopy

Method[J].Operation Research,2010,58(4):1116-1132.[30]Horner J,Rosenberg D,Solan E.On a Markov Game with One Sided Information[J].Operation Research,2010,58(4):1107-1115.

[31]Delage E,Mannor S.Percentile Optimization for Markov Decision Processes with Parameter Uncertainty[J].Opera-

tion Research,2010,58(1):203-213.

火力与指挥控制2015年第3期10

··

0388

基于博弈论计算机网络对抗问题研究

作者:王长春, 陈志杰, WANG Chang-chun, CHEN Zhi-jie

作者单位:空军装备研究院雷达所,北京,100085

刊名:

火力与指挥控制

英文刊名:Fire Control & Command Control

年,卷(期):2015(3)

引用本文格式:王长春.陈志杰.WANG Chang-chun.CHEN Zhi-jie基于博弈论计算机网络对抗问题研究[期刊论文]-火力与指挥控制2015(3)

浙大博弈论考试题目

博弈论考试 1、完全信息静态博弈 1“老师点名和学生逃课”的案例 构建如下模型:老师 点名不点名 学生逃课a1,b1 a2,b2 不逃课a3,b3 a4,b4 结果:(1)老师每次点名,学生每次不逃课 a3> a1 ,b3> b4 ,a2< a4 ,b2< b1 (2)老师每次不点名,学生每次不逃课 a4> a2 , b4> b3 , a1< a3 , b1< b2 (3)老师有时候点名,学生有时候逃课 a1< a3 , a2> a4 , b1> b2 , b3< b4 (4)老师每次不点名,学生每次逃课 a2> a4 , b2> b1 , a3< a1 , b3< b4 2市场占有者和想进入市场者 构建模型:占有者 默认斗争 进入者进入(40,50)(-10,0) 不进入(0,300)(0,300) 没有占优战略均衡,也没有重复剔除的占优均衡。 结果:(1)占有者默认,进入者进入时,占有者会损失部分利益 (2)占有者斗争,进入者进入,则占有者利益变0,而进入者为负,两败俱伤,因而占有者“斗争”是弱劣战略。 (3)占优者默认,进入者不进入,则占有者获得全部市场 (4)(斗争,不进入时,占有者仍获得全部市场。 综上存在两个纳什均衡,(进入,默认)和(不进入,斗争) 3应试教育和素质教育学生 应试教育素质教育 学校应试教育(0,0)(0,-1) 素质教育(-1,0)(1,1) (1)假设学校和学生都采取应试教育为(0,0),那么若他们都转向素质教育达到最优结局(1,1),(2)但如果单方面采取素质教育,另一方为应试教育,其支付就变为-1,比如如果学校重视应试成绩,而学生重视素质教育,学生单方面受损,为-1 (3)若学校注重素质教育,而学生只注重成绩,学校的策略难以推行,支付为-1. 此博弈中存在两个纳什均衡,即(应试,应试)和(素质,素质),虽然(素质,素质)是最优纳什均衡,但一方采取素质教育存在风险:另一方为应试时,支付变为-1;若采取应试没有变为-1的风险,那么最终结局为(应试,应试)。4两个人合作开发一项产品假设项目开发成功每人收益为4,失败时收益为 0,偷懒者的机会成本为1

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论复习题

《博弈论》复习思考题 1.法律和信誉是维持市场有序运行的两个基本机制。请结合重复博弈理论谈谈信誉机制发生作用的几个条件。 2.经济发展史表明,在本来不认识的人之间建立相互之间的信任关系是经济发展的关键。为什么? 3.在传统社会中,即使没有法律,村民之间也可以建立起高度的信任。请结合博弈理论解释其原因。 4.在旅游地很容易出现假货,而在居民小区的便利店则很少出现假货,请结合博弈论的相关理论进行解释。 5.有效的法律制度对经济发展具有什么作用?请结合博弈理论谈谈你的理解。 6.试用博弈理论解释家族企业为什么难以实行制度化管理? 7.固定资产投资为什么可以作为一种可置信的承诺? 8.以汽车保险为例谈谈因为信息不对称所可能产生的道德风险问题,并提出一种解决道德风险的方案。 9.以公司为例,谈谈所有者与经营者的分离可能产生的道德风险问题。 10.在波纳佩岛上,谁能种出特别大的山药,谁的社会地位就高,谁就能赢得人们的尊敬并可担任公共职务。请结合信号传递模型谈谈波纳佩岛上的这种奇异风俗。 11.一位男生在女朋友过生日时送给女朋友三百元人民币,他的女朋友往往感觉受到了侮辱。而他女朋友可能会欣然接受父母亲的现金礼

物。请解释其中可能的原因。 12.请用机制设计的思想谈谈飞机、轮船等设立头等舱、经济舱的道理是什么? 13.互联网技术的飞速发展及其广泛应用,极大的便捷了人与人之间的沟通、交流与合作。互联网空间是虚拟的,但使用互联网的人是现实的。请根据你的体验,回答下列问题: (1)互联网上的人际交流,是熟人社会还是陌生人社会?如何建立网络上个人的信用和声誉? (2)互联网上的信息众多,你要如何甄别其真假,防止上当受骗? 14.10名海盗抢得100块金子,并打算瓜分这些战利品,但他们的分配方式有些特别。他们先让最强的海盗提出分配方案,然后所有海盗(包括提方案者)进行表决。如果50%或更多的海盗赞同此方案,此方案就通过,否则提方案者将被扔到海里喂鱼,然后由剩下海盗中的最强者重复上述过程。所有海盗都乐于看到同伴被扔到海里,但如果让他们选择,他们还是宁愿得到一笔现金。所有海盗都是理性的,而且知道其他海盗也是理性的。没有两名海盗是同等厉害的,且每个人都知道自己的等级。这些金块不能再分,也不允许有两个海盗共有一块金块。 请回答并解释,最强的一名海盗应提出怎样的分配方案才能使自己利益最大化? 15.如果给你两个师的兵力,由你来当“司令”,任务是攻克“敌人”占据的一座城市,而敌军的守备力量是三个师。规定双方的兵力只能

博弈论考试题目

博弈论考试题 一、名词解释(20分) 1.纳什均衡 2.子博弈完美均衡 3.重复博弈 4.贝叶斯博弈 二、简答题(30分) 1.按照信息和顺序,博弈有哪些分类?且对应的均衡概念分别是什 么? 2.在完全信息静态博弈中,求纳什均衡的方法有几种,分别是什么? 3.对于重复博弈,合作解可能在哪些情况下产生? 三、分析题(25分,每小题5分) 假设公安局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就取决于两者对于犯罪事实的供认。这两名犯罪嫌疑人在公安局是分别关押以防他们串供。两名犯罪嫌疑人都知道,如果他们都交代犯罪事实,则可能将各被判5年;如果他们都不交代,则有可能会被较轻的妨碍公务罪各判2年;如果一人交代,另一人不交代,交代者会被立即释放,不交代者被判8年。回答以下问题:(1)请写出这两名犯罪嫌疑人博弈的支付矩阵。 (2)假设这两名犯罪嫌疑人都是自私且不讲江湖道义的人,同时被审问且不能够相互沟通串供。请给出该博弈的纳什均衡。(3)说明这两个囚徒的困境在哪里?

(4)利用囚徒困境博弈对下面现象进行解释:电信市场上移动和联通的价格战。 (5)请指出一种走出囚徒困境的办法。 四、计算题(25分) 企业甲和企业乙都是家电制造商,他们都可以选择生产高端或是低端产品,两企业在不同选择下的利润如以下得益矩阵所示。假设企业甲先于企业乙进行产品选择并投入生产,企业乙在决定生产时已经知道企业甲的选择,而且这一点大家都知道。 (1)请写出该博弈的扩展式; (2)该博弈的子博弈完美均衡是什么? 企业2 高端低端 高端 企业1 低端 答题要求: 1.必须手写; 2.稿纸单面书写; 3.下周三上午统一交。

博弈论复习

博弈论复习 解释下面基本概念 博弈论、博弈方以及博弈中的策略 博弈就是一些个人或组织面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许的行为或策略中进行选择并加以实施,各自取得相应结果的过程”。 博弈的参加者(PLAYERS)、参与者、博弈方:博弈中独立决策,独立承担博弈结果的个人或组织称为博弈方。 博弈中的策略(STRATEGIES):博弈中各博弈方的决策内容称之为策略。 2. 合作博弈和非合作博弈 根据各博弈方在采取策略时,是否可以达成一个具有约束力的协议,将博弈分为“合作博弈”和“非合作博弈”。 合作博弈是指博弈者之间有着一个对各方具有约束力的协议,博弈者在协议范围内进行的博弈。 非合作博弈:如果博弈者无法通过谈判达成一个有约束的契约来限制博弈者的行为,那么这个博弈为非合作博弈。 3.有限博弈和无限博弈 据博弈方的策略数目将博弈分为:“有限博弈”和“无限博弈”。 策略空间:每个博弈方的全部可选策略的集合,分别记为S1,S2,…,Sn,其中Si=(sij:博弈方i的第j个策略,i=1,2,…,n), 其中,j可取有限个值(有限博弈),也可以取无限个值(无限博弈)。 有限博弈:如果一个博弈中每个博弈方的策略数都是有限的,则称为有限博弈 无限博弈:如果一个博弈中至少有某些博弈方的策略无限多个则称为无限博弈 4. 上策均衡和纳什均衡 上策:在一个博弈中,不论其他博弈方选择什么策略,某一博弈方的最优策略是唯一的,称这种策略为该博弈方的一个上策。 上策均衡:如果在一个博弈中的某个策略组合中的所有策略都是各个博弈方的各自的上策,称这个策略组合为该博弈的一个“上策均衡” 纳什均衡:在博弈G=(S1,S2,…,Sn;u1,u2,…,un)中,如果某个策略组合(s1*,s2*,…,sn*)中的任一博弈方i的策略si*,都是对其余博弈方策略的最佳对策,也即:Vi,有下面式子成立: ui(s1*,s2*,…,si*,…,sn*)≥ui(s1*,s2*,…,si,…,sn*)其中V si∈Si。 5. 完美和不完美信息的动态博弈 完美信息的动态博弈:在动态博弈中,若所有的博弈方在轮到自己行动时,对此前的全部过程完全了解,则称此博弈为完美信息的动态博弈。 不完美信息的动态博弈:在动态博弈中,若所有的博弈方在轮到自己行动时,对此前的全部过程不完全了解,则称此博弈为不完美信息的动态博弈。 6. 完全和不完全信息的静态博弈 完全信息的博弈:在一个博弈中,每一个博弈方都完全了解所有博弈方的在各种情况下得益的博弈。 不完全信息的博弈:将至少部分博弈方不完全了解其他博弈方得益情况的博弈,称之为不完全信息的博弈。 不完全信息静态博弈:是指至少某一个博弈方不完全了解其他博弈方的得益或得益函数,也

博弈论考试试题

博弈论考试试题 你有三个小时考试时间。回答所有问题。考试内容比较多,我在认为最难的问题旁边标注了星号,如果你担心不够时间,可以把这些带星号的问题留到最后才做。 1.(55分钟—36分)简略回答下面每个子问题。请写出你的计算过程,并在你不能给出正式结论时,提供大概的解释,那样我可以给你部分分数。 (a)尽可能给出正式的说明,指出一个观察到的行为是无穷连续的多级博弈意味什么?给出一个不是无穷连续博弈的例子。 (b)尽可能给出正式的说明,指出一个一般性支持的性质意味着什么?在课上我们看到什么理论关于一般性支持的性质? (c)课堂上,在说明带有可观察行为的有限扩展型博弈和无限期多级博弈时,我不同地详细讲述了支付函数。支付函数范畴是如何不同?为什么我做出这个改变? (d)在扩展型博弈中给出一个策略的正式定义。 (e)给出一个博弈的例子,其中一个看起来不合理的结果在一个子博弈完美均衡里变成可能。(f)下面显示的扩展型博弈里,博弈者1有多少个纯策略?写出正常形式的支付矩阵。这个博弈有多少子博弈? (g)找出下面博弈中全部的纳什均衡。

(h )找出二阶段博弈的子博弈完美均衡,博弈者在成本a/16处选择a ,于是博弈者1和2同时行动进行博弈,如下面所示。 (i )找出同时行动博弈中的纳什均衡,其中博弈者1选择1a ∈?,博弈者2选择2a ∈?,支付是,

考虑如下的关于信任的博弈,这在很多试验中都做过。试验者从给博弈者1$10和给博弈者2$0开始。然后试验者问博弈者1愿意将多少美元给博弈者2来帮助他。如果他选择给x美元给试验者,则试验者给博弈者2 *3x。随后,博弈者2有机会将一些或全部(或没有)他获得的钱给博弈者1。 (a)假定这两个博弈者都是风险中性的,仅关心他们自己的支付,找出这个博弈的子博弈完美均衡。(顺便说明,子博弈完美均衡不像在试验中出现。通常博弈者1给出一些,但不会把全部的钱给回试验者) (b) 这个博弈有博弈者获得更高支付的纳什均衡吗? (c)假定我们修改了博弈,以致在上述的两阶段后,博弈者1有机会打博弈者2。假定这将减少博弈者1的效用1美元,减少博弈者2的效用5美元。这将改变你们在(a)和(b)中的答案吗?如果我们在第二阶段后有如下显示的博弈会怎么样呢?作个你认为合理的预测。 (d*)对这个试验结果的另一个解释是,博弈者可以是无私心的。说明无私心的最简单表达——每个博弈者最大化他自己的美元支付和其他博弈者美元支付的权重和——除了权重上一个特别(非强迫)的选择,不能解释试验规则性。你能想出可能被用来说明试验结果的效用函数吗?

博弈论考题与答案

一、假设市场上有三个垄断企业,企业无生产成本,问达到纳什均衡时的产量为多少?假设市场的价格和数量之间P=a—b*Q 解: 二、什么是纳什均衡,你是如何理解纳什均衡的? 答:纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。 三、构建一个博弈,说明如何杜绝学生考试作弊现象(参考高薪养廉博弈) 答: 四、给出该博弈的纳什均衡,并用消除劣势战略法,找出 (R1,C3)这个纳什均衡。 C1 C2 C3 R1 2,12 1,10 1,12 R2 0,12 0,10 0,11 R3 0,12 0,10 0,13 五、两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,计算其混合战略纳什均衡。 答:设S为棒子T为老虎C为鸡W为虫子,则其支付矩阵为: 2 S T C W S 0,0 1,-1 0,0 -1,1 1 T -1,1 0,0 1,-1 0,0 C 0,0 -1,1 0,0 1,-1 W 1,-1 0,0 -1,1 0,0 设1、2出STCW的概率分别为P1P2P3P4和Q1Q2Q3Q4,则矩阵达到均衡时,2的期望收益必须满足:0*p1—1*p2+0*p3+1*p4=1*p1+0*p2—1*p3+0*p4=0*p1+1*p2+0*p3—1*p4= —1*p1+0*p2+1*p3+0*p4 整理为—p2+p4=p1—p3= —p1+p3 由于上式为对称的,所以,p1=p2=p3=p4,又p1+p2+p3+p4=1,可得p1=p2=p3=p4=0.25. 同理q1=q2=q3=q4=0.25 综上所述,混合战略的纳什均衡为:A1(0.25,0.25,0.25,0.25)A2(0.25,0.25,0.25,0.25) 六、5个海盗抢到了100颗宝石,每一颗大小和价值都一样他们决定这么分:抽签决定自己的号码(1、2、3、4、5)。首先,1号提出分配方案。然后大家5人进行表决,当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳌鱼。如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳖鱼。以次类推。假定每个个强盗都是经济学假设的“理性人”,假定每个判决都能顺利执行。那么,如果你是第一个强盗,你该如何提出分配方案才能够使自己的收益最大化? 七、假设选民政治态度是成线性均匀分布的,说明为什么两党政治具有欺骗性,如果是三党政治情况如何,为什么? 答:政党和政治家争取选民情况实际上就和杂货铺定位博弈一样。工党一定要打出劳工代言人的旗帜,所以他是站在左边的,左边是他的地盘。但是只有左边一半的选民,还不足以保证胜出。为了在竞选中获胜,他要想办法把中间的在两党之间摇摆的选民争取过来。最好的办法,就是使自己的竞选纲领向“右”的方向靠过去一点,就是在竞选中宣布也要照顾中产阶级的利益。移过去一点,地盘就可能大一点。同样,原来立党之本是在“右”边的保守党,在竞选的过程中,也要往左边靠,争取更多的选民。这样斗法的结果,在漫长的竞选过程中,虽然两党的漫骂不断升级,但是实际纲领却不断靠近,直到两个政党在中点紧挨在一起,才是稳定的纳什均衡。 这个政党纲领向中点移动的机制,也说明西方两党政治的欺骗性。竞选的时候,怎样有利于拉票就怎样讲,当选以后,可以忘得一干二净。在这个意义上,我们说不要以为哪个政党上台这些西方国家的态度就会改变,确实很有道理。政党政治,本来在理论上有促使政治家个人操守不可太放肆的优点。但是在西方国家,小学生都知道政治家说的话不可靠,无奈制度决定了,每次竞选,人们只能在那少数政治家之间作出他信非常有限的选择。 为什么第三个政党难成气候?这是因为,如果三个政党的位置不相同,不在同一个点上,那么他们都有向中点

博弈论测试题

博弈论测试题十一 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我” 个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题? 答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。 (2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。 精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。 四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发? 答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。 五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

清华大学经济博弈论期末考试04

经济博弈论(2004年秋季学期)期末测验题答案 注意:请将所有题目的答案写在答题册上,写在本试题页上一律无效。 1. (20 points) Lucy offers to play the following game with Charlie: “Let us show pennies to each other, each choosing either heads or tails. If we both show heads, I pay you $3. If we both show tails, I pay you $1. If the two don’t match, you pay me $2.” Charlie reasons as follows. “The probability of both heads is 1/4, in which case I get $3. The probability of both tails is 1/4, in which case I get $1. The probability of no match is 1/2, and in that case I pay $2. So it is a fair game.” Is he right? If not, (a) why not, and (b) what is Lucy’s expected profit from the game?(game table, 5 points; solutions, 7 points; (a), 4 points; (b), 4 points) (20分)露西提出与查理玩下面的游戏:“让我们互相向对方亮出硬币,每个人可以选择正面或者背面。如果双方亮出的都是正面,我给你3美元。如果双方亮出的是背 面,我给你1美元。如果两枚硬币正背面不同,你给我2美元。”查理做了这样的推理: “两枚硬币都是正面的概率是1/4,如此我得到3美元。都是背面的概率为1/4,如此我 得到1美元。正背面不同的概率为1/2,如此我付出2美元。因此这是一个公平游戏。” 他的想法是否正确?如果不正确,(a)为什么不正确?(b)露西从游戏中得到的期望 利润是多少?(博弈表5分;解7分;(a)问4分;(b)问4分。) 解答: 该博弈为零和博弈。博弈表如下(5分): CHARLIE Head Tail LUCY Head -3 2 Tail 2 -1 求解博弈。容易看出,该零和博弈没有纯策略纳什均衡。(1分) 只有一个混合策略的纳什均衡为:露西和查理均以3/8的概率出正面,5/8的概率出背面。 (6分) (a)查理的推理不对。因为双方实际(策略性)选择的、出硬币的正背面的概率不同于完 全随机选择的概率(后者正背面概率各为1/2)。查理错误地将一个混合策略的博弈情境当成 了随机选择的“赌博”情境。(4分) (b)露西的期望利润为1/8。(4分)(相应的,查理的期望利润为-1/8,不要求) 2. (20 points) You have to decide whether to invest $100 in a friend’s enterprise, where in a year’s time the money will increase to $130. You have agreed that your friend will then repay you $120, keeping $10 for himself. But instead he may choose to run away with the whole $130. Any of your money that you don’t invest in your friend’s venture, you can invest elsewhere safely at the prevailing rate of interest r, and get $100(1+r) next year. (a) Draw the game tree for this situation and show the rollback equilibrium. (8 points) Next suppose this game is played repeatedly infinitely often. That is, each year you have the

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论试题

Brigham Young University Department of Economics Economics 381 – Intermediate Macroeconomics Dr. Phillips (sections 2 & 4) Winter Semester 2005 Midterm Exam 2 key Mar. 11 - 12, 2005 This exam is closed book and closed notes, though you may use a calculator. Read all questions carefully before answering. Write your answers legibly in the space provided. Keep your answers concise and correct. Points will be deducted for answers which are irrelevant to the question. You may use a testing center calculator to help with the math, if you wish. Section I (multiple choice, 2 points each) Circle the letter of the correct answer. 1. Consumption smoothing refers to (a) the tendency of all consumers to choose the same amount of current consumption. (b) the tendency of consumers to seek a consumption path over time that is smoother than income. (c) the tendency of consumers to seek an income path over time that is smoother than consumption. (d) consumer’s concerns about going heavily into debt. 2. An increase in first-period income results in (a) an increase in first-period consumption, an increase in second-period consumption, and an increase in saving. (b) an increase in first-period consumption, a decrease in second-period consumption, and an increase in saving. (c) a decrease in first-period consumption, an increase in second-period consumption, and an increase in saving. (d) an increase in first-period consumption, an increase in second-period consumption, and a decrease in saving. 3. An increase in the real interest rate is an example of a (a) pure substitution effect. (b) substitution effect and a positive income effect. (c) substitution effect and a negative income effect. (d) substitution effect and an income effect whose sign depends on whether the consumer is initially a borrower or a lender. 4. An increase in lifetime wealth is likely to (a) increase current labor supply and increase current consumption demand. (b) increase current labor supply and decrease current consumption demand. (c) decrease current labor supply and increase current consumption demand. (d) decrease current labor supply and decrease current consumption demand.

博弈论复习讨论题

1、人与人之间的博弈是什么关系? 既可以是竞争关系,也可以是合作关系 2、因为博弈论的研究而获得1994年诺贝尔经济学奖的是 泽尔腾、海萨尼、纳什 3、学习博弈论的目的只是为了在今后与他人的博弈中能够打败对手(×) 4、博弈是指在一定的游戏规则约束下,基于(直接)相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 5、如果博弈前的损益总和与博弈后的损益总和相等,该博弈称为零和博弈 6、策略具有以下特性:完整性、不可观察性、多样性 7、人在博弈中并不是完全理性的(√) 8、博弈论的建立基于两大假设,其中除了人的理性以外,还有一个是(人的认知) 9、囚犯困境的根本原因在于个人行为的负外部性(私人成本与社会成本的差异) 10、在囚犯困境的博弈中,事先订立攻守同盟一定是有用的(×) 11、(占优)策略是指无论其他参与者采取什么策略,某参与者采用该策略的结果都优于或不劣于其他策略。 12、以下现象哪些明显属于“囚犯困境”?价格战、公地悲剧、环境污染 13、“好货不便宜、便宜没好货”其实是一个“智猪博弈”,这是因为不懂行的人占了懂行的人的便宜 14、之所以会出现“万元陷阱”,是因为:不懂得止损、沉没成本 15、智猪博弈是一个搭便车的博弈。一方付出了相应的代价,双方共享了所得到的收益。(√) 16、人在“亏损”的情况下,会从一个风险(厌恶)者变成了风险偏好者。 17、以下哪些博弈不属于竞争关系?同学聚会 18、哪些行业是赢者通吃的?演艺界、搜索引擎、门户网站 19、杭州试行的“谦让牌”之所以没效果,是因为宣传力度不够(×) 20、汇合点(Meeting point)必须是(共同)知识才有用 21、以下是某教授和学生张三之间的策略表达式:教授选择放过该学生的概率是多少?50% 22、以下是某教授和学生张三之间的策略表达式:张三选择平时勤快的概率是多少?20% 23、纯策略是指如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动(√)

博弈论第三章知识题

问题1:如果开金矿博弈中第三阶段乙选择打官司后的结果尚不能肯定,即下图中a 、b 数值不确定。试讨论本博弈有哪几种可能的结果。如果本博弈中的“威胁”和“承诺”是可信的,a 或b 应满足什么条件? ①0a <,不借—不分—不打; ②01a <<,且2b >,借—不分—打; ③1a >,且2b >,借—不分—打(,)a b ; ④0a >,且2b <,借—分—(2,2) 问题2:三寡头市场需求函数Q P -=100,其中Q 是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2同时决定产量,厂商3根据厂商1和厂商2的产量决策,问它们各自的产量和利润是多少? 1123111231(100)2(98)q q q q q q q q q π=----=--- 2123221232(100)2(98)q q q q q q q q q π=----=--- (a ,b ) (0,4)

3123331233(100)2(98)q q q q q q q q q π=----=--- 3 3123 0,(98)/2q q q q π?=?=--? 代入,11212122(98)/2,(98)/2q q q q q q ππ=--=-- 1212 0,0q q ππ??==??,得*** 1 2398/3,49/3q q q === ***1234802/9,2401/9πππ===。 问题3:设两个博弈方之间的三阶段动态博弈如下图所示。 (1)若a 和b 分别等于100和150,该博弈的子博弈完美纳什均衡是什么? (2)T N L --是否可能成为该博弈的子博弈完美纳什均衡路径,为什么? (3)在什么情况下博弈方2会获得300单位或更高的得益? (1)博弈方1在第一阶段选择R ,在第三阶段选择S , 博弈方2在第二阶段选择M 。 (a ,b ) 50,300

经济博弈论

1、纳什均衡的概念。 对于任一个博弈游戏来讲,一定存在这么一组策略,使得其对于任一个局中人而言都是最好的,如果其它的所有局中人不改变他们的策略的话。 2、非合作博弈与合作博弈的区别。形成合作博弈的两个条件: (1)对联盟来说,整体收益大于其每个成员单独经营时的收益之和。 (2)对联盟内部而言,应存在具有帕累托改进性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。 如何保证实现和满足这些条件,这是由合作博弈的本质特点决定的。也就是说,联盟内部成员之问的信息是可以互相交换的,所达成的协议必须强制执行。这些与非合作的策略型博弈中的每个局中人独立决策、没有义务去执行某种共同协议等特点形成了鲜明的对比。因此可以说:形成合作博弈的原因是在某种制度约束下的集体理性战胜了个人理性。 3、解释下列概念:纯策略、混合策略、策略组合、纳什均衡、贝叶斯均衡、反应函数 在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。纯策略是混合策略的特例。 按照一定的概率,从一套“纯策略”中随机选取实际的对策,称为混合策略。混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。 策略组合指参与者可能采取的所有行动方案的集合。策略集合必须有两个以上元素,否则,无所谓对策,只是独自决策。 所谓贝叶斯纳什均衡是指这样一组策略组合:在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略 反应函数,在无限策略的古诺博弈模型中,博弈方的策略有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数的关系,把这个连续函数称为反应函数。4、解释下列概念:博弈、静态博弈和动态博弈、完全信息博弈和不完全信息博 弈、完美信息动态博弈和不完美信息动态博弈 博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。简单说就是人与人之间为了谋取利益而竞争。 静态博弈是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。 动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。 完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。 不完全信息博弈,也称贝叶斯博弈,是指对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。博弈参与者对于对手的收益函数没有完全信息。 完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息,而且一般都会持续一个较长时期。 不完美信息动态博弈,在动态博弈中,在不完全信息条件下,至少有一个局中人对其他某些局中人的收益不清楚。由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。 6、在公司制企业中,股东、经理、债券人、顾客、供货商等都被称为利益相关者。试分析不同

相关文档
最新文档