第39卷 、,0l-39 第9期 NO.9 计算机工程 Computer Engineering 2013年9月 September 2013
・安全技术・ 文章缩号:100o-.3428(2013)09—_0162—_05 文献标识码;A 中田分类号:TP309.2
基于博弈论的企业信息安全攻防策略研究
韩文英,闫明星,柴艳妹,王秀利
(中央财经大学信息学院,北京100081)
摘要:利用3种博弈模型研究信息安全中的攻防策略。讨论不完全信息动态攻防博弈模型下的攻防均衡关系,得到均衡时的策
略选择及参数限制条件。考虑攻防的长期和重复性,建立不完全信息下的重复攻防博弈模型,得到长期均衡关系。针对信息安全 中攻防双方不能在完全理性情况下进行策略选择的问题,引进有限理性假设条件,运用复制动态求解进化稳定策略,在验证前两个 模型结论有效的基础上,进一步得到解决信息安全问题的有效策略。
关蝴:信息安全;攻防关系;不完全信息博弈模型;均衡;重复博弈模型;演化博弈
Research 0n Enterprise Inf0rmati0n Security
Attack-defense Strategic Based 0n Game Theory
HAN Wen-ying,YAN Ming—xing,CHAI Yan-mei,WANG Xiu-li
(School ofInformation,Central University ofFinance and Economics,Beijing 100081,China)
IAbstraet]The attack—defense relationship in information security is studied through three game models.The attack and defense
equilibrium relationship is discussed with incomplete information dynamic game model,to reach the strategy selection and parameter constraints when the attack and defense relationship getting equilibrium.Taking into account of the long—term and repeatability of the attack and defense relationship,a repeated attack and defense game model under incomplete information is established and long-run equilibrium relationship is reached.Because of the incomplete rationality of decision maker,the limited rationality assumptions is introduced,to verify
the validity of the above two models’conclusion,and getting the effective strategies to solve information security problems with the use of
replication dynamic solving evolutionarily stable strategy.
[Key words]information security;attack—defense relationship;incomplete information game model;equilibrium;repeated game model;
evolution game
DOh 10.3969/j.issn.1000—3428.2013.09.035
1 概述 以及策略分析。
愈加严峻的信息领域安全问题促使信息安全风险管理
现已成为当今信息安全保障工作的主流范式,成为全球信
息安全工作的热点。国内外对于信息安全的研究在理论和
方法上都有一定的研究成果,但针对信息安全的攻防博弈 以及防守博弈模型的研究很少,而且目前的相关理论研究
并不能比较明确地描述出关于信息安全攻守双方的利益关
系,以及防守方的最优策略。
针对信息安全相关问题,本文提出一种新的解决思路,
从攻防模型和防守模型研究信息安全问题,并根据假设环
境以及研究侧重点不同,分别设计不同的博弈模型,讨论 信息安全攻防和防守博弈问题,最终得到相关的均衡状态 2研究现状
目前国外运用博弈论提出信息安全策略优化问题的研
究主要集中在以下3个方面: (1)物理层的攻防预测模型研究。该领域安全问题主要
分2类:网络拥塞(主动攻击)和窃听(被动攻击)。这部分文
献主要采用零和博弈模型、斯坦科尔伯格博弈模型、合作
博弈模型、非合作博弈模型以及不完全信息动态贝叶斯模
型。如文献[1]引进随机零和博弈模型研究攻击者和次要用
户在拥塞和反拥塞情境下的问题;文献[2]使用合作博弈模
型来研究改善有许多窃听者存在情况下的物理层安全问题。 (2)移动网络中的攻防研究。该领域中安全协议设计者
基金项目:教育部人文社会科学研究青年基金资助项目(12YJC630106);北京市哲学社科规划基金资助项目“首都社会稳定视角下的
互联网治理对策研究”(12JGA014);中央财经大学科研创新团队支持计划基金资助项目
作者筒介:韩文英(1969--),女,副教授、博士,主研方向:信息安全,计算机审计;闫明星,硕士研究生;柴艳妹、王秀利,副教授、
博士
收稿日期:2012.09—13 修回日期:2012.11—23 E.mail:hanwenying@126.corn
第39卷第9期 韩文英,闫明星,柴艳妹,等:基于博弈论的企业信息安全攻防策略研究 163
将移动节点视为决策者并考虑其追求自身利益最大化,以
此模拟攻击者和防御者间的交互。文献[3]使用完全信息下
零和博弈模型模拟移动网络中攻击者和防御者之间的交互
关系,并在有限信息情境下使用模糊矩阵的方式,获得参
与各方之间的利益冲突关系。
(3)入侵检测的攻防研究。该领域常使用随机零和博弈 模型,从而为监测算法提供一定的理论基础。文献[4]针对
无线自组网络中的入侵检测,提出攻击和防御节点间的博
弈模型,比较了静态和动态贝叶斯模型,认为动态贝叶斯
模型能够使防御者不断更新对手信息,并推荐一种新的贝 叶斯混合入侵检测方法。
国内关于信息安全策略优化问题的研究不是很多,主 要集中于研究入侵检测中攻防问题的模拟和均衡策略优
化。如文献[5]根据网络攻防中的不确定性和动态性,提出
一种基于不完全信息动态博弈的网络攻防模型,证明了均
衡策略的存在性。分析了网络攻防策略,完善了网络攻防 的分析过程。文献[6】针对网络安全最优防御策略选取的复
杂性,将网络安全状态作为攻防随机博弈状态集,建立攻
防双方在多个攻防状态下动态寻找最优攻防策略的攻防随
机博弈模型。文献[7】针对传统被动响应模型滞后于攻击且
频繁误警和虚警导致不当响应的问题,提出一种基于部分
马尔科夫博弈的主动响应决策模型。文献【8]认为攻防博弈
时要进行多目标综合考虑,故建立了多目标网络入侵检测
模型,并从4种不同解决方案下选择出最优策略。文献【9] 针对目前入侵检测系统预测攻击行为能力较弱不能实时主
动响应攻击的不足,提出一种基于重复博弈的攻击预测模
型。文献[10】从攻防双方的角度,正确评估入侵给系统带来
的损失,并权衡两类错误(虚警和漏警)的开销和有限的系统
资源,建立两方非合作零和动态博弈决策控制过程的数学 模型来模拟攻防双方,对入侵进行更正确的响应决策,从
而能提高入浸检测系统的效率。文献[1l】则针对当前报警响
应工作中不能充分考虑系统的收益以及攻击者策略变化因
素等问题,提出一种基于博弈理论的报警响应DIRBGT模
型,使用不完全信息动态博弈模型原理。
通过大量文献分析可以看出,国外学者基本上假设参 与方均是完全理性,而没有考虑存在非完全理性的情况。
此外,不完全信息下的动态博弈研究亦甚少。而国内该领
域研究成果较少,尤其是不完全信息下动态博弈的研究目 前更是备受关注。 之分,因此属于不完全信息的动态博弈。
3.1.1基本假设 (1)用户为攻击者的先验概率为P,为合法用户的先验
概率为1 ,用户类型是用户的私有信息。防御者可根据其
历史行为来修正用户是某种类型的后验概率。
(2)各参与人参与博弈时的收益矩阵见图1,其中, 为
攻击者的攻击成本; 为防御者的防御成本;监测出攻击
时,攻击者受到惩罚 ,防御者获得收益 ;没有监测出
攻击时,攻击者获得收益 ,防御者损失届;尸D为防御
者监测出攻击的概率。 为防御者受到攻击时的声誉损失 ,
这不同于已有研究多认为成功检测出攻击时防御者名誉值
会增加,因为随着信息化发展,成功防范攻击已然成为责
任,遭受攻击却易引起客户的思虑和重新选择。
防御者 。
防御 不防御
攻击 (— 一 ,q+(1一昂) , (,一届~,) 攻击者 _ +PD 一(1-名)(眉+
不攻击 (o,一∥ ) (0,O)
图1博彝参与方收益矩阵1
3.1.2模型均衡求解 。
假设攻击者攻击的概率为 ,不攻击的概率为1一t,则
防御者防御的期望收益为:
EDf=p(,(一 +尸D 一(1一 )(届+ ))+(1一f)(一屈))+ (1一p)(一 )=pt(PB 一(1一 )(届+,))一
防御者不防御的收益为:EDnf=pt(-届'- )。
当EDf=EDnr时,即当攻击者以 Pc
的概率选择攻击时,防御者选择防御或不防御没有区别。
假设防御者防御的概率为S,不防御的概率为1一S,则
同理可得,攻击者攻击的期望收益为:E,4g: PD( + )+
(一 +as);攻击者不攻击的期望收益为:EA g=0。
当EAg ng时 当防御者以S*-- 的概
率选择防御时,攻击者选择攻击与不攻击没有任何区别。
假设防御者受到攻击,则用户为合法用户的后验概率
为:Puserh=O;用户为攻击者的后验概率为:尸u。。 =1。
假设没有受到攻击,则用户为合法用户的后验概率为
3 不完全信息的动态攻防博弈模型Puserh-- ;用户为攻击者的后验概率为:
3.1攻防预测模型
假设博弈参与方包括两方:一方为用户;另一方为防
御者。而用户可能是作为攻击者的非法用户,也可能是合 法用户。故攻防双方的主要参与者为攻击者和防御者。用
户的策略选择为:攻击和不攻击。防御者的策略选择为: 防御和不防御。由于攻防双方信息不对称,行动也有先后 Puserg- 。因此,在不完全信息动态模型下,
用户和防御者会以(f , ,P)均衡状态进行博弈,并由此
决定各自的最优行动。
3.2均衡分析
(1)当攻击者攻击的概率 < 时,防御者选择不防御的