当前位置:文档之家› 基于证据理论_层次分析法的贝叶斯网络建模方法_杜元伟

基于证据理论_层次分析法的贝叶斯网络建模方法_杜元伟


练样本集, 尽可能结合专家先验知识 , 确定合适的贝叶斯网络 拓扑结构。值得肯定的是上述研究将专家知识引入贝叶斯网 络的结构构建中, 为克服机器学习类方法的缺陷奠定了一定 的理论基础。而在给定贝叶斯网络拓扑结构的情况下 , 确定 各节点条件概率信息的后续参数学习仍主要依据已有的统计 信息训练得到部分条件概率信息 , 而对无法从统计信息中确 定的条件概率则需要借助专家经验进行主观推断 , 常通过引 [7 ] [8 ] 入直觉模糊函数 或专家作出等级判断 来给出条件概率 表( Conditional Probability Table,CPT ) 。 不得不指出的是, 训 练条件概率表是一项复杂的任务 , 从理论层面上讲这是一个 NP( Nondeterministic Polynomial ) complete 问题 ( 现阶段没有 而从实践层面上讲这个 可以在多项式时间内完成的算法 ) , 过程需要多位知识工程师或领域专家 ( 后文统称为专家 ) 的 共同参与, 是在汲取多方知识和经验的基础上开展的训练 。 考虑到专业领域、 知识背景、 认知程度等诸多方面的差异 , 每
71462022 ) ; 云南省应用基础研究计 收稿日期: 2014-07-23 ; 修回日期: 2014-09-17 。 基金项目: 国家自然科学基金资助项目( 71261011 , 2013FB030 ) ; 云南省教育厅重点项目( 2012Z103 ) ; 云南省哲学社会科学创新团队建设项目 ( 2014cx05 ) ; 昆明理工大学管理 划项目( 2011FZ021 , 与经济学院热点 ( 前沿) 领域科研支撑计划项目 ( QY2014004 ) 。 作者简介: 杜元伟( 1981 - ) , 男, 吉林白山人, 教授, 博士, 主要研究方向: 管理决策、 知识融合; 石方园 ( 1990 - ) , 女, 河南洛阳人, 硕士研 究生, 主要研究方向: 管理决策; 杨娜( 1988 - ) , 女, 河南南阳人, 硕士研究生, 主要研究方向: 管理决策。
1
预备知识
V) , D) , 贝叶斯网络可以描述为一个 G = ( ( N, 其中: ( N, V) 表示有向无环图, 用于表示模型中定性知识方面的特征 , N = ( N1 , N2 , …, N R ) 表示所描述领域的变量集合 , 而 V 表示 网络节点之间的有向弧集合 。 节点 N r 与 N r' ( r ≠ r' ) 之间若无 箭线连接, 则二者之间彼此条件独立 , 无直接因果关系; 两个 节点之间若存在有向箭线 N r → N r' , 则表示 N r 与 N r' 之间有直 N r' 为子节点, 弧的方向决 接因果关系, 此时称 N r 为父节点、 D2 , …, 定了变量间的因果关系 , 可用于因果推理; D = ( D1 , D T ) 代表网络中的条件概率参数集合 , 表示模型中定量知识 V) , 方面的特征。 因此, 一个特定结构的贝叶斯网络 G = ( ( N, D) 用图和条件概率参数表唯一确定了领域变量 N = ( N1 , …, N R ) 上的联合概率分布。 N2 , 贝叶斯网络一方面可以用来表示不确定性变量联合概率 反映变量间潜在的依赖关系 , 而通过对这些 分布的图形模式, 变量关系的研究可以得到对象的知识表达 ; 另一方面则可以 模拟人的认知思维推理模式 , 用一组条件概率函数以有向无 环图( Directed Acyclic Graph,DAG ) 的形式表示不确定性的 因果推理模型, 是不定性推理中可以进行因果模式 、 诊断模 式、 多原因模式和混合模式推理的唯一推理机制 。综上所述, 贝叶斯网络因其固有的知识表达和概率推理特征而正在成为 解决不确定性问题的强有力工具 。 DempsterShafer 产生自 20 世纪 60 年代。 Dempster[10] 提 并 诱 导 和 定 义 了 上、 下 概 率。 随 后, 出了集值映射 的 概 念, Shafer[11]用信度函数对上、 下概率重新进行诠释, 创立了“证 。Dempster 还定义了著名的 Dempster 证据组 据的数学理论” 合规则, 该理论中的最基本概念之一是信度函数 , 因此也被称 为信度函数理论。 证据理论作为概率理论的一种推广 , 是一种基于不确定 框架的信度函数理论 , 因其能够克服概率理论自身只能处理 纯定性问题的局限性 , 是处理不确定性问题的理想工具 , 并且 已经在入 侵 监 测、 袭 击 与 警 报 之 间 的 影 响、 药物系统等领 [12 ] Shafer 模型还具有 域 显示出其独特的优越性。 Dempster利用证据积累以缩小假设集合的重要能力 , 在区分不确定与 不知道以及不精确反映证据收集过程等方面显示了很大的灵 活性。 因此结合前文分析的贝叶斯网络现有研究成果 , 本文所 研究的问题可界定为 , 针对具有已知特定结构的贝叶斯网络 G = ( ( N, V) , D) , 利用证据理论的相关方法集结领域专家的 并确定出 D 中缺失的条件概率表 D t 的推理判断过 推断信息, 程。 为描述方便下面根据本文涉及的相关理论给出相应定 [13 ] 义 。 定义 1 设 Θ 表示节点 N r 的所有可能状态概率取值的 一个论域集合, 且在 Θ 内的各种状态的发生之间是互不相容
Journal of Computer Applications 计算机应用,2015,35( 1) : 140 - 146,151 文章编号: 1001-9081 ( 2015 ) 01-0140-07
ISSN 1001-9081 CODEN JYIIDU
2015-01-10 http: / / www. joca. cn doi: 10. 11772 / j. issn. 1001-9081. 2015. 01. 0140
Construction method for Bayesian network based on DempsterShafer / analytic hierarchy process
DU Yuanwei, SHI Fangyuan , YANG Na
( School of Management and Economics, Kunming University of Science and Technology, Kunming Yunnan 650093 , China)
基于证据理论 / 层次分析法的贝叶斯网络建模方法
杜元,昆明 650093) ( * 通信作者电子邮箱 shifyy@ 163. com)
摘 要: 针对依据专家知识推断贝叶斯网络中条件概率表 ( CPT) 时存在的个体推断信息缺乏完备性和精确性以 及整体集成结果缺乏科学性的问题 , 提出了基于证据理论 / 层次分析法( DS / AHP) 的能够从专家推断信息中提取最优 条件概率的方法。首先, 通过引入 DS / AHP 方法中的知识矩阵提出了有利于实现判断对象更直观 、 判断方式更完善 的推断信息提取机制 ; 其次, 在此基础上遵循由前至后的推断顺序提出了贝叶斯网络的构建过程 ; 最后, 应用传统方 法与提出方法对同一贝叶斯网络中的缺失条件概率表进行了推断 。 数值对比分析表明, 所提方法能够在提高计算效 率的同时将累计总偏差降低 41% , 验证了所提方法的科学有效性和应用可行性 。 关键词: 贝叶斯网络; 证据理论 / 层次分析法; 推断信息提取; Dempster 组合规则; 知识矩阵; 条件概率表 中图分类号: C934 ; TP18 文献标志码: A
*
Abstract: Concerning the problem of lacking completeness and accuracy in the individuals inference information and scientificity in the overall integration results, which exists in the process of inferring Conditional Probability Table ( CPT) in Bayesian network according to expert knowledge, this paper presented a method based on the DempsterShafer / Analytic Hierarchy Process ( DS / AHP) to derive optimal conditional probability from the expert inference information. Firstly, the inferred information extraction mechanism was proposed to make judgment objects more intuitive and judgment modes more perfect by introducing the knowledge matrix of the DS / AHP method. Then, the construction process of Bayesian network was proposed following an inference sequence of anterior to later . Finally, the traditional method and the presented method were applied to infer the missing conditional probability table in the same Bayesian network. The numerical comparison analyses show that the calculation efficiency can be improved and the accumulative total deviation can be decreased by 41% through the proposed method. Meanwhile, the proposed method is illustrated to be scientific, applicable and feasible. Key words: Bayesian network; DempsterShafer / Analytic Hierarchy Process ( DS / AHP ) ; inference information extraction; Dempster combination rule; knowledge matrix; Conditional Probability Table ( CPT)
相关主题