贝叶斯网络的发展与展望
n
! p(x)= p(xi|pai)
(1)
i=1
如果 P 表示( 2) 式中的局部概率分布, 即乘积中的项 p(xi||pai)(i=1,2,…,n),则二元组( S,P) 表示了联合概率分布 p(X), 仅仅从先验信息出发建立贝叶斯网络时, 该概率分布是贝叶斯的( 主观的) 。当从数据出发进行学习, 建
要在这 3 个步骤间反复循环[5]。其结构通常由某个领域专家给出。
贝叶斯网络作为有一种图形化的建模工具, 具有一系列的优点[6]:( 1) 贝叶斯网络将有向无环图与概率理
论有机结合, 不但具有正式的概率理论基础, 同时也具有更加直观的知识表示形式。一方面, 它可以将人类所
拥有的因果知识直接用有向图自然直观地表示出来, 另一方面, 也可以将统计数据以条件概率的形式融入到
的联合概率, 能够处理各种不确定信息;( 4) 贝叶斯网络没有确定的输入或输出节点, 节点之间是相互影响
的, 任何节点观测值的获取或者对于任何节点的干涉, 都会对其它节点造成影响, 并可以利用贝叶斯网络推
理来进行估计和预测;( 5) 贝叶斯网络的推理是贝叶斯概率理论的基础, 不需要外界的任何推理机制, 不但具
WANG Li- dong, WANG Guang- yang, CHENG Ze- kai, ZHU Xiao- yu (School of Computer Science,Anhui University of Technology, Ma' anshan 243002,China)
Abstr act:At present the Bayesian networks is applied widely in each field.Analyzed the comprehensive summarize to the Bayesian networks , Retrospected the development history of the Bayesian networks ,and also analyzed and depicted the current research field. Key wor ds:Bayesian networks;probability distribution;variable
模型中。这样贝叶斯网络就能将人类的先验知识和后验的数据完美地结合, 克服框架、语义网络等模型仅能
表达处理信息的弱点和神经网络等方法不直观的缺点;( 2) 贝叶斯网络与一般知识表示方法不同的是对于问
题域的建模, 当条件或行为等发生变化时, 不用对模型进行修正;( 3) 贝叶斯网络可以图形化表示随机变量间
以关于一组变量 X={X1,X2,…,Xn}的贝叶斯网络由两部分组成:( 1) 一个表示 X 中的变量的条件独立断言的网 络结构 S;( 2) 与每一个变量相联系的局部概率分布集合 P。两者定义了 X 的联合概率分布。S 是一个有向无
环图, S 中的节点一对一地对应于 X 中的变量。以 Xi 表示变量以及该变量对应的节点, Pai 表示 S 中的 Xi 的 父节点。S 的节点之间缺省弧线则表示条件独立。X 的联合概率分布表示为:
Vol.23 No.2 April 2006
安徽工业大学学报 J. of Anhui University of Technology
文章编号: 1671- 7872( 2006) 02- 0195- 04
贝叶斯网络的发展与展望
第 23 卷 第 2 期 2006 年 4 月
王理冬, 汪光阳, 程泽凯, 朱孝宇 (安徽工业大学 计算机学院, 安徽 马鞍山 243002)
例子。
1.3 贝叶斯网络的构造步骤及其优点
贝叶斯网络最终要应用到某个领域中, 在该领域中构建贝叶斯网涉及 3 个步骤:( 1) 必须分辨出所要建
模领域中具有重要性的变量和这些变量的所有可能取值, 并以节点表示;( 2) 判断节点间的依赖或独立关系,
并以图的方式表示;( 3) 获得贝叶斯网定量部分所需要的概率参数, 这一过程比较繁琐。贝叶斯网的构建一般
(1)计算复杂性 是研究贝叶斯网络上学习、推理的算法复杂度。主要的研究包括: 学习贝叶斯网络、使用贝叶斯网络的概 率推理、在贝叶斯网络上的近似概率推理以及为贝叶斯网络寻找图解都是 NP 难题[8]。 (2)知识工程和维护 涉及推理的性能、灵敏度、网络冲突、概率引导以及故障查找等, 主要研究包括: 结合定性和定量信息贝 叶 斯 网 络 的 概 率 引 导 、优 先 信 息 提 高 贝 叶 斯 图 解 模 型 的 推 断 性 能 、具 有 中 间 状 态 的 诊 断 推 理 灵 敏 度 、造 成 两 部 分 网 络 作 为 假 想 模 型 用 于 贝 叶 斯 网 络 上 冲 突 检 测 、利 用 不 完 整 知 识 和 多 余 描 述 的 对 象 识 别 、贝 叶 斯 网 络 在 条件概率上的灵敏度分析以及决策理论故障查找的一种用于维护和实验的结构等。 (3)知识结构和表达 主要研究贝叶斯网络结构、反真实性、独立性以及短暂性。贝叶斯网络结构以计算概率密度函数、定性概 率网络的推理以及在不确定性条件下的决策扩展影响图的表达。 反真实性表达若 A 为真, 则 C 亦为真。表达独立性的有: 有约束边界的均衡贝叶斯网络结构特性、通过概 率 相 似 网 络 的 条 件 概 率 、在 贝 叶 斯 网 络 中 前 后 关 系 明 确 的 独 立 性 、反 馈 因 果 图 中 的 独 立 性 、通 过 独 立 超 立 方 体的条件独立性以及在贝叶斯网络中涉及独立事实的充分完整性和可靠性。表达短暂性的有: 在不确定性下 行为和变化的推理框架的行为网络、依据内源和外源变化的概率性短暂推理以及关于概率性短暂信息的短 暂 贝 叶 斯 网 络[9]。 (4)学习 主要涉及学习的算法, 如归纳、估计, 链图等。有关的研究包括: 使用模拟数据集合的贝叶斯网络的归纳 学习, 关于质量测量的贝叶斯网络学习算法的特性, 用于学习的系列链图, 研究参数独立性的学习贝叶斯网 络, 在随机域中使用估计方法学习, 学习贝叶斯网络的样本复杂度, 采用局部结构学习贝叶斯网络, 以及用于 神经连接的对数模型的贝叶斯学习。 (5)推理 推理采用的算法包括修正算法和更新算法, 许多方法都是同时适用于修正算法和更新算法的。 修正算法包括常用的整数规划、A*,遗传算法以及消息传递等, 其研究主要包括:转换贝叶斯网络为基于 代价的推论而后通过整数规划解决的动态图计算以及无能量函数的快速爬山法(是近似和精确的); 转换贝叶 斯网络为价值基础的推论而后通过 A* 解决它们:复杂不确定系统的一种遗传算法决策支持工具(近似的);推 理多重连接的贝叶斯网络则属于无反馈的消息传递; 还有簇式搜索法在图形结构上的概率局部计算。 更新算法中采用的推理方法则较广泛, 包括了常用的列举法、消息传递、随机法、随机模拟法、取系数法、 条 件 法 、环 状 子 集 法 、簇 式 图 、符 号 概 率 推 理 法 和 快 速 贝 叶 斯 网 络 更 新 法 等 。 这 类 研 究 包 括:列 举 法 的 在 近 似 贝 叶 斯 网 络 推 理 上 的 错 误 估 计 (近 似 的)和 通 过 列 举 高 概 率 的 独 立 任 务 的 贝 叶 斯 网 络 更 新 算 法 来 最 大 化 概 率 集。消息传递在概率网络上的对数时间更新和查询。随机法使用分层模拟方法的马可夫链改进取样法和在大 型概率性专家系统中划分条块的节点树随机抽样法(近似的)。随机模拟的适用动态概率网络的一般概率推理 模拟方法(近似的)。取系数法在贝叶斯网络上的高效推理的整合优化。条件法适用动态条件和限制条件的稀 少 信 息 条 件 下 决 策 的 灵 活 推 理 和 适 用 因 果 网 络 的 精 确 和 近 似 推 理 的 条 件 算 法[10]。 使 用 环 状 子 集 的 多 重 连 接 贝叶斯网络的概率推理。簇式图的论述转换方法不考虑三角划分的分簇法和在图形结构上概率的局部计算。
在贝叶斯网络中, 起因的假设和结果的数据均用节点表示, 它们之间的联系用有向弧表示。在各变量之 间画出它们的因果关系, 并将它们用数字编码的形式来描述一个变量可能影响另一个变量的程度。在概率推 理中, 随机变量用于代表世界上的事物或事件, 将这些随机变量实例化成各种实例, 就可以对世界上现存的 状 态 进 行 建 模[3]。 1.2 贝叶斯网络的组成及语义
收稿日期: 2005- 08- 11 作者简介: 王理冬(1980- ),男, 安徽宿松人, 硕士研究生。
196
安徽工业大学学报
2006 年
由于贝叶斯网络是一种概率图模型[4], 它表示变量之间的联合概率分布( 物理的或贝叶斯的) , 分析变量
之间的相互关系, 利用贝叶斯定理揭示学习和统计推断功能, 实现预测、分类、聚类、因果分析等数据采掘。所
引言
目前在人工智能领域, 贝叶斯推理提供了一种概率手段, 即假设待考查的变量遵循某概率分布, 根据这 些概率及已观察到的数据进行推理, 以作出最优的决策。在推理的过程中贝叶斯学习算法能够计算显式的假 设概率, 如较为常用的朴素贝叶斯分类器, 分类器必须假定所有变量在给定目标变量值时为条件独立的前 提, 与此不同的是贝叶斯网络中所表达变量的一个子集上的条件为独立性假定。贝叶斯网络提供一种中间的 方法, 比朴素贝叶斯分类器中条件独立性的全局假定的限制更少, 在所有变量中计算条件依赖更可行[1]。因 此, 理论和实践中的许多问题都可以通过贝叶斯网建模实现, 可见贝叶斯网的应用越来越广。
( 3) 贝叶斯网络是概率的分类/回归模型
假设一组变量 X={X1,X2,…,Xn}的物理联合概率分布可以编码在某个网络结构 S 中:
n
! p(x|бS,Sh)= p(xi|paj,θi,Sh)
(2)
i=1
其中 бi 是分布 p(xi|paj,θi,Sh)的参数向量;θS 是参数组(θ1,θ2,…,θn) 构成的向量;Sh 表示物理联合分布可以依照 S 分
解的假设。将分布 p(xi|paj,θi,Sh)看成的 θi 函数, 并称为局部分布函数。局部分布函数其实是一个概率分类或回