证据理论(Evidence Theory)方法我们将讨论一种被称之为登普斯特-谢弗(Dempster-Shafer)或谢弗-登普斯特(Shafer-Dempster)理论(简称D-S理论或证据理论)的不精确推理方法。
这一理论最初是以登普斯特(Dempster,1967年)的工作为基础的,登普斯特试图用一个概率区间而不是单一概率数值去建模不确定性. 1976年,谢弗(Shafer,1976年)在《证据的数学理论》一书中扩展和改进了登普斯特工作. D-S理论具有好的理论基础。
确定性因子能被证明是D-S理论的一种特殊情形。
在§2我们将描述一种简化的证据理论模型MET1 . 在§3我们将给出支持有序命题类问题的具有凸函数性质的简化证据理论模型。
围绕证据理论的一些新的研究工作,将在第六章介绍。
§1D-S理论(Dempster-Shafer Theory)●辨别框架(Frames of Discernment)D-S理论假定有一个用大写希腊字母Θ表示的环境(environment),该环境是一个具有互斥和可穷举元素的集合:Θ = { θ1 , θ2 , …, θn }术语环境在集合论中又被称之为论域(the universe of discourse)。
一些论域的例子可以是:Θ = { airliner , bomber , fighter }Θ = { red , green , blue , orange , yellow }Θ = { barn , grass , person , cow , car }注意,上述集合中的元素都是互斥的。
为了简化我们的讨论,假定Θ是一个有限集合。
其元素是诸如时间、距离、速度等连续变量的D-S 环境上的研究工作已经被做。
理解Θ的一种方式是先提出问题,然后进行回答。
假定Θ = { airliner , bomber , fighter }提问1:“这军用飞机是什么?”;答案1:是Θ的子集{ θ2 , θ3 } = { bomber , fighter }提问2:“这民用飞机是什么?”;答案2:是Θ的子集{ θ1} = { airliner },{ θ1} 是单元素集合。
因为元素是互斥的,环境是可穷举的,对于一个提问只能有一个正确的答案子集。
环境的所有子集是对应论域的所有可能的有效答案。
飞机环境的所有可能的子集由图5.1.1示出。
注意,图5.1.1是一个格,子集节点可以有多个父亲节点,这个格(Lattice )是一个分层结构。
从 Θ到 ∅ 的任一路径都表达了连接父节点到儿子节点的子集分层关系,例如,{}{}{}C ,B ,A B ,A A ⊂⊂⊂∅ .当一个环境的元素可以被解释成可能的答案,并且仅有一个答案是正确的,那么该环境被称之为一个鉴别框架。
鉴别这个术语意味着,对于一个提问,从与该提问相关的所有可能的答案中能区分出一个正确的答案。
能区分出一个正确的答案需要鉴别框架是可穷举的,其子集是不相交的。
一个大小为N 的集合包括自身恰有2N 个子集,这些子集定义了幂集,记为Θ2,对于飞机框架有Θ2 = {}{}{}{}{}{}{}{}C ,B ,A ,C ,B ,F ,A ,B ,A ,F ,B ,A ,∅Θ2 和对应于环境的所有可能提问的正确答案之间存在着一一对应关系。
● MASS 函数和无知在贝叶斯理论中,后验概率随着证据而改变是所需要的。
同样地,在D-S 理论中,关于证据的信任也可以改变。
在D-S 理论中,习惯上把证据的信任度类似于物理对象的质量去考虑,即证据的质量(Mass )支持了一个信任。
关于质量这一术语也被称为基本概率赋值(BPA , the Basic Probability Assignment )或简称为基本赋值(Basic Assignment )。
为了避免与概率论相混淆,我们将不使用这些术语,而是简单的使用质量(Mass ) 一词。
D-S 理论和概率论的基本区别是关于无知的处理。
即使在无知的情况下,概率论也必须分布一个等量的概率值。
假如你没有先验知识,那么你必须假定每一种可能性的概率值都是PN1P =其中,N是可能性的总数。
事实上,这赋值为P是在无可奈何的情况下作出的。
但是,概率论也有一种冠冕堂皇的说法,即所谓的中立原理(the principle of indifference )。
当仅仅有两种可能性存在的时候,比方说“有石油”和“没有石油”,分别用H和¬H表示,那么出现应用中立原理的极端情况。
在与此相类似的情况中,即使在没有一点知识的条件下,那么也必须是P = 50 % ,因为概率论要求P(H)+P(¬H) = 1,就是说,要么赞成H,要么反对H,对H无知是不被允许的。
在没有关于¬H的任何证据的情况下,即使不用中立原理,那么约束P(H)+P(¬H) = 1也要求必须对¬H进行概率赋值。
D-S理论不要求必须对无知假设H和反驳假设H赋以信任值,而是仅仅将Mass分配给你希望对其分配信任的环境的子集。
任一未被分配给具体子集的‘信任’被看成‘未表达意见’,并将其分配给环境Θ. 反驳一个假设的‘信任’,实际上,是对该假设的‘不信任’,但不是对该假设‘未表达意见’。
例1.1假定一个敌友飞机识别(IFF , Identification Friend or Foe)传感器(敌友飞机识别(IFF , Identification Friend or Foe)传感器也被简称为敌友飞机识别器),从一架飞机的应答器获得了一个响应。
如果某飞机是友机,那么它的发射机应答器应通过回送它的识别代码立即进行应答。
若接收应答的飞机未收到某架飞机A的应答,那么接收应答的飞机的缺省处理结果是:飞机A是一架敌机。
一架飞机A* 可能因下列原因未能发送应答信息:• A* 的敌友飞机识别器发生了故障• A* 的发射机应答器发生了故障• A*上没有敌友飞机识别器• A* 的敌友飞机识别器受到了干扰• A* 收到了保持其雷达沉默的命令假定因敌友飞机识别器的故障,导致了关于目标飞机有0.7的可能性是敌机的证据,其中仅仅轰炸机和战斗机被认为是敌机。
由此,这Mass的赋值为m1({B , F}) = 0.7其中,m1系指由第一个敌友飞机识别器提供的证据的Mass值。
注意,其余的信任将被留给环境 Θ ,作为未表达意见的部分:m 1({Θ}) = 1-0.7 = 0.3注意‘未表达意见’既不是信任,也不是不信任。
而概率论对此却给出不同的结果P(敌机) = 0.7 P(¬敌机) = 1-0.7 = 0.3 对同一个问题,两种理论却给出了不同的处理,这正体现了D-S 理论和概率论之间的主要差别。
证据理论 概率论 0.7 m 1({B , F}) 支持假设 P(敌机) 支持假设 0.3 m 1({Θ}) 未表达意见 P(¬敌机) 反驳假设环境的幂集合中的任一个集合,若其Mass 值大于0(zero ),则称其为焦点元素(focal element )。
使用焦点元素这一术语的原因是:一个幂集合元素X 的Mass 值m(X)大于0,意味着可用证据在X 中的被聚焦,或者说被集中。
表5.1.1说明Mass 比概率有大得多的自由度:D-S 理论 概率论m(Θ) 不必须等于1 1P jj =∑ 如果Y X ⊆, m(X) ≤ m(Y)不是必须的 如果Y X ⊆,P(X) ≤ P(Y) 是必须的m(X) 和m(¬X) 之间没有什么关系P(X) + P(¬X) = 1 表5.1.1 D-S 理论和概率论的比较每一个Mass 能被形式化表成一个函数,该函数映射幂集合中的每一个元素成为区间 [0 , 1]的一个实数。
函数的形式化描述为 m :Θ2→ [0 , 1]按着惯例,空集合的Mass 通常被定义为0(zero ),m(∅) = 0 . Θ的幂集合2Θ 的所有子集的Mass 和为1∑=Θ∈2X 1)X (m 或 1)X (m X =∑Θ⊆例如,在飞机环境中有∑=+=Θ+=Θ∈2X 1113.07.0)(m })F ,B ({m )X (m●组合证据当新的证据变成可用的时候,我们希望组合所有的证据以产生一个更好的信任评价。
为了说明如何组合证据(也称之为证据组合),我们首先看一个证据组合一般公式的一种特殊的情形。
假定另一类型的一个传感器用0.9的信任识别出目标飞机为轰炸机。
现在,来自传感器的证据的Mass 为:m 1({B, F}) = 0.7 m 1(Θ) = 0.3 m 2({B}) = 0.9 m 2(Θ) = 0.1其中,m 1和m 2与第一和第二种类型的传感器相对应。
使用下述登普斯特的组合规则的特殊形式以产生组合Mass )Y (m )X (m )Z (m m )Z (m Z Y X 21213∑×=⊕==∩其中,求和遍布使X ∩ Y = Z 成立的所有元素X 与Y ,操作符 ⊕ 表示正交和或直接和。
登普斯特的规则组合两个Mass 以产生一个新的Mass ,新Mass 表示初始可能是冲突的证据间的一致意见。
这新Mass 通过仅仅对交集的Mass 求和汇集了一致意见,集合的交集表达了公共的证据元素。
十分重要的一点是:用于组合的证据必须是独立差错的(independent errors )。
注意,独立差错的证据 ≠ 独立采集的证据。
表5.1.2给出了登普斯特的组合规则,其中每一个交集之后都跟随一个数值(两个Mass 的乘积)。
m 2({B}) = 0.9 m 2(Θ) = 0.1 m 1({B , F}) = 0.7{B} 0.63 { B , F } 0.07 m 1(Θ) = 0.3{B} 0.27 Θ 0.03 表5.1.2 行列Mass 相乘90.027.063.0})B ({m m })B ({m 2112=+=⊕= (轰炸机) 07.0})F ,B ({m m })F ,B ({m 2112=⊕= (轰炸机或战斗机) 03.0)(m m )(m 2112=Θ⊕=Θ (未表示意见)这m 12({B}) 表示目标飞机是轰炸机的信任。
但是,这m 12({B , F}) 和 m 12(Θ) 却包含着另外的信息。
因为它们的集合中包含了轰炸机,所以把它们的正交和贡献给轰炸机一个信任似乎是合理的。
由此,关于 {B} 的最大信任为0.03 + 0.07 + 0.9,关于 {B} 的最小信任为0.9,{B} 的真实的信任在区间 [0.9 , 1.0] 中的某处。
在证据推理中,证据导致一个证据区间(EI , Evidence Interval )。