当前位置:文档之家› 人工智能原理教案03章 不确定性推理方法323证据理论

人工智能原理教案03章 不确定性推理方法323证据理论

3.4证据理论0. 前言●主观Bayes方法必须给出先验概率。

●Dempster和Shafer提出的证据理论,可用来处理这种由不知道所引起的不确定性。

●证据理论采用信任函数而不是概率作为不确定性度量,它通过对一些事件的概率加以约束来建立信任函数而不必说明精确的难于获得的概率。

●证据理论满足比概率论更弱的公理系统,当这种约束限制为严格的概率时(即概率值已知时),证据理论就退化为概率论了。

1. 证据的不确定性度量(1) 基本理论辨别框概念:设U为假设x的所有可能的穷举集合,且设U 中的各元素间是互斥的,我们称U为辨别框(Frame of discernment)。

设U的元素个数为N,则U的幂集合2U的元素个数为2N,每个幂集合的元素对应于一个关于x取值情况的命题(子集)。

对任一A U,命题A表示了某些假设的集合(这样的命题间不再有互斥性)。

针对医疗诊断问题,U就是所有可能疾病(假设)的集合,诊断结果必是U 中确定的元素构成的。

A 表示某一种(单元素)或某些种疾病。

医生为了进行诊断所进行的各种检查就称作证据,有的证据所支持的常不只是一种疾病而是多种疾病,即U 的一子集A 。

定义1:基本概率分配函数(Basic probability assignment ):对任一个属于U 的子集A (命题),命它对应于一个数m ∈[0,1],而且满足∑⊆==ΦUA A m m 1)(0)(则称函数m 为幂集2U 上的基本概率分配函数bpa ,称m(A)为A 的基本概率数。

m(A)表示了证据对U 的子集A 成立的一种信任的度量,取值于[0,1],而且2U 中各元素信任的总和为1。

m(A)的意义为● 若A ⊂U 且A ≠U ,则m(A)表示对A 的确定信任程度。

● 若A=U ,则m(A)表示这个数不知如何分配(即不知道的情况)。

例如,设U={红,黄,白},2U 上的基本概率分配函数m 为m ({ },{红},{黄},{白},{红,黄},{红,白},{黄,白},{红,黄,白})=(0,0.3,0,0.1,0.2,0.2,0,0.2)其中,m({红})=0.3 表示对命题{红}的确定信任度。

m({红,黄,白})=0.2 表示不知道这0.2如何分配。

值得注意的是,m({红})+m({黄})+m({白})=0.3+0+0.1=0.4<1因此,m不是概率,因为概率函数P要求P(红)+P(黄)+P(白)=1即有P(A)=1-P(~A)而这里m(A) 1-m(~A)其中:~A=U-A,是A的补集。

小结:bpa不同于Bayes方法,因为Bayes方法仅对U中单个元素赋予一种信任――概率。

而对于bpa来说:●给U的每个子集指派[0,1]中的一个数;●空集的指派为0;●所有子集的指派值之和等于1。

●m(U)只是总可信度的一部分。

在对U中的适当子集分派可信度之后,剩余的可信度就不再分派给其它任何子集,而只分派给U 本身。

即:如果有一证据仅支持U 的一个子集A ,m(A)=S ,而不支持其它任何子集B ,则指派m(U)=1-S ,m(B)=0,B ≠A ,B ⊂U 。

定义2:信任函数(Belief function ):命题A 的信任函数Bel :2U →[0,1]为∑⊆=A B B m A Bel )()( ∀A ⊆U表示对A 的总信任。

即,命题A 的信任函数的值,是A 的所有子集的基本概率之和。

例如,在前面的例子中Bel({红},{白})=m({红})+m({白})+m({红,白})=0.3+0.1+0.2=0.6根据定义可以看出Bel(Φ)=0Bel(U)=1单元素集上m 与Bel 是相等的,例如:Bel({红})=m({红})=0.3。

定义3:似然函数(Plausibility function ):命题A 的似然函数Pl: 2U →[0,1]为∑Φ≠=-=A B B m A Bel A Pl )()(~1)( ∀A ⊆U表示对于不否定A 的信任度,是所有与A 相交的子集的基本概率之和。

其中:~A=U-A ,是A 的补集。

信任函数与似然函数有以下的关系:0≤Bel(A)≤Pl(A)≤1Pl(A)-Bel(A)表示了既不信任A 也不信任~A 的一种度量,可表示对命题A 是真是假不知道的度量。

用记号A[Bel(A),Pl(A)]来综合描述A 的不确定性。

其中,Bel(A)和Pl(A)分别表示命题A 的下限函数和上限函数。

实际上m ,Bel ,Pl 只要知其一,必可求得另两个,但三个函数有不同含义。

例如,在前面的例子中:m({红})=0.3Bel({红})=m({红})+m({ })=0.3+0=0.3Pl({红})=1-Bel({~红})=1-Bel ({黄,白})=1-[ m({黄})+m({白})+m({黄,白})]=1-(0+0.1+0)=0.9所以,{红}[ Bel({红}),Pl({红})] = {红} [0.3,0.9]。

以下列举几个典型值的含义:A[1,1]表示A为真。

因为Bel(A)=1,Bel(~A)= 1- Pl(A)=0。

A[0,0]表示A为假。

因为Bel(A)=0, Bel(~A)= 1- Pl(A)=1。

A[0,1]表示对A一无所知。

因为:Bel(A)=0,说明对A缺少信任;Bel(~A)=1- Pl(A)=0,说明对~A也缺少信任。

A[0.6,1]表示对A部分信任。

因为Bel(A)=0.6,Bel(~A)=0。

A[0,0.4]表示对~A 部分信任。

因为Bel(A)=0, Bel(~A)=0.6。

A[0.3,0.9]表示同时对A 和~A 部分信任。

(2) 证据描述设某个领域的辨别框U={S 1,S 2,…,S n },m 为2U 上定义的基本概率分配函数,在下面描述的算法中,应满足如下条件: a) m({S i })≥0, 对S i ∈Ub) 1})({1≤∑≤≤ni i S mc) m(U)=1-∑≤≤ni i S m 1})({d) m(A)=0, 对A ⊂U ,且|A|≠1(集合A 的元素个数不为1,且又不包括全体元素)例如,U={红,黄,白}时下面的基本概率分配函数:m ({红},{黄},{白},{红,黄,白},{ })=(0.6,0.2,0.1,0.1,0)其中,m ({红,黄})= m ({红,白})= m ({黄,白})= 0。

定义4(证据的信任函数):对任何命题A ⊆U ,其信任函数为Bel(A)=∑∑⊆∈=A B Aa a m B m })({)( ∀A ⊂UBel(U)=∑∑⊆∈=+=U B Ua U m a m B m 1)(})({)(定义5 (证据的似然函数):对任何命题A ⊆U ,其似然函数为Pl(A)=1-Bel(~A)=1-∑∉Aa a m })({ A ⊂U=1-∑∑∈∈-U a Ab b m a m })]({})({[=1-[1-m(U)-Bel(A)]=m(U)+Bel(A)根据以上定义,可以看出命题的信任函数和似然函数之间满足下列关系:● Pl(A)≥Bel(A)● Pl(A)-Bel(A)=m(U)除了以A[Bel(A),Pl(A)]来作为证据A 的不确定性度量外,还可用类概率函数来度量。

定义6(类概率函数):设U 为有限域,对任何命题A ⊆U ,命题A 的类概率函数为 ))()((||||)()(1A Bel A Pl U A A Bel A f -+= 其中|A|、|U|分别表示A 和U 所含元素个数。

类概率函数)(1A f 具有如下性质:1)∑⊂=U a a f 1})({12) Bel(A)≤)(1A f ≤Pl(A), ∀A ⊆U 3))~(1A f =1-)(1A f , ∀A ⊆U根据以上性质,可以得出以下推论:1) 0)(1=Φf2)1)(1=U f3) U A A f ⊆≤≤对 , 1)(01可以看出,类概率函数与概率函数具有非常相似的性质。

(3) 证据的组合对于同样的证据,由于来源不同,会得到不同的概率分配函数。

Dempster 提出用正交和来组合这些函数。

定义7(正交和):设m 1,m 2,…,m n 为2U 上的n 个基本概率分配函数,它们的正交和m(A)=(m 1⊕m 2⊕…⊕m n )(A )为⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≠•==∑∏=⋂≤≤A A n i i 1i i A ),(A m k m(A)A 0,=) m(φφφ 其中k -1=1-)()(11iA ni i A n i i i A m A m i i ∑∏∑∏≠⋂≤≤=⋂≤≤=φφ 若k -1=0,则m i 之间是矛盾的,没有联合基本概率分配函数。

若k -1≠0,这样的m i 就确定一个基本概率分配函数。

常数k 是根据m 1⊕m 2⊕…⊕m n 需对2U 的所有元素的基本概率分配之和为1来确定的。

(这种规定称作Dempster 组合规则,要求m 1⊕m 2⊕…⊕m n 提供的证据满足某种独立性条件)2. 规则的不确定性度量设某个领域的辨别框U={S 1,…,S n },命题A 、B 、…为U 的子集,推理规则为E →H ,CF其中,E 、H 为命题的逻辑组合,CF 为可信度因子。

命题和可信度因子可表示为A={a 1,…, a k }CF=(c 1,…,c k )其中c i 用来描述a i 的可信度,i=1,2,…,k 。

对任何命题A ,A 的可信度CF 应满足:1) c i ≥0,1≤i ≤k2)11≤∑≤≤k j j c3. 推理计算(1) 当条件部分为命题的逻辑组合时,整个条件部分的确定性计算:)(211A A f ∧=min{)(),(2111A f A f } 合取)(211A A f ∨=max{)(),(2111A f A f } 析取(2) 结论部分的命题的确定性计算:即,已知)(1A f ,A →B (c 1,…,c k ),如何计算)(1B f 。

思路:根据前面介绍的方法,首先计算基本分配函数m(B),然后计算结论部分命题B 的信任函数Bel(B)、似然函数Pl(B),最后计算类概率函数和确定性。

设B={b 1,b 2,…,b k },且U={b 1,b 2,…,b k },则U 上的基本概率分配函数为m({b 1},…,{b k }) = (•)(1A f c 1,…,•)(1 A f c k )∑=⋅-=ki A f U m 11)(1)(c i便可得)(1B f 。

(3) 独立证据导出同一假设如果有n 条规则支持同一命题时,根据Dempster 组合规则,总的基本概率分配函数m 为各规则结论得到的基本概率分配函数的正交和:m=m 1⊕m 2⊕…⊕m n例如,已知 A 1→B (c 1,…, c k )A 2→B ('c ,,'c k 1 )以及)(),(2111A f A f如何计算)(1B f 。

相关主题