当前位置：文档之家› 2.3最小风险贝叶斯判决准则-Read

2.3最小风险贝叶斯判决准则-Read

第2章贝叶斯决策理论
模式分类实际上是将特征空间划分为不同的决策区域, 相邻决策区域被决策面所分割, 这些决策面是特征空间中的超曲面, 其决策面方程满足相邻两个决策域的判别函数相等,
gi(x)=gj(x) 分类器可被看做是一个计算m类个判别函数并选取最大(或最小)判决值对应的类别的网络或机器。一个分类器的网络结构如图2-1所示。
第2章贝叶斯决策理论
第2章贝叶斯决策理论
2.1 分类器的描述方法 2.2 最大后验概率判决准则 2.3 最小风险贝叶斯判决准则 2.4 Neyman-Person判决准则 2.5 最小最大风险判决准则习题
第2章贝叶斯决策理论
2.1 分类器的描述方法
2.1.1 基本假设
给定模式空间S，由m个互不相交的模式类集合1,2, ,m
(3)
m Ri Rd 。若
m
Ri
Ri为Rd的真子集, 即 Rd m Ri
,
i 1
i 1
i 1
当样本落在此区域中时, 样本对应的模式不是m类中的任何一种,
可以把它称为拒绝类,
m
Rd Ri
i 1
为拒绝域, 相应的判决为
拒识。此时, 引入一个新类ωm+1(拒绝类), 相应的决策区域为
第2章贝叶斯决策理论
总的产品个数n=2 253 550; 属于类ω1产品的个数 n1=901 420; 属于类ω2产品的个数 n2=1 352 130; 由此可以估计出两类产品出现的概率,
P(1) n1 / n 0.4
P(2 ) n2 / n 0.6
第2章贝叶斯决策理论
第2章贝叶斯决策理论
如果不考虑拒识, 此时,
m
Ri Rd , 那么, 正确分类包
i 1
括m种情形, 样本x来自类ωi, 特征向量x∈Ri(i=1, 2, …, m); 错
误分类包括m(m－1)种情形, 样本x来自类ωi, 但特征向量
x∈Rj(i=1, 2, …, m; j=1, 2, …, m; j≠i)。因此, 平均正确概
第2章贝叶斯决策理论
3. 把分类问题对应为Rd空间上的多元函数, 通常称为判别函数(或称判决函数)gi(x), i=1, 2, …, m 对于任给未知类别的样本x, 计算各类判别函数的值gi(x), i=1, 2, …, m, 将样本x判属有极大(或极小)函数值的那一类。到底应取极大值还是取极小值, 需要根据具体问题的物理意义确定。不同的判别函数对应不同的模式分类方法。
第2章贝叶斯决策理论
2.1.2
模式分类器的描述方法有多种, 这里仅介绍以下三种描述方法, 它们之间是统一的。
1. 由于我们获取的有关观察对象的数据总量是有限的, 因此, 可用一个d+1维向量表示, 即
(x1, x2, , xd ; )
第2章贝叶斯决策理论
其中: (x1, x2, …, xd)为特征向量, 是特征空间Rd中的一个点; α 取值于集合{1, 2, …, m}, 表示模式的真实类别号, 是未知的量, m为类别数。模式分类的实质在于实现特征空间Rd到类别号空间{1, 2, …, m}的一个映射, 即
Rd→{1, 2, …, m} 给定一个映射f, 就给出了一种模式识别方法, 不同的映射对应不同的分类方法, 这就是模式识别问题的映射描述法。
第2章贝叶斯决策理论
2. 划分描述法由于每个特征向量是Rd空间的一个点，且Rd→{1, 2, …, m}是一个多对一的映射，通过映射，本质上实现了对空间Rd 的一种划分，即把Rd划分成个不相重叠的区域，每一个区域对应一个类别。设区域Ri对应第i类ωi，则以下条件成立：
组成，即 S 1 2
m ，i j , (i j, i, j 1, 2, , m) 。
几个基本假设如下：
(1) 假定类ωi的先验概率为P(ωi); (2) 样本(或模式) x由特征向量来表示, 同样记为x, 假设
为d维, 即x=(x1, x2, …, xd);
第2章贝叶斯决策理论
第2章贝叶斯决策理论
图 2-1 分类器的网络结构
第2章贝叶斯决策理论
2.2 最大后验概率判决准则
2.2.1
在讨论具体的判决准则之前, 让我们先来看一个分类问题。假设某工厂里所有的产品都只属于事先确定的两类, 分别表示为ω1=“高质量”, ω2=“平均质量”。假设工厂对于产品储量有一个合理的长期记录, 总结出来的结果如下：
Hale Waihona Puke 率Pcmm
Pc i1 P(x Ri | i )P(i ) i1 P(i ) Ri p(x | i )dx
(2-1)
第2章贝叶斯决策理论
平均错误概率Pe
Pe=1－Pc
(2-2)
以下不再刻意区分样本(或模式)和特征向量, 也就是说,
x∈ωi意指x是样本(或模式); x∈Ri或函数g(x)意指x是特征向量。
(1) Ri Rj , i j i, j 1, 2, , m 这一条表明了分
类的确定性，一个样本只能属于某一类，不能同属两个或多个类别。
第2章贝叶斯决策理论
(2) 若特征向量x=(x1, x2, …, xd)落在区域Ri内, 即x∈Ri, 则将
样本x判属第i类, 记为x∈ωi; 此时, Ri称为x∈ωi的决策区域。
m
Rm1 Rd Ri 。
i 1
第2章贝叶斯决策理论
当样本落在两类或多类的交界面上时, 可以任取交界面所在的一类进行判决, 也可以拒绝判决。从划分意义上看, 模式识别就是对于一个具体分类问题, 在确定了需分类的类别数m和所用的特征维数后, 实现对Rd空间的划分, 每一种划分对应一种识别方法。
(3) 特征向量x的取值范围构成特征空间, 记为Rd; (4) 特征向量x的类条件概率密度函数为p(x|ωi), 表示当样本x∈ωi时, 特征向量x的概率密度函数; (5) 特征向量x的后验概率为P(ωi|x), 表示在特征向量x出现的条件下, 样本x来自类ωi的概率, 即类ωi出现的概率。模式识别就是根据特征向量x的取值, 依据某个判决准则把样本x划分到ω1，ω2, …, ωm中的一个。

e商务文档

2.3最小风险贝叶斯判决准则-Read

相关文档推荐：