当前位置:文档之家› 贝叶斯分类器工作原理

贝叶斯分类器工作原理

贝叶斯分类器工作原理原理
贝叶斯分类器是一种比较有潜力的数据挖掘工具,它本质上是一种分类手段,但是它的优势不仅仅在于高分类准确率,更重要的是,它会通过训练集学习一个因果关系图(有向无环图)。

如在医学领域,贝叶斯分类器可以辅助医生判断病情,并给出各症状影响关系,这样医生就可以有重点的分析病情给出更全面的诊断。

进一步来说,在面对未知问题的情况下,可以从该因果关系图入手分析,而贝叶斯分类器此时充当的是一种辅助分析问题领域的工具。

如果我们能够提出一种准确率很高的分类模型,那么无论是辅助诊疗还是辅助分析的作用都会非常大甚至起主导作用,可见贝叶斯分类器的研究是非常有意义的。

与五花八门的贝叶斯分类器构造方法相比,其工作原理就相对简单很多。

我们甚至可以把它归结为一个如下所示的公式:
其中实例用T{X0,X1,…,Xn -1}表示,类别用C 表示,AXi 表示Xi 的父节点集合。

选取其中后验概率最大的c ,即分类结果,可用如下公式表示
()()()()()(
)0011111000111110|,,,|,,,,C c |,i i n n n i i X i n n n i i X i P C c X x X x X x P C c P X x A C c P X x X x X x P P X x A C c ---=---============∝===∏∏()()
10arg max |A ,i n c C i i X i c P C c P X x C c -∈=====∏
上述公式本质上是由两部分构成的:贝叶斯分类模型和贝叶斯公式。

下面介绍贝叶斯分类器工作流程:
1.学习训练集,存储计算条件概率所需的属性组合个数。

2.使用1中存储的数据,计算构造模型所需的互信息和条件互信息。

3.使用2种计算的互信息和条件互信息,按照定义的构造规则,逐步构建出贝叶斯分类模型。

4.传入测试实例
5.根据贝叶斯分类模型的结构和贝叶斯公式计算后验概率分布。

6.选取其中后验概率最大的类c,即预测结果。

其流程图如下所示:
计算所需户信息或条
件互信息
构造贝叶斯分类模型
是否有训练集
传入
结束
计算后验概率分布
选后验概率最大的C作
为结果预测阶段
传入训练集



段。

相关主题