当前位置：文档之家› 一种改进的DBSCAN聚类融合算法及应用

一种改进的DBSCAN聚类融合算法及应用

藕藉
应用方法论
１７３
一
种改进的ＤＢＳＡＮ聚类融合算法及应用Ｃ
黄衍标，魏育华
（广州华立科技职业学院，广东广州５１２１３５）
摘要ＤＳＡ高密度聚类是数据挖掘中聚类算法里常用的一种分析方法，它能找出样本比较密集的部分并概括ｍ样本相对比较集中的ＢＣＮ类。本文通过分析ＤＳＡ算法特点并对其缺陷加以改进运用于ＲｈｃｐＢＣＮｏｏｕ中型组机器人数据融合系统，实验结果表明运用ＤｓＡ算法可以ＢｃＮ大幅度提高机器人目标定位的准确性。关键词聚类融合；ＤＳＡＢＣＮ；密度；Ｒｈｃｐｏｏｕ中型组数据融合中图分类号ＴＰ文献标识码Ａ文章编号１７— ６１（１）７— １３Ｏ６３９７一００２０７一１２１
２１数据结构的聚类算法－邻接表建立完成后，就要开始进行聚类运算了。算法大致的工作流程如下：１初始化一些参数，其中领域半径值ＥＳ）Ｐ和门限值Ｍｎｔ￣机器人ｉｓｐｌ系统的比赛实际情况确定，以４ｓＲｂＣｐＶ４ｏｏｕ中型足球机器人比赛系统来说，本文选领域半径值ＥＳ＝０ｍ，Ｍｉｔ＝２Ｐ．３ｎｓ，聚类数Ｋ＝。ｐ０２）将对象集Ｆ中所有对象插入到邻接表，逐个扫描邻接表基表中的对象，判断其是否已经被聚类过了（通过判断ｕｅｔ￣实现），如果ｓｄａｇ是，则跳过这一对象，否则开始下一步。３）断其是否为核心点，只有核心点才能发起一次聚类活动，是判则Ｋ＝Ｋ＋１并开始步骤４。若此点非核心点则将其标记并跳过这一对象，留待以后的收尾处理。４对这一点开始聚类，ｉ：。然后逐一检索该基表元素后链接的）ｄＫ结点链，从而查找出此点邻域内的所有点，并对这些点进行判断。设其邻域内的点为ｂ，情况１已经被聚类过了，：ｂ则不对ｂ进行任何处理；情况２未被聚类过且是核心点，则将其作为新种子压栈，以待后面对其：ｈ进行递归地聚类处理；情况３未被聚类过且不是核心点，则将类号填：ｂ入ｂｄ的ｉ变量中，说明ｂ已经被聚类为ｉｄ了。不管是哪种情况，都将ｂ点标识为已经聚类过，以免以后进行不必要的重复处理。５）从种子栈中取出一个元素，递归地对其进行聚类。类号ｉ不变，ｄ因为这还是属于原来的类。如此递归，直到种子栈为空为止。这时，标明类号为ｉ的聚类活动完成。ｄ６判断Ｋ）的值，当Ｋ不大于４时返回步骤２再次扫描邻接表基表中的元素。７）归一处理：将遗留点（例如不属于任何类的非核心点）进行噪声点处理，对各类中的节点进行归一化，如多个点进行加权平均运算变成一个点。
聚类是一种重要的数据分析技术。聚类分析作为统计学的一个分支已经被广泛研究了许多年。而且，聚类分析也已经广泛地应用到诸多领域中，包括人＿智能、ｒ模式识别、数据分析、图像处理、推荐系统以及市场研究等领域。通过聚类，人们能够识别密集的和稀疏的区域，因而发现全局的分布模式，以及数据属性之间有趣的相互关系。本文针对目前ＤＳＡ算法的特点及缺陷将之稍作改变并实现其算法步骤，然后放ＢＣＮ到具体应用中加以实验测试。
２算法改进及实现
本文以典型的多移动机器人系统ＲｂＣｐｏｏｕ￣型足球机器人比赛系统为应用实例，由大量的实验数据统计结果表明，比赛系统中各机器人返回的目标定位数据总是以呈正态分布形式出现在实际位置的周同。因此，本文以Ｒｈｃｐｎｏｕ中型足球机器人比赛系统的目标定位作为改进后的ＤＳＡ算法的应用环境。ＢＣＮ机器人需要辨别的目标如球、场上机器人等的位置都是以二维坐标点的方式表示的。在写一个比较完整的程序之前，通常要先规划好程序的数据结构及算法。
ｌｋｏｅ＊ｅｔ，ｉＮｄｌｎｘ；用于链接下一个点ｎ／
）ｎＮｄ；ｌｋｏｅｉ
１ＢＣＮ算法简介及特点ＤＳＡ
ＤＳＡ算法利用类的高密度连通性，快速发现任意形状的类。其ＢＣＮ基本思想是：对于一个类中的每个对象，在其给定半径的领域中包含的对象不能少于某一给定的最小数目。为了发现一个类，ＤＳＡＮＢＣ先从对象集Ｆ中找到任意一对象Ｐ并查找Ｆ，中关于半径ＥＳＰ和最小对象数Ｍｎｔｉｓｐ的从Ｐ密度直达的所有对象。若Ｐ是核心对象，也就是说半径为ＥＳ的Ｐ的Ｐ领域中所包含的对象数不小于Ｍｎ￣ｉ，则通过区域查询（ｅｉｅ）ｐｒｏｑｒ可ｇｎｕｙ以找到一个关于Ｅｓｎ的类，即集合ｃＰ和Ｍｉ。如果Ｐ是一个边界点，则半径为ＥＳ的领域中所包含的对象ｉ＝Ｍｎｔ，被暂时标注为噪声点，Ｐ的ＰｂｆｉｓＰ：ｐ然后继续循环处理Ｆ中下一个对象直到找出所有类。ＤＳＡ算法是一种基于密度的空间数据聚类方法，该算法的显著ＢＣＮ优点是聚类速度快，且能够有效处理噪声点和发现任意形状的空间聚类。但由于它在进行聚类时使用了一个全局性的表征密度的参数，因此也具有比较明显的弱点：一是要求人为确定参数；二是当空间聚类密度不均匀，聚类间距离相差很大时，聚类质量将会受到影响。

e商务文档

一种改进的DBSCAN聚类融合算法及应用

相关文档推荐：