1963 年,由Robert Sokal 和Peter Sneath 合著的《Principles of Numerical Taxonomy)) 一书
对聚类的研究起了很大的推动和促进作用。
在很多年前,统计学的一个分支称作聚类分析,
这个时候的聚类主要是基于距离的聚类,AutoClass就是这类方法的代表,它是以统计分析为
基础的。
模式识别中的聚类分析人们称它为非监督的学习或概念聚类,它要求同类的对象具有某种共同内涵,而不仅仅考虑对象间的距离。
从这个意义上看,聚类分析可以这样定义:将数据划分成不同的组,目标是使得各个组之间的差异较大,而同一组的相似性则较高。
聚类分析不仅是数据挖掘中的重要方法同时也是知识发现的重要手段,目前在前人的努力之下我们己经有了一些聚类算法,能够帮助我们解决一些问题,然而这些算法都有着各自的局限性[3]。