四 模糊聚类分析方法
模糊聚类分析,是从模糊集的观点来探讨事物的数量分类的一类方法。
这里将主要介绍基于模糊等价关系与基于最大模糊支撑树的模糊聚类分析方法。
一、基于模糊等价关系的模糊聚类分析方法
基于模糊等价关系的模糊聚类分析方法的基本思想是:由于模糊等价关系~R 是论域集U 与自己的直积U U ⨯上的一个模糊子集,因此可以对~
R 进行分解,当用λ-水平对~R 作截集时,截得的U U ⨯的普通子集~
R λ就是U 上的一个普通等价关系,也就得到了关于U 中被分类对象元素的一种分类。
当λ由1下降到0时,所得的分类由细变粗,逐渐归并,从而形成一个动态聚类谱系图。
由此可见,分类对象集U 上的模糊等价关系~
R 的建立是这种聚类分析方法中的一个关键性的环节。
(一)建立模糊等价关系
为了建立分类对象集合U 上的模糊等价关系R *,通常需要首先计算各个
分类对象之间的相似性统计量,建立分类对象集合U 上的模糊相似关系~R 。
1.模糊相似关系的建立关于各分类对象之间相似性统计量r ij 的计算,除了
采用夹角余弦公式和相似系数计算公式以外,还可以采用如下几个计算公式。
(1)数量积法:
在(1)式中,M 是一个适当选择之正数,一般而言,它应满足:
(2)绝对值差数法:
在(2)式中,c 为适当选择之正数,使0≤r ij <1(i≠j)。
(3)最大最小值法:
(4)算术平均最小法:
(5)绝对值指数法:
(6)指数相似系数法:
在(6)式中,s k 是第k 个指标的方差,即
2 将模糊相似关系~R 改造为迷糊等价关系~R *。
由于模糊相似关系~
R 满足自反性和对称性,但一般而言,它并不满足传递性,也就是说它并不是模糊等价关系。
因此,为了聚类,我们必须采用传递闭合的性质将这种模糊相似关系~
R 改造为模糊等价关系~R *。
改造的办法是将~
R 自乘,即这样下去,就必然会存在一个自然数K ,使得:
这时,~~
k R R *=便是一个模糊等价关系了。
(二)在不同的截集水平下进行聚类
用上述模糊等价关系~
R *,在不同的截集水平下聚类,可以得到不同的聚类结果:
二、基于最大模糊支撑树的模糊聚类分析方法
除了依据模糊等价关系进行聚类分析外,还可以应用最大模糊支撑树进行聚类分析。
基于最大模糊支撑树的聚类分析过程,可按如下步骤进行。
第一步:建立分类对象集上的模糊相似关系,构造模糊图。
这一步骤的工作可按如下作法进行:
计算各个分类对象之间的相似性统计量r ij (i ,j=1,2,…,m),建
立分类对象集U 上的模糊相似关系~
()ij m n R r ⨯=。
将~
R 表示成一个由m 个结点所构成的模糊图G=(V,E),使G 中的任意两个结点V i 与V j 之间都有一条边相连结,且赋该边的权值为r ij 。
假若,对于某五个地理区域所构成的分类对象集合V={v 1,v 2,v 3,v 4,v 5},
经过选择聚类要素并对其原始数据进行标准化处理后,计算各分类对象之间的相似性统计量,得到如下的模糊相似关系
第二步:构造最大模糊支撑树。
构造模糊图G 上的最大支撑树的算法,可按下述作法进行:
(1)找出G 中最大权值的边ij r ;
(2)将ij r 存放在集合C 中,将ij r 边上的新结点放入集合T 中,若T 中已含有所有m 个结点时,转(4);
(3)检查T 中每一个结点与T 外的结点组成的边的权值,找出其中最大者ij r ,转至(2);
(4)结束,此时G 中的边就构成了G 的最大模糊支撑树max T 。
按照上述算法,可以求出其最大模糊支撑树max T 。
可以证明,max T 具有下述三个特点:①它不存在回路,所以是树;②它对原图G 中所有结点都是连通的,所以它是图G 的支撑树;③对于G 的其它任何支撑树T ,都有:max T 中各边的权值之和大于或等于T 中各边的权值之和。
所以,max T 的确是G 的最大模糊支撑树。
第三步:由最大模糊支撑树进行聚类分析。
其具体作法是:选择某一个λ值作截集,将max T 中小于λ的边断开,使相连的各结点构成一类,当λ由1下降到0时,所得的分类由细变粗,各结点所代表的分类对象逐渐归并,从而形成一个动态聚类谱系图。
譬如,对于上述最大模糊支撑树max T ,当分别选取λ=1,λ=0.9,λ=0.8,λ=0.7,λ=0.4时,就可以得出不同的分类结果,这一过程所可得到一个聚类谱系图。