当前位置:文档之家› 第四章聚类分析法

第四章聚类分析法


0.4
0.6
0.81.0Fra bibliotek聚类距离
某村对5 某村对5个地块就其土壤质地和土壤有机 质含量进行了评估,结果如下。 质含量进行了评估,结果如下。请分别 使用最长距离法和最短距离法对这5 使用最长距离法和最短距离法对这5个地 块进行聚类分析,要求分为两类。 块进行聚类分析,要求分为两类。
地块 质地 有机质 含量 A 8 5 B 3 7 C 6 4 D 6 9 E 4 7
聚类分析法
Cluster Analysis
聚类分析
将具有相似(similarity)性质(或距离) 性质(或距离) 将具有相似 性质 的个体(样本)聚为一类, 的个体(样本)聚为一类,具有不同性 质的个体聚为不同的类。 质的个体聚为不同的类。 方法包括: 方法包括:
系统聚类法 非系统聚类法 分解法 模糊聚类等
基本思想
个样品各自看成一类, 将n个样品各自看成一类,并规定样品与 个样品各自看成一类 样品之间的距离和类与类之间的距离; 样品之间的距离和类与类之间的距离; 在所有的类中, 在所有的类中,选择距离最小的一对合 并成一个新类, 并成一个新类,并计算出所得新类和其 他各类的距离; 他各类的距离; 重复2,直至将所有的样品都合并成一类; 重复 ,直至将所有的样品都合并成一类; 绘制聚类谱系图 。
最长距离法
最长距离法对类之间距离的定义与最短 距离法正好相反, 距离法正好相反,类与类之间的距离为 他们之间两个最远样品之间的距离。 他们之间两个最远样品之间的距离。并 类步骤与最短距离法完全一样。 类步骤与最短距离法完全一样。
D (0)
0 =
0 .34 0
1 .37 1 .03 0
D(2)
0 =
1 0
1 .33 0 .67 0
D(3)
0 =
1 0
(6)将聚类过程作出聚类谱系图,根据 )将聚类过程作出聚类谱系图, 谱系图进行分类。 谱系图进行分类。
G1 G2 G3 G4 G5 0.2 0.4 0.6 0.8 1.0 聚类距离
1 0 0.33
2 0 0.67
3 0.70 1
4 1 0.67
5 1 0
(2)计算样品的距离。 计算样品的距离。 计算样品的距离
d ij = x i − x j + y i − y j
G1 D( 0 ) = G2 G3 G4 G5
G1 G2 G3 G4 0 0.34 1.37 1.34 0 1.03 1 0 0.63 0
D( 2)
0 1 .37 = 0
1 .67 1 .30 0
D(3)
0 1 .67 = 0
G1 G2 G3 G4 G5 0.4 0.8 1.2 1.6 2.0
聚类距离
G1 G2 G3 G4 G5 0.2
G1 G2 G3 G4 G5 0.4 0.8 1.2 1.6 2.0 聚类距离
最短距离法
把一个类的所有样品与另一个类的所有 样品的两两样品之间的最短距离找出来, 样品的两两样品之间的最短距离找出来, 并将其定义为两个类之间的距离。 并将其定义为两个类之间的距离。
推销员 1 2 3 4 5
推销能力 1.2 1.2 7.1 9.6 9.6
教育程度 1.2 2.4 3.6 2.4 0
(1)数据变换处理。 数据变换处理。 数据变换处理
′ xij
{ } = , i = 1,2, L , n; j = 1,2, L , p max {x }− min {x }
xij − min xij
1≤ i ≤ n ij 1≤ i ≤ n 1≤ i ≤ n ij
推销 员 推销 能力 教育 程度
D64 = min (d 14 , d 24 ) = 1
D65 = min(d15 , d 25 ) = 1.33
D(1)
G6 = G3 G4 G5
G6 G3 G4 1 0 1.03 0 0.63 0
G5 1.33 1.30 0.67 0
5)重复以上步骤,直到所有样品都成一 )重复以上步骤, 类为止。 类为止。
1 .34 1 0 .63 0
1 .33 1 .67 1 .3 0 .67 0
D63 = max(d13 , d 23 ) = 1.37
D64 = max(d14 , d 24 ) = 1.34
D64 = max(d14 , d 24 ) = 1.67
D(1)
0 1.37 1.34 1.67 0 0.63 1.30 = 0 0.67 0
G5 1.33 1.67 1 .3 0.67 0
(3)找出 (0)非对角线上的最小元素, 找出D 非对角线上的最小元素, 找出 将其对应的两个类合并为一个新类。 将其对应的两个类合并为一个新类。
(4)计算新类与其它类的距离 计算新类与其它类的距离 计算新类
D63 = min(d 13 , d 23 ) = 1.03
相关主题