当前位置:文档之家› 计量地理学第7章系统聚类分析ppt课件

计量地理学第7章系统聚类分析ppt课件


本章重点讨论系统聚类分析方法及其在 地理学中的应用问题。
第一节 聚类要素的数据处理
在聚类分析中,聚类要素的选择是十分重要 的,它直接影响分类结果的准确性和可靠性。
在地理分类和分区研究中,聚类对象常常是 多个要素构成的。不同要素的数据往往具有不同 的单位和量纲,其数值的变异可能是很大的,这 就会对分类结果产生影响。因此,在进行聚类分 析之前,首先要对聚类要素进行数据处理。
假设有m 个聚类的对象,每一个聚类对象
都有n个要素构成。它们所对应的要素数据可
用下表给出。
聚类对象与要素数据
聚类对象
1 2 i m


x1 x2 xj xn
x11 x12 x1 j x1n
x21 x22 x2 j x2n
x i1 x i 2 x ij x in
x m1 x m 2 x mj x mn
xj m 1im 1xij0
sj m 1im 1(xijxj)21
③ 极大值标准化,即
x i j m ix { ix jia } j x (i 1 ,2 , ,m ;j 1 ,2 , ,n ()3.4.3)
经过这种标准化所得的新数据,各要素的 极大值为1,其余各数值小于1。
④极差标准化,即
聚类分析是根据变量(或样品或指标) 的属性 或特征的相似性或亲疏程度,用数学方法把他 们逐步地分型划类, 最后得到一个能反映样品 之间或指标之间亲疏关系的客观的分类系统, 样品或指标逐步归并最后可形成分类系统图, 即系统聚类图。
聚类分析的作用? 近十年来,聚类分析发展很快,在地质
勘探、天气预报、生物分类、考古学、 医学、心理学以及制定国家标准等许多 方面都取得了许多很有成效的应用。
经过这种标准化所得的新数据,各要素的 极大值为1,极小值为0,其余的数值均在0与1 之间。
x ij m ix ix jim j a im i x x ix jiiji nn ( i 1 ,2 , ,m ;j 1 ,2 , ,n )
一个例子
某地区9个农业区的7项经济指标原始数据

人均
劳均

5.63
0.39 5.28 0.39 72.04 43.78 65.15 5.35 2.9
复种 指数
x4 /%
粮食 单产x5
· /(kg hm -2

113.6 4 510.5
95.1 148.5 111 217.8 179.6 194.7 94.9 94.8
2 773.5 6 934.5 4 458 12 249 8 973 10 689 3 679.5 4 231.5
耕地X1
耕地X2
· · 号 /(hm2 人-1) /(hm2 个-1 )
水田 比重 X3 /%
G1 0.294
G2 0.315 G3 0.123 G4 0.179 G5 0.081 G6 0.082 G7 0.075 G8 0.293 G9 0.167
1.093
0.971 0.316 0.527 0.212 0.211 0.181 0.666 0.414
1.093
0.971 0.316 0.527 0.212 0.211 0.181 0.666 0.414
5.63
0.39 5.28 0.39 72.04 43.78 65.15 5.35 2.9
聚类对象
复种 指数
x4 /%
113.6
粮食 单产x5
· /(kg hm -2

4 510.5
人均粮食x6
· /(kg 人-1 )
第七章 系统聚类分析
第七章 系统聚类分析模型
第一节 聚类要素的数据处理 第二节 距离的计算 第三节 直接聚类法 第四节 最短距离聚类法 第五节 最远距离聚类法
什么是聚类分析?
聚类分析(Cluster Analysis)是研究“物以类 聚”的一种方法,国内有人称它为群分析、点 群分析、簇群分析等,是研究分类问题的一种 多元统计方法。
复种
粮食
人均粮食 稻谷占粮食比
人均粮食x6
· /(kg 人-1 )
1 036.4
稻谷 占粮 食比 重 x7/%
12.2
683.7 611.1 632.6 791.1 636.5 634.3 771.7 574.6
0.85 6.49 0.92 80.38 48.17 80.17 7.8 1.17
极差标准化处理后的数据

人均
劳均

据的总和,即
xijm xij
(i1,2,,m ;j1,2,,n)
xij
i1
这种标准化方法所得到的新数据满足
m
xij 1 (j 1,2,,n)
i1
② 标准差标准化,即
x ijx is j jxj (i 1 ,2 , ,m ;j 1 ,2 , ,n ) 由这种标准化方法所得到的新数据,各要素的平
均值为0,标准差为1,即有
在地理学研究方面,聚类分析是定量研 究地理事物分类问题和地理分区问题的 重要方法之一。
聚类分析有哪些方法?
聚类分析方法包括系统聚类法、分解法、 加入法、动态聚类法、有序样品聚类、 有重叠聚类法和模糊聚类法等。采用k均值、k-中心点等算法的聚类分析工具 已被加入到许多著名的统计分析软件包 中,如SPSS、SAS等。
0.85 6.49 0.92 80.38 48.17 80.17 7.8
94.8 4 231.5
574.6
ห้องสมุดไป่ตู้
1.17
要素数据
在聚类分析中,常用的聚类要素的 数据处理方法有如下几种:
①总和标准化。 ② 标准差标准化。 ③ 极大值标准化。 ④ 极差标准化。
①总和标准化。分别求出各聚类要素所对应的
数据的总和,以各要素的数据除以该要素的数
例如 9个农业区的7项经济指标原始数据
聚类要素

人均
劳均

耕地X1
耕地X2
· · 号 /(hm2 人-1) /(hm2 个-1 )
水田 比重 X3 /%
G1 0.294
G2 0.315 G3 0.123 G4 0.179 G5 0.081 G6 0.082 G7 0.075 G8 0.293 G9 0.167
1 036.4
稻谷 占粮 食比 重 x7/%
12.2
95.1 148.5 111 217.8 179.6 194.7 94.9
2 773.5 6 934.5 4 458 12 249 8 973 10 689 3 679.5
683.7 611.1 632.6 791.1 636.5 634.3 771.7
相关主题