当前位置:
文档之家› 计量地理学第7章系统聚类分析.
计量地理学第7章系统聚类分析.
区 代 号 人均 耕地X1 /(hm2 人-1) 劳均 耕地X2 /(hm2 个-1 ) 1.093 0.971 0.316 0.527 0.212 0.211 0.181 0.666 水田 比重 X3 /% 5.63 0.39 5.28 0.39 72.04 43.78 65.15 5.35 复种 指数 x4 /% 113.6 95.1 148.5 111 217.8 179.6 194.7 94.9 粮食 单产x5 /(kg hm -2 ) 4 510.5 2 773.5 6 934.5 4 458 12 249 8 973 10 689 3 679.5
i i
一个例子
某地区9个农业区的7项经济指标原始数据
区 代 号 人均 耕地X1 /(hm2 人-1) 劳均 耕地X2 /(hm2 个-1 ) 水田 比重 X3 /% 复种 指数 x4 /% 粮食 单产x5 /(kg hm -2 ) 人均粮食x6 /(kg 人-1
·
·
·
·
稻谷 占粮 ) 食比 重 x7/%
第七章 系统聚类分析
第七章 系统聚类分析模型
第一节 第二节 第三节 第四节 第五节 聚类要素的数据处理 距离的计算 直接聚类法 最短距离聚类法 最远距离聚类法
什么是聚类分析? 聚类分析(Cluster Analysis)是研究“物以类
聚”的一种方法,国内有人称它为群分析、点 群分析、簇群分析等,是研究分类问题的一种 多元统计方法。 聚类分析是根据变量(或样品或指标) 的属性 或特征的相似性或亲疏程度,用数学方法把他 们逐步地分型划类, 最后得到一个能反映样品 之间或指标之间亲疏关系的客观的分类系统, 样品或指标逐步归并最后可形成分类系统图, 即系统聚类图。
聚类要素
人均粮食x6 /(kg 人-1 稻谷 占粮 ) 食比 重 x7/% 12.2 0.85 6.49 0.92 80.38 48.17 80.17 7.8
·
·
·
·
G1 0.294 G2 0.315 G3 0.123 G4 0.179 G5 0.081 G6 0.082 G7 0.075 G8 0.293
0.527
0.212 0.211 0.181
0.39
72.04 43.78 65.15
111
217.8 179.6 194.7
4 458
12 249 8 973 10 689
632.6
791.1 636.5 634.3
0.92
80.38 48.17 80.17
② 标准差标准化,即
xij xij x j sj (i 1,2,, m; j 1,2,, n)
由这种标准化方法所得到的新数据,各要素的平 均值为0,标准差为1,即有
1 m 0 x j xij m i 1 1 m x j ) 2 1 sj ( xij m i 1
1 036.4 683.7 611.1 632.6 791.1 636.5 634.3 771.7
G9 0.167
0.414
2.9
94.8
4 231.5
574.6
1.17
要素数据 聚类对象
在聚类分析中,常用的聚类要素的 数据处理方法有如下几种: ①总和标准化。 ② 标准差标准化。
③ 极大值标准化。
加入法、动态聚类法、有序样品聚类、 有重叠聚类法和模糊聚类法等。采用k均值、k-中心点等算法的聚类分析工具 已被加入到许多著名的统计分析软件包 中,如SPSS、SAS等。
本章重点讨论系统聚类分析方法及其在
地理学中的应用问题。
第一节 聚类要素的数据处理
在聚类分析中,聚类要素的选择是十分重要 的,它直接影响分类结果的准确性和可靠性。
聚类对象与要素数据
要 聚 类 对 象 素
x1
x11 x21 xi1 xm1
x2 x j xn
x12 x22 xi 2 x1 j xij x1n xin xmn x 2 j x2 n
1 2 i m
xm 2 xmj
例如 9个农业区的7项经济指标原始数据
聚类分析的作用? 近十年来,聚类分析发展很快,在地质 勘探、天气预报、生物分类、考古学、 医学、心理学以及制定国家标准等许多 方面都取得了许多很有成效的应用。 在地理学研究方面,聚类分析是定量研 究地理事物分类问题和地理分区问题的 重要方法之一。
聚类分析有哪些方法?
聚类分析方法包括系统聚类法、分解法、
在地理分类和分区研究中,聚类对象常常是 多个要素构成的。不同要素的数据往往具有不同 的单位和量纲,其数值的变异可能是很大的,这 就会对分类结果产生影响。因此,在进行聚类分 析之前,首先要对聚类要素进行数据处理。
假设有m 个聚类的对象,每一个聚类对象 都有n个要素构成。它们所对应的要素数据可 用下表给出。
③ 极大值标准化,即
xij xij max{xij }
i
(i 1,2, , m; j 1,2,, n)
(3.4.3)
经过这种标准化所得的新数据,各要素的 极大值为1,其余各数值小于1。
④极差标准化,即 经过这种标准化所得的新数据,各要素的 极大值为1,极小值为0,其余的数值均在0与1 之间。 xij minxij i xij (i 1,2,, m; j 1,2,, n) maxxij minxij
G1 0.294
G2 0.315 G3 0.123
1.093
0.971 0.316
5.63
0.39 5.28
113.6
95.1 148.5
4 510.5
2 773.5 6 934.5
1 036.4
683.7 611.1
12.2
0.85 6.49
G4 0.179
G5 0.081 G6 0.082 G7 0.075
④ 极差标准化。
①总和标准化。分别求出各聚类要素所对应的 数据的总和,以各要素的数据除以该要素的数 据的总和,即 xij xij源自xi 1m
(i 1,2,, m; j 1,2,, n)
ij
这种标准化方法所得到的新数据满足
x
i 1
m
ij
1
( j 1,2, , n)