当前位置:文档之家› 专题地图编制第六讲第三章

专题地图编制第六讲第三章


2. 系统聚类方法
系统聚类法是应用最多的一种聚类方法,聚类的依据是把相似 的样本归为一类,把差异大的样本区别开来,成为不同的类。样本 之间的相似性和差异性统计量有多种定义方法。它是一种定量方法, 这种方法的基本思想是:先将几个样本(或指标)各自为一类,计 算它们之间的距离,选择距离小的两个样本归为一类,计算新类和 其它样本的距离,选择距离最小的两个样本或新类归为另一个新类, 每次合并缩小一个类,直到所有样本划为一个类(或所需分类的数 目)为止。类与类之间的距离可以有许多定义,广泛应用的计算方 法是最短距离法。 最短距离法 最短距离法的基本思想是: 首先将所有各样本均作为一个独立 类别,看哪两个样本的距离最接近,先将其合并得出新类,再求新 类与其它类之间的距离值,然后逐步地合并成需要的几个类。 除了常用的最短距离法外,还有其它的系统聚类方法,如最长距 离法、中间距离法、重心法、类平均法、可变类平均法、可变法和 离差平方和法。
温度就是一个典型的例子,某地气温为20 º,另一地气温为 40º ,两地温差为20º,但这并不意味两地气温相差一倍。分级数 据其数值的零点设置具有随意性,人们关心的是事物间的间隔, 而不是绝对数值。使用分级数据必须统一数值的单位,如城市人 口状况按人口密度分级,<100,100—500,500—1000,≥1000, 单位统一为人/平方公里。农业生产水平按总产值(万元)分为 <1000,1000—5000,5000—10000, ≥10000等。 以上两种类型的数据对事物量的描述逐渐增强。在专题制图时, 可以把完全定量数据处理成分级数据或定性数据,而定性数据不 能转化为定量数据。分级数据也不能转化为完全定量化数据。定 性数据表达事物的质量差异和等级感,分级数据和完全定量化数 据表达事物的数量差异,完全定量化数据比分级数据更加精确地 描述事物的数量特征。 完全定量数据 分级数据 定性数据
§3.3 数据的分类处理 专题地图的数据处理 : 1、数据的分类处理 2、数据的分级处理 3、数量指标的改变 一.基本原则 1、自然要素的分类是相应学科的任务,但是由于制 图表象的特殊性,还存在着适宜于制图表达的制图分类 方法。学科分类与制图分类并不总是一致的,学科分类 是基础,制图分类是在符合于学科分类原则下的具体应 用。
二.定量数据
定量数据包括两种类型,完全定量化数据和分级数据。定 量数据对应于量表系统的间隔量表和比率量表。 完全定量化数据:可完整地定量化描述物体,它不但有计量 单位,而且有起始点,可描述物体的绝对量。完全定量数据 除了具有分级数据描述事物差异的能力外,还可以明确描述 事物间的比率关系。完全定量数据的零点不能随意设定,它 具有重要的物理意义,亦即“无”,完全定量化数据描述物 体有“有”与“无”的概念,并具有可加性。如A县的国内生 产总值为18亿元,B县的国内生产总值为12亿元,则A、B两县 的国内生产总值为30亿元。 分级数据: 不仅可以描述事物的等级和次序而且可以定量 地描述事物间差异的大小。有人称这种差异为“距离”。分 级数据反映事物的相对关系,而不是绝对关系。当两事物的 距离为零时,两事物是相同的,否则是相异的。距离越大其 差异也越大。分级数据以数值来描述事物,但当数值为零时, 并不意味着“没有”。
三. 统计数据和数字资料 统计数据和其它数字资料对于许多专题地图有着特别 的意义。包括社会经济数据、人口普查数据、野外调查、 监测和观测数据。如全国国民生产总值统计数据、气象 观测数据、环境污染监测数据等。 除了传统的统计表格形式外,已建立起各种专题的电 子表格、数据库,数据的建立、传输和汇总可以在计算 机上实现。 四. 文字报告和图片 文字报告主要包括科学论文、科研报告、资料说明以 及与专题内容相关的文章。文字报告和图片有时直接构 成专题地图的内容。
§3.3 数据的分级处理
专题数据中的定量数据大多是呈离散分布的,但原始 的数据并不能直观地反映现象在空间分布上的规律性、由 于数量差异而产生的质量差异感、特殊的水平或集群性。 因此对原始数据进行统计分析后建立分级模型十分必要。 如何用恰当的方法使分级后的数据能够客观反映现象分布 的地理规律性并满足专题制图的要求是数据分级处理的主 要任务。统计地图中最常见的分级统计图法,所表示的就 是分级数据。在分区统计图表中,也常常出现分级数据。 分级的最重要的任务是找出关键的临界值,以增强同一级 别区域间的同质性和各级之间的差异性。
人文要素也有分类问题,如居民点的类型,不同的 工业企业类型,科技、文教的不同门类,农业各专业化 区域等等。三角形图表法就是根据多维指标进行组合分 类的一种简便方法。 二、数据的分类方法 主要有: 判别分析方法 系统聚类方法 动态聚类方法 模糊聚类法。
1. 判别分析方法 .
基本原理:根据已掌握的和历史上每个类别的若干样本的数 据信息,总结出客观事物分类的规律性,建立判别公式和判别准 则,判别该样本所属的类型。判别分析必须事先知道各种判别的 类型和数目,并要有一批来自各类的样品,才能建立判别函数对 未知属性的样品判别和归类。例如,在评价产品的市场竞争力时, 可根据产品的多项指标(如其内在质量、外型美观以及包装、价 格等)判别消费者对商品喜欢或不喜欢。判别分析依其判别类型 的多少与方法的不同,可分为两总体判别、多总体判别和逐步判 别等。 步骤:首先根据已知的特征值进行线性组合,构成一个线性 判别函数 ;为了使判别函数能充分地反映出、两种类型的类别, 就要使两类之间的均值差与各类内部的离差平方和的比值达到最 大,从而能将两类清楚地分开。判别函数求出以后,还需要计算 出判别临界值,然后进行归类。
二. 遥感数据
遥感数据是编制专题地图重要的数据源。从卫星或飞机上获 取的图像信息主要有胶片和数字磁带两种记录形式。胶片是一种 模拟信号,必需通过A/D转换装置将模拟量转换为数字量后才能送 入计算机内进行存贮和分析。数字磁带是一种数字图像记录,简 称CCT。用户得到CCT磁带后可以根据磁带密度要求将数据读入计 算机,然后通过图像处理系统的监视器显示图像,供用户分析。 遥感数据具有覆盖面积大、同步性、时效性、综合性和可比性等 特点,因此利用遥感数据编制专题地图越来越成为一种重要的手 段和方法。航空像片具有比例尺大、碎部详细、可进行立体观察 和测量等优点。遥感数据用于专题制图主要有: 1、 经过目视解译和计算机自动识别,从遥感图像中提取所 需的专题信息,如土地利用分类、森林类型、地质类型等数据, 作为专题地图专题内容的基本资料。 2、 编制专题影像地图,专题影像地图是在遥感影像中突出 而完备地表示一种或几种自然要素或社会经济要素,如土地利用 影像地图、植被类型影像地图等。
第三章 专题制图要素的数据类型与数据处理
地图数据 :说明性数据(如图名、图例、文字说明) 地理数据(定位数据、属性数据、时间数据) 属性数据:是非定位数据、描述数据或语义数据,是对地图要 素质量特征和数量特征的描述。 §3.1 专题制图要素的数据类型 属性数据的形式:数字、文字、图形、图像、语言等。 地理变量:是对地理现象的定性描述或定量描述。地理变量按 精确程度基于量表系统分为定名量表、顺序量表、间隔量表、比 率量表。在制图时需对这些地理变量进行分类、处理才能变成地 理数据。属性数据用于专题制图时,可根据其对现象描述的精确 程度分为定性数据和定量数据。
点状符号
定 名 量 表
线状符号
面状符号
医院 停车场
河流 道路
顺 序 量 表
道 道 路 路
间 隔 量 表


比 率 量 表


§3.2 数据源及数据获取 编制专题地图的数据收集和整理是一项十分重要的 基础工作,准确实时的数据是编制专题地图的前提条 件。从专题制图的角度考虑,其数据源主要有以下几 类: 一. 地图数据 地图数据是编制专题地图主要的数据来源,包括各 种比例尺的普通地图和专题地图 。普通地图用于编制 专题地图的地理基础底图和某些专题要素 。各种比例 尺的专题地图,提供地质、地貌、土壤、植被和土地 利用等图种的原始资料。此外,中小比例尺的专题地 图也可作为编制其它专题地图的补充资料 。 地图数据形式:纸质地图、电子地图、数字地图或 GIS中地理数据库数据。
4. 模糊聚类法
客观事物有两种,一种是定性的,一种是不定性的,经典数 学讨论的都是定性问题,而概率论是研究不定性问题,但概率论 研究的对象本身是确定的。有的事物本身就是不确定的,如地形 复杂,土壤肥沃等。美国数学家L . A .Zadeh于1965年提出模糊 理论(fuzzy theory)。该理论认为,在是与非之间存在中间状 态,不确定性事物的归属度可以用概率方式表示出它的模糊性及 不确定性。模糊数学在地图制图中广阔的应用前景。例如,在数 据处理,要素或区域聚类,制图综合方法,遥感图像识别以及地 图的分析评价等方面可广泛应用。
自然要素的分类标志主要是按要素的发生、发育状 况或某些条件下的发生学进行分类,这种分类方法具有 科学的和实用的价值,如地貌按在内外力作用下的成因 并结合形态进行分类;气候按大气环流形成的过程分类; 土壤按土壤发生发育过程的规律分类;植被按其在外界 生存条件的密切影响下,经过漫长的发展过程而形成特 殊的组合分类。除了这些分类标志外,还有按要素的某 些基本特征分类的,如地貌按形态的组合,气候按特征 的综合,土壤按粒度分析和矿物质组成进行分类。 综上所述,选用什么分类原则与地图用途有关,而 分类的详细性则要顾及到地图比例尺的可能和制图区域 的特点(同时也涉及到用图的要求),并且分类也影响 到制图综合的复杂程度。
一. 定性数据 只描述现象的固有特征或相对等级、次序,即描述现 象的定性特征而不涉及定量特征的数据。如在地图上表达 物体的分布、状态、性质、大小、主次等的数据。这类数 据没有量的概念。如人口按民族可分为汉、回、满、维等, 农作物分为粮食作物、经济作物、油料作物等,陆地地貌 按外表形态可分为山地、高原、丘陵、平原、盆地等,城 市按规模分为大城市、中等城市、小城市。定性数据蕴涵 着事物的分类系统,而且绝大多数的分类系统都是一个层 次结构,因此,定性数据不仅表达事物的同与异,而且可 反映事物在分类树中所处的相对位置。当定性数据表示事 物的等级和次序时,稍具有“量”的色彩,可将事物以一 定的次序排列起来,虽不可进行数值运算但可进行统计分 析。定性数据对应于量表系统的定名量表和顺序量表。
相关主题