第3章矢量数据与栅格数据的获取及处理导读:GIS项目中费用最大的部分是数据库建设,即基础地理信息的获取与处理,这其中就包括矢量数据和栅格数据的获取与处理,例如遥感影像数据现已作为地理信息系统的重要数据来源。
本章分别介绍了矢量数据的获取与处理以及栅格数据的获取与处理,以及他们的应用。
并在最后一节介绍了矢栅一体化数据结构的基本概念。
3.1矢量数据的获取与处理方法3.1.1矢量数据的概念矢量数据(Vector Data)即在直角坐标系中,用X、Y坐标表示地图图形或地理实体的位置的数据。
矢量数据一般通过记录坐标的方式来尽可能将地理实体的空间位置表现的准确无误。
在计算机地图制图中,各地图图形元素在二维平面上的矢量数据表示为:点——用一对(x,y)坐标表示;线——用一串有序的(x,y)坐标对表示;面——用一串有序的但首尾坐标相同的(x,y)坐标对表示其轮廓范围。
地图数据与其他大多数由计算机处理的科学数据是极其不同的。
大部分地图数据都是反映制图现象的地理分布,故具有定位的性质,也称这类地图数据为空间数据(或几何数据)。
空间数据可反映点、线和面状物体的定位特性。
还有一部分地图数据是用来描述制图现象的质量和数量特征,如哪是河流,哪是道路,哪是居民点以及它们的名称和其他有关的特征描述等,这类数据通常称之为属性数据。
任何地图数据都有时间性,即现势性,这是显而易见的。
3.1.2几何数据的获取几何数据是根据给定各要素相对位置或绝对位置的坐标来描述的。
其获取的方法主要有:1)由外业测量获得,如数字测图。
野外实地测量等获取的数据可转换后直接进入GIS的地理数据库,以便于进行实时的分析和进一步的应用。
GPS所获取的数据也是GIS的重要数据源。
2)由栅格形式的空间数据转换获得。
栅格数据结构向矢量数据结构的转换又称为矢量化。
如卫星测地、扫描数字化仪扫描、航摄像片等。
可以用此类数据转化为矢量数据。
基于图像数据的矢量化方法:①二值化:线画图形扫描后产生图像栅格数据,这些数据是按0~255的不同灰度值量度的,将这种256级不同的灰度压缩到2个灰度形成二值图,即0和1两级灰度图。
②细化:细化是消除线画横断面栅格数的差异,使得每一条线只保留代表其轴线或周围轮廓线位置的单个栅格的宽度。
对于栅格线画的细化方法,可分为“剥皮法”和“骨架法”。
③跟踪:跟踪的目的是将细化处理后的栅格数据转化为从节点出发的线段或闭合的线条,并以矢量形式存储线段的坐标。
跟踪时,从起始点开始,根据八个邻域进行搜索下一个相邻点的位置,记录坐标,直到完成全部栅格数据的矢量化。
3)对现有地图跟踪数字化获得,将现有的地图图形离散化为数据。
跟踪数字化是目前应用最广泛的一种地图数字化方式,是通过记录数字化板上点的平面坐标来获取矢量数据的。
其基本过程是:将需数字化的图件(地图、航片等)固定在数字化板上,然后设定数字化范围、输入有关参数、设置特征码清单、选择数字化方式(点方式和流方式等),就可以按地图要素的类别分别实施图形数字化了。
由于跟踪数字化本身几乎不需要GIS的其它计算功能,所以跟踪数字化软件往往可以与整个GIS系统脱离开,因而可单独使用。
图3.1 手扶跟踪数字化仪示意图3.1.3属性数据的获取1)特征码地图要素是根据各自的位置和属性说明进行编码的,仅有描述空间位置的几何数据是不够的,还必须有描述它们的属性说明。
其中用来描述要素类别、级别等分类特征和其他质量特征的数字编码叫特征码,它是地图要素属性数据的主要部分。
其作用是反映地图要素的分类分级系统,同时也便于按特定的内容提取、合并和更新,因此特征码表的编制应根据原图内容和新编图的要求设计。
一般地,对地图要素进行分类编码时应遵循以下原则:①科学性和系统性,即以适合计算机和数据库技术应用和管理为目标,按国土基础信息的属性或特征进行严格的科学分类,形成系统的分类体系;②相对稳定性,即分类体系以各种地图要素最稳定的属性或特征为基础,能在较长时间里不发生重大变更;③不受地图比例尺的限制,即同一地图要素在不同比例尺的地图数据库中有一致的分类代码,虽然分类不一定与多种比例尺地形图一一对应,但分类码要覆盖各种比例尺的地图符号,即每类地图符号都应具有相应的代码;④完整性和可扩充性,即要素的分类既要反映其属性,又要反映其相互联系,具有完整性;代码结构应留有适当的可扩充的余地,具有可扩充性;⑤与国家已颁布的有关规范和标准一致,即直接引用或参照相关的国家规范和标准;⑥适用性,即特征码(或属性编码)尽可能地简短和便于记忆。
依据上述原则,以国土基础信息为例,其编码可分为大类,并依次再分为小类、一级和二级。
分类代码由6位数字组成,其结构如下:地图要素分类编码举例见表3.1。
表3.1 地图要素分类编码特征码制图要素名称6 境界61000 行政区划界61010 国界61011 界桩、界碑61012 同号双立界碑61013 同号三立界桩、界碑61020 未定国界……7 地形与地质71000 等高线71010 实测等高线71020 草绘等高线72000 高程72010 高程点72020 特殊高程点2)特征码的输入用键盘输入,特征码同几何数据一起存入地图数据库。
事先设置好清单,在获取几何数据时,选择特征码。
在GIS中,选择对象,弹出一个属性数据框,输入各类的属性数据。
3.1.4数据处理数据处理是计算机地图制图过程中的一个重要环节,包括对制图数据的存储、选取、分析、加工、输出等操作,以完成地图制作过程中的几何改正、比例尺和投影变换、要素的制图综合、数据的符号化等。
1)矢量数据的基本操作矢量数据的处理,一般有两种方式,一是按人机交互方式进行处理;二是按批处理方式进行处理。
另外,也可将这两种方式结合起来进行。
矢量数据处理过程可分解为八种基本运算操作,即存取、插入、删除、搜索、分类、复制、归并和分隔。
存取,又叫访问,是指与内存打交道(如读/写)的操作。
它是图形显示、统计分析,或更复杂的分析和制图的基础。
从地图制图的角度来考虑,插入和删除主要是在编辑过程中用来修改和更新地图内容。
搜索在计算机地图制图作业执行过程中显得特别重要,例如在全要素地图数据库中寻找道路数据或某一级道路数据。
分类是重新组织内存中的点集或较大的地理实体,使之便于处理和标出对地图用户具有特定意义的某些分布的分级排列。
复制使得数据能被传输而使它更有价值。
归并能把低层次的数据集合到实用的地区或国家这些高级的范畴上来。
分隔则可以获得较小的数据集(例如开窗),以便对原有数据进行更详细或更直观的处理。
2)数据编辑数据编辑又叫数字化编辑,它是指对地图资料数字化后的数据进行编辑加工,其主要目的是在改正数据差错的同时,相应地改正数字化资料的图形中。
一般地,数据编辑工作分两步进行。
第一,显示数据,即在显示屏上显示或校核绘图显示,以便用目视的方法或与数字化原图套合比较的方法进行检查,找出数字化资料的差错,显示其出错位置。
第二,数字化定位和编辑修改。
编辑命令基本上只有两种指令类型:删除数据和增加数据。
常用到的命令,诸如“变更”、“移动”、“删除”、“加入”、“截去”、“延长”、“分割”、“合并”等指令,都是这两种基本指令的组合或其中之一。
3)数据的预处理数据的预处理主要内容包括几何改正、数据压缩、数据规范化和数据匹配。
(1)几何改正数据编辑处理一般只能消除或减少在数字化过程中因操作产生的局部误差或明显差错,但因图纸变形和数字化过程中产生的随机误差,则必须经过几何改正才能消除。
(2)数据压缩数据压缩是把大量的原始数据或由存储器取出来的数据转换为有用的、有条理的、精炼而简单的信息的过程,又称数据简化或数据综合。
目的是删除冗余数据,减少数据的存储量,节省存储空间,加快后继处理速度。
常用的数据存储方法有:①间隔取点法每隔k个点取一点,或舍去那些离已选点比规定距离更近的点,但首末点一定要保留,见图3.2。
图3.2 a 由上到下隔一点取一点b由上到下依次按距离临界值取值②垂距法和偏角法这两种方法是按垂距或偏角的限差选取符合或超过限差的点,其过程见图3.3。
③道格拉斯-普克法该方法试图保持曲线走向并且允许制图人员规定合理的限差,其执行过程见图3.4。
步骤为:a首未相连;b 计算中间各点到直线的距离;c 删去距离小于临界值的点;d 在留下的点中,选择距离最大的点,将曲线分成两段;e 重复①~④,依次类推。
3)数据规范化从事地图数据采集和应用的部门日益增多,为了协调数字化地图的生产和提高数据的共享程度,地图数据规范化的工作引起了许多国家的重视,是国际地图制图协会的重要研究方向之一。
(1)定义规范该部分使用零维、一维和二维数据,系统地、广泛地定义一组基本的、单一的制图目标,它们包括:单纯的几何目标;单纯的拓扑目标,几何和拓扑目标。
并以此来建立地图要素的数字表示法。
其规定了本标准中使用的主要概念性术语:要素、实体和目标。
要素是指一个确定的实体及其目标的表示;实体是描述地球上一种不能再细分的真实的现象;目标是一个实体的全部或部分的数据表示。
图3.3垂距法和偏角法图3.4道格拉斯-普克法(2)空间数据转换规范制定该规范的目的是方便空间数据从一个空间数据处理系统向另一个空间数据处理系统转换,而与它们使用的计算机硬件和操作系统无关。
内容包括各种转换模块;每个模块包含一组模块记录;每个模块记录包括若干个数据字段,它们按信息的目的和功能分组;数据字段包含要转换的信息。
这些模块可完成矢量转换、关系转换和栅格转换等。
(3)数字制图数据质量控制规范,每幅数字地图都必须有一份质量报告,其内容包括数据情况略图、位置精度、属性精度、逻辑一致性和完整性等五个部分。
(4)制图要素规范这一部分包括说明制图要素的概念模型和一份实体及属性定义表。
概念模型定义了三个概念和两个辅助项,它们分别是实体、属性、属性值、标准项和内含项。
4)数据匹配数据匹配是实现误差纠正的又一种方法,是数据处理的一个重要方面.(1)顶点匹配。
在数字化多边形地图和其它网结构图形时,同一点(如几个多边形的公共顶点)可能被数字化好几次,即使在数字化时很仔细,但由于仪器本身的精度和操作问题,都不能保证几次数字化都获得同样的坐标值。
为此在数据处理时,需将它们的重心重新安放,这就是“顶点匹配”(或称结点匹配)。
该方法是用匹配程序对多边形文件进行处理,即让程序按规定搜索位于一定范围内的点,求其坐标的平均值,并以这个平均值取代原来点的坐标。
经处理后,在多边形生成时若再发现少数顶点不匹配,经查明原因后可辅以交互编辑的方法处理。
(2)数字接边在数字化地图时,一般是一幅一幅地进行,受数字化仪幅面的限制,有时一幅图还需分块进行,见图3.5(1)。
由于纸张的伸缩或操作误差,相邻图幅公共图廓线(或分块线)两侧本应相互连接的地图要素会发生错位,见图3.5(2),这是不可避免的。