当前位置:文档之家› 空间数据质量在GIS中的影响

空间数据质量在GIS中的影响

地理信息系统(GIS)的基础是空间数据,空间数据的核心是质量,空间数据的生产与质量控制是一个相互作用的过程,生产数据是为了应用,而数据质量是一个关系到数据可靠性和系统可靠性的重要问题。

随着数据质量在建设数字地球、进行矿产预测的计算机模拟中发挥着越来越重要的作用,但如果空间数据的质量及其精度未能引起足够的重视,由这些空间数据进行重新运算和组合产生的空间数据就不是最终需要的结果,可能导致最终决策错误。

要提高空间数据的质量,减小空间数据误差,就要对空间数据误差产生和扩散的所有过程和环节进行控制。

在数据采集时对元数据进行跟踪,采取相应的措施提高数据质量。

以地图数字化为例,对纸质地图进行数字化前应对其进行校正或配准,选用精度比较高的数字化仪和扫描仪提高栅格数据的精度等;根据空间数据质量评价的标准还应制定相应的细则来提高数据质量;对采集和处理空间数据人员进行岗前培训等也都能减小误差的传播。

1 GIS 空间数据质量控制研究现状GIS 空间数据的质量优劣直接影响着GIS应用中分析结果的可靠程度及应用的真正实现,也影响着GIS产业的健康发展。

因此,近年来国内外越来越关注GIS数据的精度和质量控制的研究。

GIS数据的质量控制问题涉及面很广,包括数据质量的衡量标准、表示方法,数据误差的来源和性质,评价方法和控制方法及相关政策等。

如政府部门积极制定法规保障数据质量;将数据作为产品,采用管理产品质量的方法管理数据质量;数据质量的教育、培训与咨询;初步形成了地理数据质量的系列国际标准,如ISO 19100系列标准中地理信息质量标准;方法上,主要成果和结论,包括直线不确定性模型的改进、曲线不确定性模型的建立;将平差理论引入GIS数据误差处理和质量控制,并提出了实用方法;对GIS 数字化误差的性质、分布进行了深入研究;从抽样检验的理论出发,探讨了GIS 产品的质量控制技术和方法。

2 空间数据质量的概念2.1空间数据的质量空间数据是有关空间位臵、专题特征以及时间信息的符号记录,而数据质量是空间数据在表达这3个基本要素时所能达到的准确性、一致性、完整性以及它们三者之间统一性的程度。

由于现实世界的复杂性、模糊性以及人类认识和表达能力的局限性,空间数据在表达上不可能完全达到真值,只能在一定程度上接近真值。

用户根据需要对空间数据的处理也会导致出现一定的质量问题。

所以空间数据的误差产生于各种数据源及空间数据的输入和处理过程中。

2.2与空间数据质量相关的几个概念2.2.1误差(Error)反映了数据与真实值或公认的真值之间的差异,它是一种常用的数据准确性的表达方式。

2.2.2准确度(Accuracy)指结果值、计算值或估计值与真实值或公认的真值的接近程度。

2.2.3精密度(Resolution)表示数据的精密程度,亦即数据表示的有效位数。

它表现了测量值本身的离散程度。

2.2.4不确定性(Uncertainty)关于空间过程和特征不能被准确确定的程度,是自然界各种空间现象自身固有的属性。

在内容上,它是以真值为中心的一个范围,这个范围越大,数据的不确定性也越大。

2.2.5分辨率(Resolution)指最小的可分离单元或最小的可表达单元。

对栅格数据,指图像象元大小;对于矢量数据,指坐标点的密集程度。

2.2.6现势性(Modernistic)数据的现势性是指数据采集的时间,数据的更新时间等。

地理数据有些具有明确的时效特征,如土地利用测量数据,随地区的差异在时间上有明显的变化。

一般来说,具有动态特征的数据,它们的时间有效性较短,相反则长。

3 空间数据质量问题的来源从GIS中不同数据的表达形式到生成计算机可识别数据,从不同数据的处理变换到数据的应用,在这些过程中都会有数据质量问题的产生。

3.1现象自身存在的不稳定性空间现象自身存在的不稳定性包括空间特征和过程在空间、专题和时间内容上的不确定性。

空间现象在空间上的不确定性指其在空间位臵分布上的不确定性变化,如某种土壤类型边界划分的模糊性,某种土地利用类型边界变动的频繁性;空间现象在时间上的不确定性表现为其在发生时间段上的游移性;空间现象在属性上的不确定性表现为属性类型划分的多样性,非数值型属性值表达的精确性。

因此,空间数据存在质量问题是不可避免的。

3.2现象的表达数据采集、制图过程中采用的测量方法、量测精度的选择,人们对同一变量概念理解的不一致性以及对某一空间地理特征表达方式是否合理等,由于它们都受到人类自身的关于空间过程和特征的认知以及表达的影响,因此,通过它们生成的数据都有可能出现误差。

例如,在地图投影中,由椭球体到平面的投影转换必然产生误差;制图综合必然要综合掉一部分数据内容而使地图数据出现误差;在一些像土壤、地质、森林、地理等的学科中,许多概念还没有取得一致性的认识,即使是同一学科领域的专家,他们岁同一种具有空间特征的变量的认识也可能有很大差异,也必然导致数据测量误差的产生。

3.3空间数据处理中的误差在数据处理过程中,容易产生误差的几种情况:3.3.1投影变换地图投影是开口的三维地球椭球面或球面到二维平面的拓扑变换。

在不同的投影形式下,地理特征的位臵、面积和方向表现会有差异。

3.3.2地图数字化和扫描后的矢量化处理数字化过程采点的位臵精度、空间分辨率、属性赋值等都有可能出现误差。

3.3.3数据格式转换在矢量数据和栅格数据的格式转换中,数据所表达的空间特征的位臵具有差异性。

3.3.4数据抽象在数据发生比例尺变换时,对数据进行的聚类、归并、合并等操作时产生的误差,它包括知识性误差(例如,操作符合地学规律的程度)和数据所表达的空间特征位臵的变化误差。

3.3.5建立拓扑关系拓扑过程中伴随着数据所表达的空间特征的位臵坐标的变化。

3.3.6与主控数据层的匹配一个数据库中,常存存储同一地区的多层数据面,为了保证各数据层之间空间位臵的协调性,一般建立一个主控数据层以控制其他数据层的边界和控制点。

在与主控数据层匹配的过程中也会存在空间位移,导致误差的出现。

3.3.7数据叠加操作和更新数据在进行叠加运算以及数据更新时,会产生空间位臵和属性值的差异。

3.3.8数据集成处理指在来源不同、类型不同的各种数据集的相互操作过程中所产生的误差。

数据集成是包括数据预处理、数据集之间的相互运算、数据表达等过程在内的复杂过程,其中位臵误差、属性误差都会出现。

3.3.9数据处理过程中误差的传递和扩散在数据处理的各个过程中,误差是累积和扩散的,前一过程的累积误差可能成为下一阶段的误差起源,从而导致新的误差的产生。

3.4空间数据使用中的误差3.4.1对数据的解释过程对于同一种数据来说,不同用户对它的内容的解释和理解可能不同。

例如,对于土壤数据,城市开发部门、农业部门、环境部门对某一级别土壤类型内涵的理解和解释会有很大差异。

处理这类问题的方法是随空间数据提供各种相关的文档说明,如元数据。

3.4.2缺少文档缺少对某一地区不同来源的空间数据的说明,诸如缺少投影类型、数据定义等描述信息,这样往往导致数据用户对数据的随意性使用而使误差扩散开来。

4 空间数据质量控制数据质量控制是个复杂的过程,要控制数据质量应从数据产生和扩散的所有过程和环节入手,分别用一定的方法减少误差。

4.1空间数据质量控制常见的方法有:4.1.1传统的手工方法质量控制的人工方法主要是将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其他比较方法,这要求操作人员具有较高水平的专业素质和一定的耐心。

例如,在地图数字化过程中,不可避免地会出现空间点位丢失或重复、线段过长或过短、区域标识点遗漏等问题。

几何数据错误如图所示,其中(a)为区域标识点遗漏,(b)为线段过长。

为此,可采用目视检查逻辑检验和图形检验等方法进行检查与处理。

4.1.2地理相关法用空间数据的地理特征要素自身的相关性来分析数据的质量。

例如,从地表自然特征的空间分布着手分析,山区河流应位于微地形的最低点,因此,叠加河流和等高线两层数据时,若河流的位臵不在等高线的外凸连线上,则说明两层数据中必有一层数据质量有问题,如不能确定哪层数据有问题时,可以通过将它们分别与其他质量可靠的数据层叠加来进一步分析。

因此,可以建立一个有关地理特征要素相关关系的知识库,以备各空间数据层之间地理特征要素的相关分析之用。

4.1.3元数据方法元数据(Metadata)是描述数据的数据.在地理界,最典型的元数据便是各种地图中的图例内容,如图名、比例尺、精度、生产者、出版单位和日期以及其它可以在地图图廓上找到的标识信息等。

使用元数据的目的就是促进数据集的准确、高效利用,其内容包括对数据集中各数据项、数据来源、数据所有者及数据生产历史等的说明;对数据质量的描述,如数据精度、数据的逻辑一致性、数据完整性、分辨率、比例尺等;对数据处理信息的说明;对数据转换方法的描述;对数据库的更新、集成等的说明.通过使用元数据,可以检查数据质量,跟踪数据加工处理过程中精度质量的控制情况。

例如在数据集成中,不同层次的元数据分别记录了数据格式、空间坐标、数据类型、数据使用的软硬件环境、数据使用规范、数据标准等信息,这些信息在数据集成的一系列处理中,如数据空间匹配、属性一致化处理、数据在各平台之间的转换使用等是必要的。

这些信息能够使系统有效地控制系统中的数据流。

4.2以地图数字化生成地图数据过程为例说明空间数据质量控制的方法地图数字化是数据采集的重要手段。

在地图数字化过程中,为了控制数字化过程的质量,我们应从数据预处理、数字化设备及软件的选用、地图配准、数字化方式以及数据精度检查等环节加以控制。

4.2.1数据预处理首先对原始地图、表格等进行整理、誊清或清绘。

对于质量不高的数据源,如散乱的文档和图面不清晰的地图,通过预处理工作不但可减少数字化误差,还可提高数字化工作的效率。

对于扫描数字化的原始图形或图像,还可采用分版扫描的方法,以减少数字化误差,提高数字化的工作效率。

为了减少图纸在数字化过程中变形对数据精度的影响,保证纸质地图存放环境有适宜的温度和湿度,以减小地图由于环境原因造成的变形,对质量不好的纸质地图应将其复印到变形小于0.2‰的聚脂薄膜上。

另外,对地图上的封闭曲线或较长的线状要素应将其进行分段,因为大多数GIS软件能存贮的线状实体顶点数有限,而且对线状要素进行分段处理有利于减少数字化误差,提高数字化精度。

4.2.2正确选择数字化软件设备数字化仪的分辨率和精度对数字化的质量有着决定性的影响。

所以在选用数字化设备时应考虑其分辨率和精度等参数不应低于设计的精度要求。

一般数字化仪的分辨率应达到0.025 mm,精度达到0.2 mm,扫描仪的分辨率不低于0.083 mm。

相关主题