当前位置:文档之家› 空间不确定性研究综述

空间不确定性研究综述

空间不确定性研究综述摘要:介绍了空间不确定性的概念,对空间不确定性的研究内容进行阐述说明并归纳总结其研究方法,对不确定性研究的发展趋势进行分析。

关键词:空间数据;不确定性;GIS;研究1 空间不确定性问题概述空间数据质量的不确定性研究伴随着GIS 的问世而开始,由于人类测量与表达能力的局限性,描述数据的模型只能是对客观实体的一种近似,此外各种空间操作、处理等又会引入新的误差和不确定性,可以说误差的存在是各类观测与分析数据的基本特征。

这往往导致空间特征和空间过程很难被准确确定,从而直接关系到对GIS产品的质量控制,影响了空间数据的反演、多尺度和多角度数据分析和应用建模的效果,影响决策结果的质量。

因此,在GIS初步形成和产品化时,就提出了空间数据的不确定性问题,且被国际上列为地理信息科学界重大基础理论研究课题之一。

在不确定性理论提出的早期,不确定性与误差是近义词,二者在多数情况下可以相互通用。

误差指统计意义下的偏差或错误,而数据不确定性主要指数据“真实值”不能被肯定的程度。

从这个意义看,数据不确定性可以看作是一种更广义与抽象的误差,它既包含随机误差,也包含系统误差和粗差;既包含可度量的误差,又包含不可度量的误差以及数值上和概念上的误差。

不确定性可划分为四类,分别是随机性、模糊性、未确定性和灰色性。

随机性的特点是可重复观察,在观察之前知道所有可能的结果,但不知道到底哪一种结果会出现。

模糊性是指事物的概念本身是模糊的,即一个对象是否符合这个概念难以确定。

就像“一粒”和“一堆”是有区别的两个概念,它们的区别是渐变的,两者之间并不存在明确的界限,这种不确定性就是模糊性。

未确定性是指纯主观上的、认识上的不确定性。

灰色性是指由于事物的复杂性和噪声干扰,人们只能把握部分信息或信息的大致范围,而不知其全部信息或确切的信息量。

2 不确定性的研究内容空间数据不确定性的产生来源十分复杂,空间对象本身可能具有不稳定性,在空间数据的获取、存储、传输、分析等过程中会引入更多复杂的不确定性。

如在数据获取过程中,仪器精度限制、测量方案完善程度、环境的复杂性、观测员的能力水平、空间分析方法与模型表达的多样性等均会造成空间数据的不确定性。

根据实际应用中的需要,对地理空间数据不确定性的研究又可细分为:位置不确定性、属性不确定性、时域不确定性、逻辑一致性、数据完整性、数据不确定性的传播以及不确定性的可视化表示等[1]。

地理空间数据不确定性研究的核心就是建立一套不确定性分析和处理的理论体系和方法体系。

2.1位置不确定性位置不确定性指表示空间实体的真实位置与实际位置之间的差别,空间实体的位置通常以二维或三维坐标表示,相应的,位置不确定性常用坐标的精度来表示。

近年来,空间数据位置不确定性成了研究热点,主要集中在数据源不确定性的研究;点、线、面元不确定性模型的研究、不确定性可视化和不确定性传播模型的研究。

2.2属性不确定性属性不确定性是指在采集、描述和分析客观实体的过程中,实体属性的量测或分析值围绕其属性真值随机地在时间或空间内的不确定性变化,是属性误差的空间延伸。

属性不确定性可分为定量和定性两种,如土地面积的不确定性(定量)和植被分类的不确定性(定性),一般取决于属性数据的类型[2]。

属性不确定性主要来自于属性的定义、数据源、数据建模和分析过程中引入的不确定性,其中涉及到问题较多,包括难以确定的实体与实体间的边界,定义模糊的实体关系,空间分析中的不确定性及其传播,不确定性查询,度量不确定性等。

2.3时域不确定性时域不确定性是指在描述地理现象时,时间描述上的差错。

数据的时间精度涉及数据的现势性,大多数采用元数据管理的方法。

如对于每一幅遥感影像数据来说,无疑是同一瞬间的。

但对于由多幅遥感影像拼接镶嵌起来的数据,则可能出现不同时段的遥感数据,时间可以相差若干天、若干月和若干年。

在同一数据集中,或同一幅专题图中,出现不同时段的数据就可能造成不确定性。

2.4逻辑一致性逻辑一致性是指数据结构内部的一致性,尤其是指拓扑逻辑上的一致性。

包括数据结构、数据内容、空间属性与专题属性, 以及拓扑性质上的内在一致性。

在GIS中,几何要素拓扑关系上的内在不一致性是逻辑一致性研究的重点。

2.5数据完整性空间数据的完整性是指对于给定的目标,GIS 空间数据库能够完整表达的现象,包括数据范围、数据的分层、实体类型、属性数据和名称等各方面的数据的完整性。

数据完整性如何是相对于所要完成或达到的目标而言的。

2.6数据不确定性的传播GIS数据在输入、存贮、投影变换、格式变换、编辑、数据重组、数据处理、数据分析与分数以及数据制图及输出过程中,都能产生误差或不确定性。

这些不确定性还能随着数据流的过程传递与积累。

此外,在数据格式转换过程中,误差是普遍存在的。

例如从栅格数据到矢量数据的相互转换过程中,不同模型计算所得的数据存在较大的差别,因此数据格式转存有明显的不确定性[3]。

另外,在多种数据叠加过程中,出现不符合的现象也是常有的,往往会出现新的“斑块”或双线条等问题,因此具有明显的不确定性。

2.7不确定性的可视化表示不确定性的可视化研究是进人年代以后随着计算机技术的发展而兴起的。

目前主要采用灰度方法、彩色加三维的方法,通过采用直观的二维、三维图形或其他灵活的形式,把抽象的空间数据不确定性的大小及分布转换为人的视觉可以直接感受的具体图形,以利于用户对数据质量的认识[4]。

3 不确定性的研究方法3.1基于概率论及数理统计的不确定性研究这方面的理论主要有概率论、证据理论、空间统计学。

概率论主要用于处理由于随机误差而产生的不确定性。

在概率论中,不确定性被描述成在给定某些观测值的条件下某一假设成真的条件概率。

证据理论是对传统概率论的一个扩展。

该理论的一个基本策略是把一个证据集合分解成一系列不相关的证据集合,在这些证据集合中分别作判断,最后利用Dempster结合规则将这些判断结合起来。

证据理论可以利用结合规则和两两比较的方法分析不确定性。

其最大弱点在于,不能就矛盾证据或不同假设之间具有的微弱支持问题提出解决办法。

空间统计学过去称为地学统计学或地质统计学,它是关于不确定性和有限信息条件下进行分析、评价的学科[5]。

它强调空间预计概率方向的作用,运用空间自协方差结构、变异函数或与其相关的自协变量,或局部变量值的相似程度来描述空间属性的不确定性,把统计变量理解为重要的信息源,以改善在有限观测量条件下的空间属性数据预测。

3.2基于模糊集合及粗集理论的不确定性研究模糊数学以模糊集合为基础,用模糊可行区间表示数据非统计不确定度。

其优点在于处理不确定性的能力,如土地分类中土壤渐变区域的处理、基于自然语言的空间查询等。

而弱点是没有严格证明的过程,它所处理的对象是可能性而不是概率。

因此,模糊数学常用于处理不确定性中的不准确性而非随机性,如两线状地物连接处的不确定性、场模型中确定域与模糊域目标间拓扑空间关系的描述等。

粗集理论的主要思想是在保持信息系统分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。

粗集理论不排斥不确定性,力求按照实体的原形来研究实体,非常适合用于不确定影像分类、模糊边界划分、属性不确定性及评定属性的绝对不确定性和相对不确定性、简化属性依赖和属性表等。

3.3 基于云理论及信息熵的不确定性研究云理论是一个分析不确定信息的新理论,包括云模型、不确定性推理和云变换三部分。

云在空间由系列云滴组成,具有期望值、熵和超熵3个数字特征。

期望值完全是一个定性的概念;熵是定性概念模糊度的度量,其值越大,概念越模糊;超熵反映云滴的离散程度,其值越大,隶属的随机离散度越大。

以云理论为基础提出了云方法,它用期望值、熵和超熵这3个数字特征描述整个云团,实现定性和定量的转换,适用于空间关联规则的挖掘、空间数据库的不确定性查询及地理空间数据中模糊性和随机性为一体的属性不确定性问题。

熵是信息论中的一个基本概念,是用以度量信息源不确定性的惟一量,非常适合用来对测量结果的不确定度进行评定。

利用熵理论评定测量数据的不确定性方法主要有2种:(1)直接根据样本的信息熵计算测量值的不确定度;(2)由最大偏方法确定出样本的概率分布,再根据此概率分布计算测量结果的估计及其不确定度。

其优点是在小样本容量下能获得可靠的评定结果。

3.4基于多学科融合模型的不确定性研究使用多学科融合模型日益成为分析处理地理空间数据不确定性的有效手段。

如:目标模型、域模型是经典的GIS数据处理模型;“ε-带”模型可以理解为一个半径为ε的圆沿着一个线状目标移动时所覆盖的区域,目前已成为研究线不确定性问题的基础;神经网络模型的建模方法不需要对象的先验知识,不管对象模型是线性的或非线性的均根据测量数据直接建模,避开了空间数据不确定度评定的数学模型构建难题;遥感信息模型可以直接对图像进行计算,非常适合对场模型地物的不确定性进行计算和分析。

除此之外,基于复制、交叉和变异的遗传算法、基于灰色分析的灰色系统、基于信息无序互动的混沌理论等等,均具有各自独特的优势,有望进一步促进不确定性研究的进展。

当然,这些理论和方法不是孤立的,在实际分析处理不确定性时,常常要予以综合应用。

4 不确定性的研究趋势(1)二维空间到三维空间目前来说,不确定性分析较多的针对二维平面数据, 对三维空间对象的不确定性研究较少。

随着计算机技术与软件设计技术的不断发展,各产业中对三维空间数据的不确定性研究需求将增加,三维应用将不断深人, 三维空间元素的不确定性研究将变得十分重要。

(2)系统理论建立空间不确定性的研究虽已取得了不错的进展, 但目前的研究大都是在具体应用的方面独立展开的, 至今仍未能针对空间不确定性建立起一个统一理论框架。

在未来中,建立完整的空间不确定性系统理论框架,确定不确定性的本质、各种不确定性之间的相互关系、不确定性的传播机理的研究势在必行。

(3)研究朝实际应用转化任何理论的创建与研究若是与实际应用相脱节就会失去其意义。

目前,空间数据不确定研究一直未脱出纯理论和纯函数表达式的阶段。

问题的研究尽管愈来愈复杂,但仍看不出实际应用的具体方法。

所以,如何以空间数据不确定性研究模型为基础,针对各种实际应用构建空间数据质量控制的模型和方法,将当前的空间数据不确定性分析的分析结果变为用户可操作的确定性标量(如最大风险值,平均风险值等) ,使用户得到空间数据质量和空间信息服务质量的确定性指标,将成为不确定性研究在今后需要着重发展的方向。

参考文献:[1]王春,汤国安,赵牡丹,王雷,张婷.地理空间数据不确定性与研究进展[D]. 西安:西北大学,2004[2]张菊清,杨元喜.空间数据不确定性研究现状分析[J].地理空间信息,2009,7(3):4-8[3]邬伦,承继成,史文中.地理信息系统数据的不确定性问题[J].测绘科学,2006,31(5):13-17[4]刘伯红.GIS中不确定性研究及其进展[J].重庆邮电学院学报,2006,(增刊):232-234[5]郭达志, 胡召玲, 陈云浩.GIS中空间对象的不确定性研究[J].中国矿业大学学报,2000,29(1):20-24。

相关主题