当前位置:文档之家› 地理空间数据库论文

地理空间数据库论文

地理空间数据库摘要:对空间数据库的研究始于20世纪70年代的地图制图与遥感图象处理领域,其目的是为了有效地利用卫星遥感资源迅速绘制出各种经济专题地图。

由于传统数据库在空间数据的表示、存储、管理、检索上存在许多缺陷,从而形成了空间数据库这一数据库研究领域。

随着GIS、CAD、机器人、多媒体技术等应用领域的发展,对空间数据库的研究越来越受到人们的重视。

本文从空间数据库的简单介绍开始,主要概述了空间数据库的基本概念、类型、索引与查询方法及其在发展中的一些实际应用。

关键词:空间数据库;GIS;基本概念;索引;查询;应用;发展一、空间数据库的概念1.1空间数据库的定义空间数据库是具有内部联系的空间数据的集合,可以管理和维护海量数据,并为不同的GIS应用所共享。

空间数据库应该满足的要求:(1)空间数据库系统是数据库系统,它具有商业数据库系统的一切功能和特点,必须具有能对空间数据进行处理的能力。

(2)空间数据库系统在数据模型中提供空间数据类型及其空间查询语言。

(3)数据库应当具备两个最核心的特征:1)持久性:即处理临时和永久数据的能力。

临时数据在程序结束后就消失了;永久数据不仅在程序调用时可以用,并且在系统和媒介崩溃后仍可以使用。

2)事务:事务将数据库的一个一致状态映射到另一个一致状态。

1.2空间数据库的组成数据库三个基本部分构成:1)数据集:一个结构化的相关数据的集合体,包括数据本身和数据间的联系。

数据集独立于应用程序而存在,是数据库的核心和管理对象。

2)物理存储介质:是指计算机的外存储器和内存储器。

前者存储数据,后者存储操作系统和数据库管理系统,并有一定数量的缓冲区,用于数据处理,以减少内外存交换次数,提高数据存取效率。

(内存数据库)3)数据库软件:其核心是数据库管理系统(DBMS)。

主要任务是对数据库进行管理和维护。

具有对数据进行定义、描述、操作和维护等功能,接受并完成用户程序和终端命令对数据库的请求,负责数据库的安全。

1.3地理空间数据库与普通数据库的区别普通数据库是为了一定的目的,在计算机系统中以特定的结构组织、存储和应用的相关联的数据集合。

数据库系统是集中统一存储和管理某个领域信息的系统。

它根据数据间的自然联系而构成,数据较少冗余,且具有较高的数据独立性和数据保护性,能为多种应用服务。

地理空间数据库是某区域关于一定地理要素特征的数据集合。

地理空间数据库的特点:数据量特别大、具有地理空间数据和属性数据、数据结构复杂、数据应用面相当广、数据应用层次多等。

二、空间数据库的类型2.1分布式数据库分布式数据库是一组物理上分布的数据集合,每个数据集合有分布其位置上的数据库管理系统管理。

分布式数据库具有以下优点:1)更好的数据存储和更新数据存储分布在专业职能部门,减少了数据集中存储的复杂性和数据量,并由数据所在部门进行维护和更新。

2)更有效的数据恢复专业数据存储在专业职能部门,数据责任明确,数据组织更有效,数据查询方向明确。

3)更有效的数据输出数据由专业职能部门维护,可提供有权威的数据供给。

2.2基于Web 的空间数据库系统一个WebGIS具有以下三种结构:1)客户端:通常是任意标准的Web浏览器。

如果要使其具有显示空间数据的功能,必须进行功能扩展,使其能够显示空间数据,并能向Web 服务器发送数据请求。

2)服务层:一般有多个有序的层级组成(Web服务器层、地理空间数据分析层、地理空间数据库访问层)。

第一级为CGI/Java applet/ ActiveX 模块,或类似的其它能够响应用户请求的模块(如API),负责解析用户的任务请求,并将请求发送到相应的处理层,从处理层获得处理结果,发送到用户。

3)地理空间数据层,是一个开放的结构,不受特定的关系数据库系统和文件格式约束,由一系列自定义的开发接口构成。

这个结构应支持OpenGIS 协会的 WMS和GML标准。

2.3并行数据库系统并行是分布式空间数据库系统的发展趋势。

随着数据的快速增长和使用WebGIS 的需求增加,查询的快速响应时间变得极为重要。

并行数据库系统的三类主要资源:处理器、主存模块和二级存储(磁盘)。

并行数据库系统的高性能可以从两个方面理解,一个是速度提升,一个是范围提升。

速度提升是指,通过并行处理,可以使用更少的时间完成两样多的数据库事务。

范围提升是指,通过并行处理,在相同的处理时间内,可以完成更多的数据库事务。

并行数据库系统基于多处理节点的物理结构,将数据库管理技术与并行处理技术有机结合,来实现系统的高性能。

2.4时空数据库系统时空数据库:体现空间和时间,并获取数据的时间和空间特性的一种数据库。

时空数据库的目的:为表现时间和空间特性的应用提供数据库支持,提供对现有空间数据库模型在时间方面的扩展,以更好地应对动态环境。

三、空间数据库的索引和查询3.1空间数据索引空间数据库索引技术是提高空间数据库查找性能的关键技术,将直接影响到空间数据库系统的成败。

因此,空间索引技术研究一直是空间数据库研究领域中的一个热点。

空间索引是对存储在介质上的数据位置信息的描述,用来提高系统对数据获取的效率。

对间索引技术的研究可以追溯到传统数据库中多属性数据的索引研究。

多属性数据可以看成是多维空间的点,因此多属性数据索引(如kd-树、网格文件、点四叉树、区域四叉树等)可以直接用于索引空间中的点状实体。

对于其它形状的空间实体,如曲线、多边形、多面体(曲面)等,则可以将其先映射成更高维空间的点,再采用点状目标的索引技术,或者采用某种方法将其映射成一维目标,再采用传统的索引技术(如B-树等)来进行索引。

3.1.1哈希索引方法哈希索引是一种随机索引,具有以下不同的构建方法:1) Grid文件,Grid文件索引是由Grid 格网方法变化来的,在基于哈希表索引方法中具有典型的代表性。

2)CELL树方法,为了削弱R树和R+树的边界矩形重叠问题和“死空间”问题而提出的。

3)多级Grid文件,使用第二级格网文件管理格网目录,第一级称为根目录,是第二级Grid文件的粗目录。

根目录的实体包含指向低级目录页面的指针。

4)多层Grid文件,为了改善低存储利用率提出的索引方法。

3.1.2四叉树索引法将一个有限的影像阵列连续地分割成四等分象限的四叉树,称为区域四叉树。

如果一个区域没有完全包含1或0,则这个区域将被进一步四等分,直到完全包含1或0为止。

3.1.3基于二叉树的索引方法它将目标空间逐级进行一分为二的划分。

优点:能较好地与空间数据库中的空间对象的分布情况相适应;缺点:深度较大,不利于空间操作。

3.1.4 基于B树的方法R树是B树在多维空间的扩展,其特点是索引一定范围内的对象。

其叶子节点包含多个形式为(OI,MBR)的实体,OI为空间目标标志,MBR为该目标在k维空间中的最小包围矩形。

非叶子节点包含多个形式为(CP,MBR)的实体。

CP为指向子树根节点的指针,MBR为包围其子节点中所有MBR的最小包围矩形。

3.2空间查询在空间数据查询方面,如空间选择查询,因为不存在标准的空间代数或标准的空间查询语言,空间数据库的查询语言严重依赖特定的应用领域。

空间数据库的查询结果是一组满足查询条件的空间对象集合。

具有以下几种查询方法:1、精确匹配查询;2、点查询;3、窗口查询;4、求交查询;5、邻域查询;6、包含查询;7、邻接查询;8、最邻近查询;9、空间连接查询。

四、空间数据库的发展趋势4.1空间数据库的发展随着IT技术的迅速发展,以GIS为代表的空间信息技术在各领域得到了应用,同时遥感等空间信息获取技术不断进步,现代社会对位置服务和分析决策的需要也日益迫切,因此深入研究和掌握空间信息技术的理论与方法的重要性也日益凸显出来空间数据库是近年的热点研究领域,是一门前沿的交叉学科其研究成果(如空间多维索引)开始应用于许多不同领域正是已有应用的需求推动了空间数据库管理系统的研究,包括地理信息系统(geographical information sys tem ,GIS)和计算机辅助设计(computer-aided design ,CAD),以及诸如多媒体信息系统数据仓库等近年来,许多计算机应用领域通过扩充数据库管理系统的功能来支持与空间相关的数据空间数据库管理系统(spatial database management system ,SDBMS)研究是找到有效处理空间数据的模型和算法的重要步骤。

空间数据库作为GIS基础软件的核心,存储、管理所有地理数据,是GIS数据流向的起点和终点,提供了包括空间数据的数据存储、数据维护、空间数据查询和空间分析等服务功能。

空间数据库的设计与实现,直接关系到整个GIS系统的功能与效率。

目前,在空间数据管理方面,各个GIS 厂家逐步从使用文件系统存储管理空间数据向使用数据库管理方向发展,并提出了众多解决方案。

一种是GIS 软件商自行开发的面向对象数据库管理系统,如Laser Scan公司的GAD,或在关系数据库管理系统基础上开发空间数据管理模块,如ERSI公司的SDE。

另一种方法,是数据库软件商直接在其关系数据库管理系统之上扩展空间数据管理功能,如Oracle,Informix 等软件的可选模块都已具有管理空间数据(点、线、面等)的能力。

也有利用现有关系数据库,自行开发出具有空间数据管理功能的GIS系统,如武汉测绘的GeoStar。

4.2空间数据库未来趋势随着计算机技术和相应技术的发展以及计算机应用需求的拓广, 20世纪80年代以来,数据库研究领域得到了极大的拓展,其特征表现在: 各种学科技术的内容与数据库的交叉结合,从而使数据库领域中新内容、新应用、新技术层出不穷,形成了当今的数据库系列。

与传统数据库的概念和技术相比,当今数据库的整体概念、技术内容、应用领域,甚至基本原理都有了重大的发展和变化,从而使得传统的数据库,即面向商业与事务处理的数据库仅仅成为当今数据库系列中的一个成员。

当然,也是在理论和技术上发展得最为成熟、应用效果最好、应用面最广泛的成员. 其核心技术、基本原理、设计方法和应用经验等仍然是整个数据库技术发展和应用开发的指导和基础。

4.2.1海量空间数据管理海量地理空间数据库管理已成为制约GIS技术发展的一个瓶颈,是当前地理信息科学领域研究的重要前沿课题之一。

传统GIS由于在地理空间数据模型、空间数据管理模式等方面存在缺陷,已不满足海量地理空间数据管理的需要。

例如,我们可以立足于土地资源调查领域,海量地理空间数据的管理,尝试探索一套海量地理空间数据库的高效管理方案。

4.2.2时空空间数据库时空信息在越来越多的应用中显得越为重要。

时空数据库技术是一个新兴的研究领域,对当今信息快速更新的时代,发挥着很大的作用。

自20世纪90年代开始,空间数据库和时态数据库的研究者逐渐认识到各自研究领域里存在的一些问题以及两者之间存在的联系,开始探索将空间数据库和时态数据库相结合的相关技术。

相关主题