当前位置:文档之家› 空间数据管理系统概论复习

空间数据管理系统概论复习

《空间数据库管理系统概论》期末复习考试第一章绪论1、空间数据库:是指在地球表面某一范围内与空间地理相关,反映某一主题信息的数据集合,是一类以空间目标作为存储对象的专业数据库,是 GIS 的核心和基础。

2、空间数据:是指以地球表面空间位置为参照的自然、社会和人文经济景观数据。

它包括文字、数字、图形、影像、声音、图像等多种表现形式,如地名地址、数字高程、矢量地图、遥感影像、地理编码数据、多媒体地图等。

3、矢量数据:是一种用点、线、面等基本空间要素表示人们赖以生存的自然世界的数据。

4、栅格数据:是把地理空间中的事物和现象作为连续的变量或体来看待,如大气污染、植被覆盖、土壤类型、地表温度等。

5、空间数据的特征: 1)空间特征 2)非结构化特征3)空间关系特征4)时态特征5)多尺度特征6、空间数据库:在地球表面某一范围内与空间地理相关,反映某一主题信息的数据集合。

7、空间数据库的特点: 1)数据量大2)空间数据与属性数据的集3)应用广泛8、空间数据库管理系统:位于用户与操作系统之间的一层数据管理软件。

对空间数据库的所有操作都是在空间数据库管理系统的统一管理和控制下进行的。

9、空间数据库管理系统的特点:1)空间数据的定义和操纵2)空间数据的组织、存储和管理3)后台的事务管理和运行管理4)数据库的建立和维护10、空间数据系统的一般由四部分组成:1)空间数据库2)空间数据库管理系统3)数据库管理员4)用户和应用程序11、现有的两个空间数据标准简介:(1)简单要素的 SQL 实现规范( SFA SQL):第一部分定义的是几何对象的不同表达方式和空间参考系统的表达方式;这个规范不是针对某个特定平台定义的,具有平台独立性。

第二部分定义了第一部分定义的简单要素模型在数据库中的实现,给出了内模式下几何类型的定义及相关实现。

(2) SQL 多媒体及应用包的第三部分: 1)空间定义了矢量数据存储于检索的相关标准; 2)静态图像定义了静态图像数据存储于检索的相关标准。

总结:这两个标准公共部分的接口已经相互兼容,但是这两个标准无论是在内容覆盖面,还是从某些概念的界面上还是有一定的差别。

例如,SFA SQL 在注记文本类型、空间数据存储实现方式上比 SQL/MM 定义的内容更广泛,而 SQL/MM 涉及了 SFA SQL 尚未涉及的拓扑数据结果、网络模型等方面的内容。

没有统一的空间数据库标准,自然导致现有空间数据库管理系统有所差异。

例如, posGIS 更符合 OGC 标准,而 Oracle Spatial 更兼容 SQL/MM 的标准。

第二章数据库相关基础知识回顾1、数据模型:对现实世界数据特征的抽象、对现实世界的模拟。

由于计算机不可能直接处理现实世界中的具体事物,所以人们必须事先把具体事务转换成计算机能够处理的数据。

也就是首先要数据化,把现实世界中具体的人、物、活动、概念用数据模型这个工具抽象、表示和处理。

2、概念模型:用于信息世界的建模,它是现实世界的第一层抽象,它是数据库设计的有力工具,也是数据库开发人员与用户之间进行交流的语言。

3、概念模型:用户眼中看到的数据范围,它是能用某种语言描述,使计算机系统能够理解,被数据库管理系统支持的数据视图。

4、物理模型:对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的。

5、概念模型中的基本概念:1)实体:客观存在并可相互区别的事物。

2)属性:实体所具有的某一特性;3)码:唯一标识实体的属性集4)域:属性的取值范围5)实体型:用实体名及描述它的各属性名,可以刻画出全部同质实体的共同特征和性质。

6)实体集:同一类型实体的集合7)联系:在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映实体型内部的联系和实体型之间的联系。

8)实体间的联系:通常指不同实体集之间的联系。

实体间的联系可以分为一对一(1:1)、一对多( 1:n)、多对多( m:n)三种。

9)实体内的联系:实体内部的联系通常是指组成实体的各属性之间的联系。

6、逻辑模型中的关系模型:关系模型由一组关系组成,每个关系的数据结构都是一张规范化的二维表。

7、关系模型的相应术语和定义:1)关系:一个关系对应于通常所说的一张表。

2)元祖:表中的一行即为一个元祖。

3)属性:表中的一列即为一个属性,给每个属性起一个名称即属性名。

4)码:关系中的某个属性组,它可以唯一确定一个元祖。

5)域:属性的取值范围。

6)分量:一条记录中的一个列值。

7)关系模型:表格中的表头描述。

8、关系型数据库中关系具有以下性质:1)不允许存在重复元组; 2)元组无序;3)属性无序; 4)每个元组的各属性值是原子的,即二维表格中的所有行与列的格子中间都是单一数值,不允许存放两个或更多的数值。

9、对象关系模型:关系数据库技术与面向对象程序设计方法相结合的产物。

它保持了关系数据系统的非过程化数据存取方式和数据独立性,继承了关系数据库系统已有技术,支持原有的数据管理,又支持面向对象模型和对象模型。

10、对象关系数据库的一般功能:1)扩展数据类型; 2)支持复杂对象; 3)支持继承的概念; 4)提供通用的规则系统。

11、SQL 的特点:1)综合统一; 2)高度非过程化; 3)面向集合的操作方式; 4)一种语法结构、多种使用方式;5)语言简介,易学易用。

12、SQL 的三级模式结构:SQL 支持关系数据外模式、模式、内模式的三级构成,所谓模式是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。

所谓外模式是数据用户能够看见和使用的局部数据的逻辑结构和特征描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。

所谓内模式是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。

13、基本表:是本身独立存在的表,在SQL 中一个关系就对应一个基本表,也称基表。

14存储文件:一个基表对应一个存储文件,一个表可以带若干索引,索引也放在存储文件中,用于提高基表的检索速度。

15、视图:是从一个或几个基表导出的表,它本身不独立存储在数据库中,即数据库中只存放视图的定义而不存放视图的数据。

这些数据仍然存放在导出视图的基表中,因此,视图是一个虚表,视图在概念上与基表等同,用户可以在视图上再定义视图。

16、SQL 语言分为数据定义语言(DDL )、数据操纵语言( DML )、数据控制语言( DCL )17、数据定义功能包括模式定义、表模式、视图、索引的定义。

18、数据操纵语言是用于执行数据的查询、更新、插入、删除操作。

19、数据控制语言的功能用于为用户授权和撤销授权。

第三章空间数据模型1、空间数据模型的分类有矢量模型和栅格模型。

2、矢量模型的优点:1)便于面向现象的数据表示;2)数据结构紧凑,冗余度低;3)有利用网络分析; 4)图形显示质量好、精度高;矢量模型的缺点: 1)数据结构复杂; 2)软件和硬件的技术要求比较高;3)多边形叠合分析比较困难;4)显示与绘图成本比较高3、栅格模型的优点: 1)数据结构简单; 2)空间分析和地理现象的模拟均比较容易;3)有利于与遥感数据的匹配应用和分析;4)输出方法快速,成本比较低廉。

栅格数据的缺点: 1)图形数据量大; 2)投影转换比较困难; 3)栅格地图的图形质量较低; 4)现象识别效果不如矢量数据。

4、几何对象模型的地理要素:对现实世界空间现象的抽象,通常由几何、属性、行为等 3 类信息构成。

5、几何对象模型的几个要点:(1)坐标维数和几何维数的区别;(2)该模型仅能表达、处理简单的几何对象;(3)模型中任意几何对象都有其边界、内部、和外部;(4)该模型的坐标维数是 3,但目前仅能描述二维几何对象;(5) M 值。

除 x、y、 z 坐标外,点( point)类还有一个 M 坐标。

6、几何对象模型主要方法有:常规方法、常规GIS 分析方法、空间查询方法。

7、几何拓扑模型的大概概念:多边形的边界可以用线来描述,而线又可以用点的集合来描述。

拓扑关系数据模型就是以拓扑关系为基础组织和存储各个几何对象,其特点是以点、线、多边形间的拓扑连接关系为中心,它们的坐标存储具有依赖关系。

8、网络模型:是 GIS 中另一种常见的矢量数据模型,常用于交通路径分析、资源分配的应用中。

9、栅格数据:采用一组笛卡儿平面描述空间对象的性质。

笛卡儿平面试一个二维数组,其中的某行某列对应现实世界中某一栅格单元的一些属性值。

10、在空间数据库中,栅格数据主要有三类:1) GIS 栅格分析中设计的栅格数据; 2)遥感影像数据; 3)图片数据。

11、栅格数据模型中的概念模型:栅格数据可以用行维、列维、波段维进行统一描述,而层通常被视为逻辑上的概念,而波段则视为物理上的概念。

第六章空间查询与索引1、空间索引的目的:对空间图形集合做的一个“目录”,基于此目录可以提高在这个图形集合中查找某个图形对象的效率。

2、空间索引:依据空间实体的位置和形状或空间实体之间的某中空间关系,按一定顺序排列的一种数据结构,其中包含空间实体的概要信息如对象的标识、最小边界矩形及指向空间实体数据的指针。

3、常用的空间填充曲线有Z 曲线、 Hillbert 曲线4、网格索引:将研究区域用横竖线条划分大小相等和不等的格网,每个网格可视为一个桶,它记录了落入每一个格网区域内的空间实体编号。

5、网格索引的优点:简单、易于实现;其次具有良好的可扩展性。

6、四叉树索引目的:为了实现要素真正被网格分割、同时保证桶内要素不超过某一个量而提出的一种空间索引方法。

7、四叉树索引在一定程度上实现了地理要素真正被网格分割,保证了桶内要素不超过某一个量,提高了检索效率。

但是对于海量空间数据,四叉树索引的性能有可能并不十分理想。

因为当空间数据量较大时,四叉树的深度往往很深,这无疑会影响查询效率;但如果压缩四叉树深度,又将导致划分到同一个区域的对象数过多,从而影响检索性能。

此外,四叉树的可扩展性不如网格索引。

若是扩大空间区域,则必须重新划分空间区域,重建四叉树;若是增加一个空间对象,则可能导致树的深度增加一层或多层,相关叶子的节点都必须重新定位。

8、R 树的特点: 1)除根节点外,每个叶节点包含m 到 M 条索引记录。

2)每个叶节点上记录上空间对象的 MBR 和元祖标识符; 3)除根节点外,每个中间结点至多有 M 个子结点,至少有 m 个子结点;4)每个非叶结点上记录了MBR,子结点指针,其 MBR 为空间上包含其子结点中矩形的最小外包矩形;5)若根结点不是叶结点,则至少包含 2 个子结点;6)所有叶结点出现在同一层中;7)所有 MBR 的边与一个全局坐标系的坐标轴平行。

10、R 树是采用空间聚集对的方法对数据进行分区,提高了空间分区节点的利用效率;同时, R 树作为一棵平衡树,也降低了R 树的检索效率。

相关主题