为什么与统计数据相比空间数据更复杂,那空间数据该如何组织与管理·数据类型多(几何数据、关系数据、辅助数据)·数据操纵复杂(一般数据检索、增加、删除等,空间数据定位检索、拓扑关系检索等)·数据输出多样(数据、报表、图形)·数据量大,空间数据种类多(测量、统计数据、文字;地图、影像等)空间数据的非结构化特征·事务数据库:数据记录一般是结构化的。
每一个记录有相同的结构和固定的长度,记录中每个字段表达的只能是原子数据,内部无结构,不允许嵌套记录·空间数据:这种结构化不能满足要求。
需要存储地理实体的空间坐标:实体位置、大小形状;拓扑关系等文件与数据库混合管理。
基本思想:属性数据存储在常规的RDBMS中;几何数据存储在空间数据管理系统中;两个子系统间用标识符联系起来(即通过关键字联系)。
优点:由于一部分建立在标准的RDBMS上,存储和检索数据比较有效、可靠。
缺点:1由于使用了两个子系统,它们各自有自己的规则,查询操作难以优化,存储在RDBMS外的数据有时会丢失数据项的语义。
2数据完整性的约束条件可能遭破坏,如在几何空间数据系统中目标实体仍存在,但在RDBMS中却已删除。
全关系型空间数据库管理系统。
基本思想:采用同一DBMS存储空间数据和属性数据,即在标准的关系数据库上增加空间数据管理层;利用该层将结构查询语言(GeoSQL)转化成标准的SQL查询,借助索引数据的辅助关系实施空间索引操作。
优点:省去了空间数据库和属性数据库间的繁琐连接,空间数据存取速度快。
缺点:由于是存取、效率上总是低于DBMS 中所用的直接操作过程,且查询过程复杂。
对象关系数据库管理系统。
关系型数据库+空间数据引擎。
思想:用户将自己的空间数据交给独立于数据库之外的空间数据引擎,由空间数据引擎来组织空间数据在关系型数据库中的存储;用户需要访问数据的时候,再通过空间数据引擎,由引擎从关系型数据库中去除数据并转化为客户可以使用的方式。
优点:访问速度快,支持通用的关系数据库管理系统,空间数据按BLOB存取,可跨数据库平台与特定GIS平台结合紧密,应用灵活。
缺点:空间操作和处理无法在数据库内核中实现,数据模型较为复杂,扩展SQL比较困难,不易实现数据共享与互操作。
对象关系数据库管理系统。
扩展对象关系型数据库管理系统。
思想:对关系数据库关系系统进行扩展,使之能管理非结构化的空间数据,用户利用这种能力增加空间数据类型及相关函数,从而将空间数据类型与函数从空间数据引擎转移到数据库管理系统中。
优点:空间数据的管理与通用数据库系统融为一体,空间数据按对象存取,可在数据库内核中实现空间操作和处理,扩展SQL比较方便容易实现数据共享与互操作。
缺点:实现难度大,压缩数据比较困难,目前功能与性能还较差。
·扩展的关系数据类型:1大对象类型LOB 2 BOOLEAN 3集合类型ARRAY 4用户定义的类型5面向对象的数据类型·扩展的对象类型:1行对象与行类型[第①步定义行类型②创建行类型③创建基于行类型的表2列对象与对象类型①创建列对象②创建表,定义其中属性是对象类型3抽象数据类型(ADT)·参照类型:REF类型,值是OID①创建两个行类型②创建两个基于行类型的表③描述这两个表的参照关系地理空间建模的方法(二分法)地理空间建模是对空间实体的数据抽象后对实体对象或场的描述。
·基于实体的描述。
主要描述不连续的个体现象,适合表示有固定形状的空间实体,强调个体现象,对象之间的空间位置关系通过拓扑关系进行连接。
核心思想:将地理实体和现象作为独立的对象,以独立的方式存在,主要描述不连续的地理现象,任何现象都是一个对象,实体由不同的对象组成。
零维对象:点;一维对象:polyline线段、边界、链、弧段、网络(特性:长度,弯曲度,方向性);二维对象:polygon简单多边形、非简单多边形、凸多边形、单调多边形、有洞多边形、区域(区域为一组多边形)(特性:面积、周长、独立性或与其他地物相邻、内岛屿或锯齿状外形、重叠性与非重叠性。
·基于场的描述。
核心思想:把地理空间的事物和现象作为连续的变量来看待,如空气中污染物的集中程度、地表的温度。
在空间中任何点上都有一个表达这一现象的值。
·场模型和实体模型在计算机中实现共存。
地理空间表达模式曲面细分模式(镶嵌)。
规则镶嵌和不规则镶嵌。
用镶嵌模式表达基于实体的模型:二维空间中的空间实体被表示为包含它的有限像素子集。
点实体被描述为一个像元,用像元的地址。
多线多边形和区域实体:用有限个像元构成的像元集来表达。
用镶嵌模式表达基于场的模型:基于场的数据被定义为空间上的连续函数,在镶嵌模型中,不再是点的连续函数,而是像素的连续函数,每个单元通过一定的数值表达方式表达诸如环境污染程度。
植被覆盖类型等空间地理现象。
TIN就是镶嵌模型的一种类型,基于对2D空间的三角剖分矢量模式。
对象被表达为由点和边组成。
用矢量模式表达基于实体的模型:point : [x: real, y: real] polyline : < point > polygon : < point > region : { polygon } 。
用矢量模式表达基于场的模型-图斑模型,等值线模型,选样模型。
数字高程模型DEM。
它是用一组有序数值阵列形式表示地面高程的一种实体地面模型实体集合的表达方式面条模型。
特点:独立地描述实体集中任意实体的几何信息;面条模型不存储拓扑关系,所有的拓扑关系在需要的时候进行计算。
优点:独立地描述实体集中任意实体的几何信息.面条模型不存储拓扑关系,所有的拓扑关系在需要的时候进行计算。
缺点1缺乏空间对象之间的拓扑关系的明确信息,如邻接或包容2由于没有共享信息,数据存储冗余,例如,两个多边形之间的公共边界表示两次。
网络模型。
用于在基于网络(图)的应用中对网络进行表达。
点node弧arc。
特点:planar 每个边的交点记录为一个节点(node),即使这个节点不对应于任何地理实体。
优点:是对网络拓扑的本质描述。
缺点:二维对象之间的关系的信息没有存储在这个模型。
拓扑模型。
特点:Noplanar, 边的交叉不产生交点。
优点:几何是共享不重复。
数据模型代表相邻的多边形,因此他们不需要计算的需求。
有助于更新一致,只有一个边界更新即可。
可以促进网络和共享。
缺点:比面条模型更复杂, 可能处理更慢.一些结构信息没有实际的语义含义.增加一个新的对象需要对平面图进行重新计算.空间数据是对现实世界中空间对象(事物)的描述,其实质是指以地球表面空间位置为参照,用来描述空间实体的位置、形状、大小及其分布特征等诸多方面信息的数据。
空间数据的基本特征:空间特征,时间特征,属性特征空间数据库指以特定的信息结构(如国土、规划、环境、交通等)和数据模型(如关系模型、面向对象模型等)表达、存储和管理从地理空间中获取的某类空间信息,以满足不同用户对空间信息需求的数据库。
空间数据库系统:数字栅格地图数据库(DRG),数字高程模型数据库(DEM),数字正射影像数据库(DOM)矢量地形要素数据库(DLG)专题数据库(TD)元数据库(MD)数字高程模型数据库(DEM)是定义在平面X,Y上规则格网点上高程数据集构成的数据库影像数据库由各种航空航天遥感数据或经过扫描处理的影像数据构成的数字正射影像数据库数字栅格地形图:纸质地形图扫描后经几何纠正,并进行内容更新和数据压缩处理得到数字数字栅格地图分布式数据库:逻辑上是一个统一的数据库系统,物理上分散在不同的场地(节点),各场地通过计算机网络连接在一起,统一由一个分布式数据库管理系统( DDBMS )管理分布数据库特点:地方自治性,相互协作性;位置透明性;副本透明性;分布式数据库;演绎数据库;时态数据库;实时数据库。
空间实体:地理空间中的物体,通常包括两个组成部分:实体描述:实体由属性集来描述;空间描述:包括几何和拓扑地图:依据一定的数学法则,运用地图语言(地图符号)对现实世界的科学抽象和概括。
地图对空间尸体的属性表示:符号与标记;定位表示:点状要素、线状要素、面状要素。
欧氏空间:许多地理现象模型建立的基础是嵌入在一个坐标空间中,在这种坐标空间中,根据常用的公式可以测量点之间的距离与方位,这个带坐标的空间模型叫欧氏空间不规则三角网TIN模型:按照一定的规则将离散点连接成覆盖整个区域且互不重叠、结构最佳的三角形。
存储方式:1按三角形来存储;2点和它们的邻居伪空间数据:一些形式的空间数据不能被直接用于空间应用。
这样的空间数据被称为伪空间数据拓扑:当图形形状在弯曲、拉伸、收缩或其他方式扭曲下几何形状保持不变的属性。
几何:“Geometry”通常被理解为数学的一个分支,用来处理零维和高维空间的点、线、角、面和表面的属性及关系。
在几何对象模型中,“Geometry”用来表达在数据库中至少有一个几何属性“对象”的空间要素。
拓扑关系:指满足拓扑几何学原理的各空间数据间的相互关系。
即用结点、弧段和多边形所表示的实体之间的相邻、连通和包含等关系。
Coverage:矢量数据的基本存储单元,存储指定区域内地理要素的位置,拓扑关系及其专题属性。
主要特点:空间数据与文件数据相结合,能够存储矢量要素之间的拓扑关系。
缺陷:1Coverage模型的某些可取之处没有必要了(拓扑关系——面向对象技术解决;存储空间;计算机运行能力提高——实时计算)2空间数据不能很好的与其行为相对应3以文件方式保存空间数据,属性数据存放在另外DBMS中;对数据一致性有影响4Coverage模型的拓扑结构不够灵活5不同的Coverage之间无法建立拓扑关系TIN:根据区域有限个点集,将区域划分成相等的三角面网络,数字高程由连续的三角面组成,三角面的形状和大小取决于不规则分布的测点的密度和位置。
八叉树:八叉树是一种用于描述三维空间的树状数据结构。
过程:假设要表示的形体V可以放在一个充分大的正方体C内,八叉树的每个节点与C的一个子立方体对应,树根与C 本身相对应,如果V=C,那么V的八叉树仅有树根,如果V≠C,则将C等分为八个子立方体,每个子立方体与树根的一个子节点相对应。
只要某个子立方体不是完全空白或完全为V所占据,就要被八等分,从而对应的节点也就有了八个子节点。
这样递归判断、分割一直进行到节点所对应的立方体或是完全空白,或是完全为V占据,或是其大小已是预先定义的体素大小。
八叉树节点有灰节点,白节点,黑节点。
数据存储机制:二级存储(1主存:数据索引2外存:数据)[寻找时间>延迟时间>传输时间] 物理存储介质:速度:高—低,容量:小—大。