第 1 页共4 页空间索引其一是由于计算机的体系结构将内存分为内存、外存两种,访问这两种内存一次所花费的时间一般为30~40ns,8~10ms,可以看出两者相差十万倍以上,尽管现在有“内存数据库”的说法,但绝大多数资料是存储在外存磁盘上的,如果对磁盘上资料的位置不加以记录和组织,每查询一个数据项就要扫描整个数据文件,这种访问磁盘的代价就会严重影响系统的效率,因此系统的设计者必须将资料在磁盘上的位置加以记录和组织,通过在内存中的一些计算来取代对磁盘漫无目的的访问,才能提高系统的效率,尤其是GIS涉及的是各种海量的复杂资料,索引对于处理的效率是至关重要的空间索引就是指依据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。
作为一种辅助性的空间数据结构,空间索引介于空间操作算法和空间对象之间,它通过筛选作用,大量与特定空间操作无关的空间对象被排除,从而提高空间操作的速度和效率构造一个高性能的空间索引系统要解决几个主要问题:1,高速查询,在大资料量的条件下能进行实时查询;2,高度扩展性,可以无限扩展索引区域;3,地理元素变化时,能够很快更新空间索引;4,不受坐标系或投影变换的直接影响空间索引的性能的优劣直接影响空间数据库和地理信息系统的整体性能,它是空间数据库和地理信息系统的一项关键技术尽管有许多特定的数据结构和算法用来完成空间索引,但基本原理相似,即采用分割原理,把查询空间划分为若干区域(通常为矩形或多边形),这些区域或单元包含空间资料并可唯一标识。
目前,有两种分割方法,一种是规则分割方法,另一种是基于对象的分割方法。
规则分割方法是将地理空间按照规则或半规则方式分割,分割单元间接地与地理对象相关联,地理要素的几何部分可能被分割到几个相邻的单元中,这时地理对象的描述保持完整、而空间索引单元只存储对象的位置参考信息。
在基于对象的分割方法中,索引空间的分割直接由地理对象来确定,索引单元包括地理对象的最小外接矩形目前,国际上研究出许多高效的空间索引方法,常见的空间索引方法一般是自顶向下、逐级地划分地理空间,从而形成各种树状空间索引结构。
比较有代表性的规则分割方法包括规则格网索引方法、BSP树和KDB树等。
基于对象的分割方法包括R树、R+树和Cell树数据压缩是将数据表示成更紧凑的格式以减少存储空间的一项技术。
分为:无损压缩:在编码过程中信息没有丢失,经过解码可恢复原有的信息---信息保持编码。
有损压缩:为最大限度压缩数据,在编码中损失一些认为不太重要的信息,解码后,这部分信息无法恢复。
--信息不保持编码。
链码又称Freeman编码或边界编码,主要记录线状地物或面状地物的边界,忽略空白区域。
它把线状地物或面状地物的边界表示为:由某一起始点开始并按某些基本方向确定的单位矢量链。
前两个数字表示起点的行列号,从第三个数字开始的每个数字表示单位矢量的方向。
优点:很强的数据压缩能力,并具有一定的运算功能,如面积,周长等的计算,类似于矢量数据结构,比较适合于存储线和面图形数据。
缺点:叠置运算,如组合、相交等很难实施,对局部的改动涉及到整体结构,而且相邻区域的边界重复存储。
首先定义一个3x3窗口,中间栅格的走向有8种可能,并将这8种可能0~7进行编码。
记下线状地物或面状地物的边界地物属性码和起点行、列后,进行追踪,得到矢量链.游程长度编码基本思路:对于一个栅格图形,常常有行(列)方向上相邻的若干栅格单元具有相同的属性代码,因而可采取某种方法压缩那些重复的内容。
编码方案为:只是在各行(列)栅格单元的代码发生变化时依次记录该代码以及相同代码重复的个数①或者记录代码及变化的位置(列数)②。
特点:属性的变化愈少,行程愈长,压缩比例越大,即压缩比的大小与图的复杂程度成反比。
优点:压缩效率高(保证原始信息不丢失);易于检索、叠加、合并操作。
缺点:只顾及单行单列,没有考虑周围的其他方向的代码值是否相同。
压缩受到一定限制。
块状编码:是将游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包含相邻的若干栅格数据对的组成:(初始行、列,半径,属性值)如:(1,1,1,0),(1,2,2,4),(1,4,1,7),(1,5,1,7)…特点:具有可变分辨率,即当属性变化小时图块大,对于大块图斑记录单元大,分辨率低,压缩比高。
小块图斑记录单元小,分辨率高,压缩比低,所以,与行程编码类似,随图形复杂程度的提高而降低分辩率。
20 ×20 = 400第 2 页共4 页四叉树编码:基本思想:将一幅栅格图象等分为四等分,逐块检查其格网属性值。
如果某一子区的所有栅格的属性值相同,则这个子区不再继续分割,否则还要把这个子区再分割为四个子区。
这样依此地分割,直到每个子区都有相同的属性值。
,四叉树的树形表示:用一倒立树表示这种分割和分割结果。
根:整个区域高:深度、分几级,几次分割叶:不能再分割的块树叉:还需分割的块每个树叉均有4个分叉,叫四叉树。
基本算法:距离的计算,面积的计算,叠置分析优点:在栅格数据结构中,点实体表示为一个像元;线实体则表示为在一定方向上连接成串的相邻像元集合;面实体由聚集在一起的相邻像元集合表示。
这种数据结构很适合计算机处理,因为行列像元阵列非常容易存储、维护和显示。
缺点:用栅格数据表示的地表是不连续的,是量化和近似离散的数据,是地表一定面积内(像元地面分辨率范围内)地理数据的近似性,如平均值、主成分值或按某种规则在像元内提取的值等;另一方面,栅格数据的比例尺就是栅格大小与地表相应单元大小之比。
像元大小相对于所表示的面积较大时,对长度,面积等的度量有较大影响。
曲线化简(压缩)Douglas—Peucker 压缩效果好,但必须在对整条曲线数字化完成后才能进行,且计算量较大垂距法每次顺序取曲线上的三个点,计算中间点与其它两点连线的垂线距离d,并与限差D比较。
若d<D,则中间点去掉;若d≥D,则中间点保留。
然后顺序取下三个点继续处理,直到这条线结束。
光栏法定义一个扇形区域,通过判断曲线上的点在扇形外还是在扇形内,确定保留还是舍去。
空间数据分层方法:1)专题分层每个图层对应一个专题,包含某一种或某一类数据。
如地貌层、水系层、道路层、居民地层等。
2)时间序列分层将相同时间或时期的数据作为一个数据层。
3)地面垂直高度分层将位于相同高度带上的数据作为一个数据层。
上述分层方法可以联合使用,比如专题分层的基础上,对不同时间采集的数据进行分层组织空间数据分层便于空间数据的管理、查询、显示、分析等。
空间数据分为若干数据层后,对所有空间数据的管理就简化为对各数据层的管理,而一个数据层的数据结构往往比较单一,数据量也相对较小,管理起来就相对简单;对分层的空间数据进行查询时,不需要对所有空间数据进行查询,只需要对某一层空间数据进行查询即可,因而可加快查询速度;分层后的空间数据,由于便于任意选择需要显示的图层,因而增加了图形显示的灵活性;对不同数据层进行叠加,可进行各种目的的空间分析空间分析空间分析是GIS的核心和灵魂,是GIS区别于一般的信息系统、CAD或者电子地图系统的主要标志之一。
空间分析,配合空间数据的属性信息,能提供强大、丰富的空间数据查询功能。
因此,空间分析在GIS中的地位不言而喻。
一般来说,空间分析包括以下基本方法:1.空间信息量算空间信息量算是空间分析的定量化基础。
空间实体间存在着多种空间关系,包括拓扑、顺序、距离、方位等关系。
通过空间关系查询和定位空间实体是地理信息系统不同于一般数据库系统的功能之一。
如查询满足下列条件的城市:在京九线的东部,距离京九线不超过200公里,城市人口大于100万并且居民人均年收入超过1万。
整个查询计算涉及了空间顺序方位关系(京九线东部),空间距离关系(距离京九线不超过200公里),甚至还有属性信息查询(城市人口大于100万并且居民人均年收入超过1万)。
空间信息量算包括:质心量算、几何量算、形状量算。
20 ×20 = 400第 3 页共4 页2.空间信息分类这是GIS功能的重要组成部分。
对于线状地物求长度、曲率、方向,对于面状地物求面积、周长、形状、曲率等;求几何体的质心;空间实体间的距离等。
常用的空间信息分类的数学方法有:主成分分析法、层次分析法、系统聚类分析、判别分析等;3. 缓冲区分析缓冲区分析是针对点、线、面等地理实体,自动在其周围建立一定宽度范围的缓冲区多边形。
邻近度描述了地理空间中两个地物距离相近的程度,其确定是空间分析的一个重要手段。
交通沿线或河流沿线的地物有其独特的重要性,公共设施的服务半径,大型水库建设引起的搬迁,铁路、公路以及航运河道对其所穿过区域经济发展的重要性等,均是一个邻近度问题。
缓冲区分析是解决邻近度问题的空间分析工具之一。
所谓缓冲区就是地理空间目标的一种影响范围或服务范围。
4.叠加分析大部分GIS软件是以分层的方式组织地理景观,将地理景观按主题分层提取,同一地区的整个数据层集表达了该地区地理景观的内容。
地理信息系统的叠加分析是将有关主题层组成的数据层面,进行叠加产生一个新数据层面的操作,其结果综合了原来两层或多层要素所具有的属性。
叠加分析不仅包含空间关系的比较,还包含属性关系的比较。
叠加分析可以分为以下几类:视觉信息叠加、点与多边形叠加、线与多边形叠加、多边形叠加、栅格图层叠加。
5.网络分析对地理网络(如交通网络)、城市基础设施网络(如各种网线、电力线、电话线、供排水管线等)进行地理分析和模型化,是地理信息系统中网络分析功能的主要目的。
网络分析是运筹学模型中的一个基本模型,它的根本目的是研究、筹划一项网络工程如何安排,并使其运行效果最好,如一定资源的最佳分配,从一地到另一地的运输费用最低等。
网络分析包括:路径分析(寻求最佳路径)、地址匹配(实质是对地理位置的查询)以及资源分配。
6.空间统计分析GIS得以广泛应用的重要技术支撑之一就是空间统计与分析。
例如,在区域环境质量现状评价工作中,可将地理信息与大气、土壤、水、噪声等环境要素的监测数据结合在一起,利用GIS软件的空间分析模块,对整个区域的环境质量现状进行客观、全面的评价,以反映出区域中受污染的程度以及空间分布情况。
通过叠加分析,可以提取该区域内大气污染布图、噪声分布图;通过缓冲区分析,可显示污染源影响范围等。
可以预见,在构建和谐社会的过程中,GIS 和空间分析技术必将发挥越来越广泛和深刻的作用。
常用方法有:常规统计分析、空间自相关分析、回归分析、趋势分析及专家打分模型等。
图像增强增强图象中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果,针对给定图像的应用场合,有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。