当前位置:文档之家› 空间内插方法比较

空间内插方法比较

第15卷第3期2000年6月地球科学进展ADV ANCE IN EARTH SCIEN CESV ol.15 No.3Jun.,2000学术论文空间内插方法比较李 新,程国栋,卢 玲(中国科学院寒区旱区环境与工程研究所,甘肃 兰州 730000)摘 要:空间内插可以分为几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法。

介绍了每一种方法的适用范围、算法和优缺点。

指出没有绝对最优的空间内插方法,必须对数据进行空间探索分析,根据数据的特点,选择最优方法;同时,应对内插结果做严格的检验。

开发通用空间内插软件、智能化内插以及加强相关基础研究将是空间内插研究的重点。

关 键 词:空间内插;空间数据探索分析;地理信息系统中图分类号:P208 文献标识码:A 文章编号:1001—8166(2000)03-0260-061 空间内插根据已知地理空间的特性探索未知地理空间的特性是许多地理研究的第一步,也是地理学的基本问题。

常规方法无法对空间中所有点进行观测,但是我们可以获得一定数量的空间样本,这些样本反映了空间分布的全部或部分特征,并可以据此预测未知地理空间的特征。

在这一意义上,空间内插可以被定义为根据已知的空间数据估计(预测)未知空间的数据值。

其目标可以归纳为:①缺值估计:估计某一点缺失的观测数据,以提高数据密度;②内插等值线:以等值线的形式直观地显示数据的空间分布;③数据格网化:把无规则分布的空间数据内插为规则分布的空间数据集,如规则矩形格网、三角网等。

空间内插对于观测台站十分稀少,而台站分布又非常不合理的地区具有十分重要的实际意义。

这些地区的常规观测常常不能满足要求,在这种情况下,利用有限的常规观测估计合理的空间分布,或尽可能地提高数据密度就成为迫切要求。

在这些方面,缺值估计和数据格网化将发挥重要的作用。

(1)缺值估计。

各种科学考察中形式多样的短期观测是提高数据观测密度的重要方式,无形中起到了加密台站的作用;而且由于这些考察常常到达人迹罕至的高海拔和极地等区域,有助于了解区域内观测变量的完整空间分布。

但是,这些观测序列往往很短,短则数十天,长不过几年。

如何利用周围台站的长序列观测资料和短期观测本身的信息,将观测变量插补到长序列是一个重要问题。

(2)数据格网化。

规则格网能够更好地反映连续分布的空间现象,并对他们的变化作出模拟。

现代地球科学模型和气候模型,如GCM(一般环流模型),都要求与GIS数据模型和遥感数据高度兼容的空间数据集。

格网化的数据,尤其是规则矩形格网,已成为目前地学模型的主要数据形式。

因此,对已知观测台站的观测数据进行空间内插,得到格网化数据是模型的第一步。

空间内插一般包括这样几个过程〔1〕:①内插方法(模型)的选择;②空间数据的探索分析,包括对数据的均值、方差、协方差、独立性和变异函数的估计等;③内插方法评价;④重新选择内插方法,直到合理;⑤内插。

因此,通过比较而选择一个合用的、适合于数据空间分布特点的内插方法是空间内插的关键。

本文将空间内插分类为几何方法、统计方法、空间统计方中国科学院特别经费支持领域项目“冰冻圈基础研究”(编号:KJ-B-2-102)资助。

第一作者简介:李新,男,1969年10月生于甘肃酒泉,副研究员,主要从事地理信息系统和遥感在冰冻圈和水资源研究中的应用。

收稿日期:1999-08-19;修回日期:1999-11-03。

法、函数方法、随机模拟方法、物理模型模拟方法和综合方法,通过比较研究,指出每一种方法的适用范围、算法和优缺点。

2 空间内插方法比较空间内插可依据:①确定或随机;②点与面;③全局或局部等标准分类〔2~4〕。

本文依据内插方法的基本假设和数学本质,把空间内插分类为以下几种方法。

2.1 几何方法是最简单的空间内插方法。

几何方法基于“地理学第一定律”〔5〕的基本假设,即邻近的区域比距离远的区域更相似。

几何方法的优点是计算开销少,具有普适性,不需要根据数据的特点对方法加以调整。

当样本数据的密度足够大时,几何方法一般能达到满意的精度。

几何方法的最大问题是,无法对误差进行理论估计。

最常用的几何方法有泰森多边形(最近距离法)和反距离加权方法。

2.1.1 泰森多边形(最近距离法)泰森多边形用于生成“领地”或控制区域。

实际上,尽管泰森多边形产生于气候学领域,它却特别适合于专题数据的内插,因为它生成专题与专题之间明显的边界,不会有不同级别之间的中间现象。

泰森多边形的算法非常简单,未采样点的值等于与它距离最近的采样点的值。

2.1.2 反距离加权方法反距离加权法是最常用的空间内插方法之一。

它认为与未采样点距离最近的若干个点对未采样点值的贡献最大,其贡献与距离成反比。

可用下式表示:Z=΢ni=11(D i)pZ i΢ni=11(D i)p(1)式中,Z是估计值,Z i是第i(i=1,…,n)个样本,D i 是距离,p是距离的幂,它显著影响内插的结果,它的选择标准是最小平均绝对误差。

Husar等〔6〕的研究结果表明,幂越高,内插结果越具有平滑的效果。

2.2 统计方法其基本假设是,一系列空间数据相互相关,预测值的趋势和周期是与它相关的其它变量的函数。

统计方法的优点是计算开销不大,有一定的理论基础,能够对误差作出整体上的估计。

但是,其前提是一定要有好的采样设计,如果采样过程不能反映出表面变化的重要因素,如周期性和趋势,则内插一定不能取得好的效果〔1,7〕。

常用的统计方法有趋势面方法和多元回归方法。

2.2.1 趋势面趋势面根据有限的观测数据拟合曲面,进行内插。

它适用于:①能以空间的视点诠释趋势和残差;②观测有限,内插也基于有限的数据。

当趋势和残差分别能与区域和局部尺度的空间过程相联系时,趋势面分析最有用〔8〕。

趋势面方法可以被定义为:y=Aθ+e(2)式中,y是n×1维矩阵,对应于n个样本;A是n个样本的坐标矩阵;θ是趋势面参数矩阵。

A和θ依赖于趋势面的次数。

趋势面的次数是它最重要的特征。

e是残差,通常是一个独立随机变量。

当残差是随机独立时,统计检验有效;但实际上,趋势面中的残差常是自相关(特别是趋势面的次数较低时),因此,检验是显著有偏差的。

残差的空间自相关可以用随机过程模型模拟。

由于趋势面的以上特性,它的目标有时并非最佳拟合,而是把数据分成区域趋势组分和局部的残差。

2.2.2 多元回归在各种统计方法中,使用较多的是回归分析,其特点是不需要分布的先验知识。

多元回归在数学形式上与趋势面很相似,但是,它们又有着显著的不同。

首先,在趋势面分析中,A 是坐标矩阵,而在回归分析中,它可以是任意变量。

其次,在趋势面方法中,模型的拟合严格地遵从自常数、一次、二次、立方等的顺序,主要的问题是确定模型的次数,因此,趋势面分析有内在的多重共线性问题;而在多元回归中,尽管也存在多重共线性,但它并非内在的,可以通过逐步回归解决,因此,相对于趋势面的选择次数,多元回归的核心问题是选择变量(主成分分析等方法有助于选择变量)和区分模型。

2.3 空间统计(Geostatistics)方法空间统计又称地质统计学,于20世纪50年代初开始形成,60年代在法国统计学家M athero n的大量理论研究工作基础上逐渐趋于成熟〔9,10〕。

其基本假设是建立在空间相关的先验模型之上的。

假定空间随机变量具有二阶平稳性,或者是服从空间统计的本征假设(intrinsic hypo thesis)〔1,11~15〕。

则它具有这样的性质:距离较近的采样点比距离远的采样点更相似,相似的程度、或空间协方差的大小,是通过点对的平均方差度量的。

点对差异的方差大小只与采样点间的距离有关,而与它们的绝对位置无关。

空间统计内插的最大优点是以空间统计学作为其坚261第3期 李 新等:空间内插方法比较 实的理论基础,可以克服内插中误差难以分析的问题,能够对误差做出逐点的理论估计;它也不会产生回归分析的边界效应。

缺点是复杂,计算量大,尤其是变异函数(v ariog ram )是几个标准变异函数模型的组合时,计算量很大;另一个缺点是变异函数需要根据经验人为选定。

空间统计方法以Kriging 及其各种变种(Co kriging 等)为代表。

2.3.1 Kriging 内插(1)Kriging 内插的公式Kriging 内插由南非地质学家Krige 发明,并因此而命名。

Ma theron 〔16〕给出了Kriging 的一般公式。

Kriging 内插的公式为:z ⌒(x 0)=΢ni =1λi z (x i )(3)式中,z (x i )为观测值,它们分别位于区域内x i 位置;x 0是一个未采样点;λi 为权,并且其和等于1。

即΢ni =1λi =1(4)选取λi ,使z ⌒(x 0)的估计无偏,并且使方差e ⌒2e 小于任意观测值线形组合的方差。

最小方差由下式给定:e ⌒2e=΢ni =1λi V (x i ,x 0)+h (5)它由下式得到:΢n i =1λi V (x i ,x j )+h =V (x j ,x 0) j (6)式中,V (x i ,x j )是z 在采样点x i 和x j 之间的半方差(semi-v ariance),V (x j ,x 0)是z 在采样点x i 和未知点x 0之间的半方差,这些量都从适宜的变异函数得到。

h 是极小化处理时的拉格朗日乘数。

估计半方差是一个较为复杂的过程,这一过程称为空间数据探索分析(ESDA )。

(2)空间数据探索分析(ESDA)对于Kriging 内插而言,空间数据探索分析的目标是建立半方差V (h )和点对之间的空间距离h 之间的关系,即变异函数。

由于空间统计的本征假设可以表示为以下两个公式:·任意两个距离为h 的两点间的差值的数学期望为0:E 〔Z (x )-Z (x +h )〕=0(7) ·任意两个距离为h 的两点间的差值的方差最小:Var 〔Z (x )-Z (x +h )〕=E{〔X ′(x )-X ′(x +h )〕2}=2V (h )(8)因此,由下式估计半方差γ(h ):V (h )=12n E n i =1〔z (x i +h )〕2(9)这一关系即变异函数。

它提供了内插、优化采样的有用信息。

Krig ing 内插的第一步是根据样本找到适合的变异函数理论模型。

最常用的变异函数模型有:nugg et 、球面、指数、高斯、阻尼正弦、幂和线形模型。

其中,前几种模型在一定的范围内达到极大方差,而线形模型的方差增长没有极限。

以下是几种基本变异函数的形式〔1,17〕,这些变异函数的特性分别是:·Nugg et 模型 缺乏空间相关。

·球面模型 空间相关随距离的增长逐渐衰减,当距离>θ后,空间相关消失。

相关主题