地球物理学中的反演问题1、介绍物理科学的一个重要的方面是根据数据对物理参数做出推断。
通常,物理定律提供了计算给定模型的数据值的方法,这就被称为“正演问题”,见图-1。
在反演问题中,我们的目标是根据一组测量值重建物理模型。
在理想情况下,存在一个确定的理论规定了这些数据应该怎样转换从而重现该模型。
从选择的一些例子来看,这样一个存在的理论假定了(我们)所需要的无限的、无噪声的数据是可以获得的。
在一个空间维度中,当所有能量的反射系数已知时,量子力学势能可以被重建[Marchenko,1955; Brurridge,1980]。
这种手法可以推广到三维空间[Newton,1989],但是在那样的情形下要求有多余数据组,其中的原因并不是很理解。
在一条一维的线上的质量密度可以通过对它的所有本征频率的测量来构建[Borg,1946],但是因为这个问题的对称性,因而只有偶数部分的质量密度可以被确定。
如果(地下的)地震波速只和深度有关,那么根据地震波的距离,运用阿贝尔变换,这个速度可以通过测定震波的抵达时间来精确构建[Herglotz,1907;Wiechert,1907]。
从数学上看,这个问题和构建三维空间中的球对称量子力学势是相同的[Keller et al.,1956]。
然而,当波速随着深度单调增加时,Herglotz-Wiechert的构建法只能给出唯一解[Gerver and Markushevitch,1966]。
这种情况和量子力学是相似的,在量子力学中,当电势没有局部最小值时,径向对称势只能被唯一建立[Sabatier,1973]。
(量子力学相关概念不熟悉,翻译起来有点坑~~)图-1尽管精确非线性反演法在数学表达上是美妙的,但它们的适用性是有限的。
原因有很多。
第一,精确的反演法通常只在理想状态下适用,这在实际中可能无法保持。
比如,Herglotz-Wiechert反演假定了地下的波速只依赖于深度并且随着深度单调增加。
地震层析成像显示这两点要求在地幔层都不满足[Nolet et al.,1994]。
第二,精确反演方法常常很不稳定。
Dorren et al[1994]已经清楚地展示了Marchenko方程解中这种不稳定性的存在。
然而,第三个原因是最根本的。
在很多反演问题中,我们要确定的模型是空间变量的一个连续函数。
这意味着该模型有无穷多的自由度。
然而,在实际实验中,能够用来确定模型的数据数量通常都是有限的。
通过变量的简单计算表明这些数据不能承担足够的信息来唯一确定模型。
在线性反演问题的背景下,Backus 和 Gilbert[1967,1968]提出了这一观点,之后Parker[1994]也提出来这点。
这个问题对于非线性反演问题同样相关。
在实际实验中有限多的数据可以用来重建具有无穷多自由度的模型这样的事实必然表明反演问题不是唯一的,在这个意义上讲,有很多模型同样可以很好地解释这些数据。
因此,从数据反演中得到的模型不一定等于我们想要的真实模型。
这意味着图1中展示的反演问题的观点太简单了。
对于现实问题,反演实际上包含两步。
用m表示真实模型,d表示数据。
由数据d我们得到一个估计的模型m~,这一步称为估计问题(estimation problem),看图2。
除了估计一个和数据一致的模型m~,我们也需要探究估计模型m~和真实模型m具有什么关系。
在评价问题中,我们会确定估计模型获得了真实模型的哪些性质以及附带了哪些误差。
这部分讨论的实质就是反演=估计+评价。
当我们作出一个物理解释却不承认模型中存在误差的事实以及有限的精度,这是没有多少意义的 [Trampert, 1998]。
图-2通常来说,有两个原因可以解释为什么估计模型跟真实模型不同。
第一个原因是反演问题的非唯一性,这使得一些(通常是无穷多的)模型满足这些数据。
从技术上来讲,这个模型因为模型空间的不充分取样所以零空间存在。
第二个原因是实际数据(以及物理理论比我们想要的更频繁)总是受到误差的污染,所以估计模型也受到这些误差的污染。
所以模型评价有两个方面,非唯一性和误差传播。
模型估计和模型评价对于具有有限自由度的离散模型和具有无穷多自由度的连续模型在根本上是不同的。
而且,模型评价的问题只有在线性反演问题上得到很好的解决。
因此,离散模型和连续模型的反演是分开处理的。
线性反演和非线性反演的情况也是分开处理的。
在第2节将讨论有限数量模型参数的线性反演。
在第3节中将推广为处理带有无穷多自由度的连续模型的线性反演问题。
实际上,很多反演问题都不完全是线性的,但是这些问题常常可以通过做一些适当的近似来线性化。
在第4节中将推导出单次散射近似。
这种方法形成了运用于反射地震学中的成像工具的基础。
Rayleigh原理将在第5节介绍,它是关于线性化的,构成了使用正则模态频率对地球结构进行反演的基础。
地震波传播时间层析的线性化方法是基于Fermat原理的,这将在第6节介绍。
非线性反演问题要明显难于线性反演问题。
第7节将会说明非线性可能是不适定性的一个来源。
目前,对于非线性反演问题的评价问题还没有令人满意的理论。
在第8节将会介绍三种可用于非线性评价问题的方法。
然而,这些方法没有一个是非常令人满意的,表明非线性反演理论是一个有重要研究挑战的领域。
2、解有限的线性方程组在前面的章节中讨论过,反演问题将有限的数据映射到一个模型上。
在地球物理学大多数实际应用中,该模型是空间坐标的一个连续函数,因此具有无穷多的自由度。
我们暂时忽略这点并假定该模型的特征可以由有限个参数确定。
我们将回到这些模型的重要情形,在第3节中这些模型会是无限维的。
2.1 线性模型估计对于一个有限维的模型,模型参数可以规定为向量m,类似地,数据可以规定为向量d。
矩阵A通过乘积Am将数据关联到模型上。
这个矩阵常常被称为理论算子。
确实,在给定的问题上,它包含了我们选择给模型的所有物理和数学信息。
实际上,这些数据包含了误差e,因此记录的数据和该模型的关系应该是:=(1)d+Ame有一点需要经常注意的是,我们对于包含在模型向量m中的模型参数的选择有某种武断性。
例如,若想要描述地球的密度,我们可以选择一个模型,在该模型中,地幔和地核具有均匀密度,在这种情况下存在两个模型参数。
或者,我们可以把大量定义在球体上的特征方程中的地球密度展开,比如描述横向变化的球谐函数以及描述深度方向变化的多项式,这种情况会有更多的模型参数。
在同一个模型上的这两种不同参数化方法对应于不同的模型参数m和不同的矩阵A。
这个例子表明模型m不一定是真实的模型,但是对模型参数的选择通常包含了对于所能构建的模型的等级的限制。
以下我们将把m认为是真模型,虽然对于它的定义存在很多困难。
由记录的数据我们得到模型的一个估计。
因为这个估计实际上跟真模型是不同的,我们用m~来表示估计模型。
有很多方法来设计一个逆运算将数据映射到估计模型上[e.g. Menke,1984;Tarantola,1987;Parker,1994]。
无论选择什么估计量,从数据到估计模型之间最一般的线性映射可以写做~(2)=dAm g-算子g A -称为矩阵A 的广义逆。
一般来说,数据的数量不等于模型参数的数量。
因此,A 通常是一个非方阵矩阵,所以它的正常逆矩阵是不存在的。
随后我们将说明广义逆矩阵g A -如何来选择,但目前g A -并不需要作详细说明。
被估计模型m~与真模型m 之间的关系遵循如下表达式(将等式(1)代入等式(2))e A Am A mg g --+=~ (3) 矩阵A A g -称为精度矩阵(resolution kernel ),这个算子被定义为A A R g -≡ (4)表达式(3)可以写成下列形式来进行解释{误差部分有限分辨率e A m I A A m m g g --+-+=4434421)(~ (5) 在理想情况下,估计模型等于真模型向量:m m=~表示我们选择的参数(列在向量m 中)可以被相互独立估计。
等式(5)中最后两项分别解释了估计模型中的模糊度(blurring )和伪差(artifacts )。
m I A A g )(--描述了估计模型向量的元素是真模型向量不同元素的线性组合。
我们只能取得模型估计中的参数平均值和模糊度,因为我们无法映射出最完美的细节。
在理想情况下,这一项是为零的,此时A A g -等于单位矩阵。
由(4)可知,对于完美解决的模型参数,精度矩阵为单位矩阵,即I R = (6)如前所述,通常定义向量m 的模型参数的定义存在某种歧义。
精度算子告诉了我们在估计过程中我们可以独立获得的模型参数的程度。
但是,精度矩阵并没有完全告诉我们估计模型和真实的潜在物理模型之间的关系是什么,因为它没有考虑模型参数的选择对于在估计过程中能够得到的模型的限制程度。
表达式(5)中的最后一项描述了误差e 是怎样映射到估计模型上去的。
这些误差并不确知,否则它们就能从数据中减去。
因为数据中存在误差,所以需要一个统计分析来描述估计模型中的这些误差。
当数据j d 不相关且有标准差j d σ,则根据数据误差传播,模型估计i m ~中的标准差i m σ表达为22)(∑-=j d g ij m ji A σσ (7) 理想上来看,我们希望同时获得:一个完美的精度,以及不存在误差的估计模型。
不幸的是,实际上这是不可能实现的。
比如,使用广义逆阵0=-g A 完全抑制了误差传播。
这导致(荒谬的)估计模型0~=m,这样确实不受误差的影响。
但是,这个特殊的广义逆阵对应的精度矩阵是0=R ,显然这和理想的精度矩阵I R =相去甚远。
因此,实际上我们需要在误差传播和精度限制之间找到一个可接受的平衡点。
2.2 最小二乘估计我们现在来考虑这样的情况:独立数据的数量多于未知数的数量。
在这种情况下,等式Am d =不总是对任意给定的模型m 都满足,因为数据向量中包含的可能误差使得方程左右矛盾。
例如,我们来考虑下面的问题。
我们有两个物块质量分别是1m 和2m 。
第一个物块的称重得出1千克质量。
某人测量第二个物块,结果得出2千克质量。
接下来,某人把两个物块放在一起称重,结果发现总质量是2千克。
这个问题中测量的结果可以用下列方程组表示111==d m222==d m (8)2321==+d m m相应的矩阵A 表示为⎪⎪⎪⎭⎫ ⎝⎛=111001A(9)显然,这个方程组是不能满足的。
不可能第一个物块质量是11=m ,第二个物块的质量是22=m ,而它们的质量之和221=+m m 。
显然测量中存在误差,但是没理由舍弃三个方程中的一个而去支持另外两个。
图3(略)生动地阐述了这个问题。
在)(21,m m 平面中,三个方程对应三条实线。
三条线不相交于同一点表示这个线性方程组存在矛盾。
所以,采用合理的方法调和这些方程是确定两个物块质量的反演问题的一部分。