基于蒙特卡罗方法的气象问题应用研究冯圆1,龚晓燕2(1. 空军雷达学院 ,武汉 430019;2. 二炮指挥学院,武汉 430012)Email:fy_science@摘要:基于蒙特卡罗方法在气象研究中的应用,本文分析了蒙特卡罗方法的主要计算步骤,列举了该方法在气象中应用的实例,讨论了蒙特卡罗方法在气象领域应用的局限性,展望了该方法在未来气象研究中的应用。
关键词:蒙特卡罗,气象,反演,概率1.引言由于气象问题研究的复杂性,人们很早就认识到在实验的计划和分析中引用统计的方法是必要的。
的确,许多知名的统计专家、学者投身于将统计的方法应用于气象问题。
在过去的几十年里统计科学取得了巨大进步,统计方法和计算技术的革命为气象的进一步发展开阔了前所未有的许多新境界。
例如,对一切不可控制的误差源有效地进行随机化处理、考虑用复杂的统计模式解释显著的效应、用随机化方法减轻空间相关的效应等等。
很多的统计学、概率的方法被广泛应用,如线性最小二乘回归的自适应方法、分对数(logit)回归模型的自适应算法、卡尔曼滤波方法等。
[1]近十年统计学在气象领域的应用得到了更“革命性”的发展,尤其是一些传统的统计方法得到了新的发展。
比如,马尔科夫链蒙特卡罗法(Markov Chain Monte Carlo,MCMC)用于Bayes统计模式、柯克帕特里克(Kirkpatrick)模拟退火方法、罗斯曼(Rothman)模拟退火方法、约翰·霍兰(John Holland)提出和发展的遗传算法等等。
此类算法的基本特征是,对所求问题的同一实例,用同一概率算法求解多次,得到的结果可能完全不同,甚至效果差别相当大。
但通过多次执行反复求解,会使正确性和精确性达到满意的程度,而失败或误差的概率接近任意小。
本文以蒙特卡罗方法在气象研究中的应用为研究对象,探索该方法在气象应用中的发展情况,探求蒙特卡罗方法在气象领域的进一步发展和应用。
2. 蒙特卡罗方法的基本原理2.1蒙特卡罗方法的定义蒙特卡罗方法(Monte Carlo)是用来解决数学和物理问题的非确定性的(概率统计的或随机的)数值方法,也称为统计试验方法,是理论物理学两大主要学科的合并:即随机过程的概率统计理论(用于处理布朗运动或随机游动实验)和位势理论,主要是研究均匀介质的稳定状态。
它是用一系列随机数来近似解决问题的一种方法,是通过寻找一个概率统计的相似体并用实验取样过程来获得该相似体的近似解的处理数学问题的一种手段,也就是说:当所求问题的解是某个事件的概率,或者是某个随机变量的数学期望,或者是与概率、数学期望有关的量时,通过某种试验的方法,得出该事件发生的频率,或者该随机变量若干个具体观察值的算术平均值,通过它得到问题的解。
运用该近似方法所获得的问题的解更接近于物理实验结果,而不是经典数值计算结果[2]。
2.2蒙特卡罗方法的主要计算步骤蒙特卡罗方法的计算过程需要有可得的、服从特定概率分布的、随机选取的数值序列。
该方法既能求解确定性的问题,也能求解随机性问题以及科学研究中的理论问题,比如计算定积分、多重积分问题、特征值问题等。
因此,蒙特卡罗方法的应用一般分为两类即:具有严格确定数学形式的问题和具有统计属性的随机性问题。
不过,一般情况下,使用该方法都遵循以下的计算步骤[3]:1.根据提出的问题构造一个简单、适用的概率模型或随机模型,使问题的解对应于该模型中随机变量的某些特征(如概率、均值和方差等),所构造的模型在主要特征参量方面要与实际问题或系统相一致。
2.根据模型中各个随机变量的分布,在计算机上产生随机数,实现一次模拟过程所需的足够数量的随机数。
通常先产生均匀分布的随机数,然后生成服从某一分布的随机数,方可进行随机模拟试验。
3.根据概率模型的特点和随机变量的分布特性,设计和选取合适的抽样方法,并对每个随机变量进行抽样(包括直接抽样、分层抽样、相关抽样、重要抽样等)。
4.按照所建立的模型进行仿真试验、计算,求出问题的随机解。
5.统计分析模拟试验结果,给出问题的概率解以及解的精度估计。
图1蒙特卡罗方法流程图3. 蒙特卡罗方法在气象中应用随着计算机技术的不断进步,蒙特卡洛方法的应用领域空前的广泛起来。
其中也包括在气象领域的应用。
目前它已能成功解决许多的气象问题,比较早的有Press F用蒙特卡洛方法反演求取地球速度模型和密度模型[4][5]由Sen和Stoffa等人用于一维层状介质的速度和密度反演和一维电测深数据的反演,其工作极大地推动了该方法在气象领域中的应用与研究。
在散射理论方面,[6][7]Reinersman等[8]利用蒙特卡罗模拟的低空大气点扩散函数,并在此基础上对图像进行有效校正,Karl [9] 应用蒙特卡罗方法对海洋与大气耦合进行了辐射传输过程的成功模拟,以及Chervet,Lavigne,Roblin 和Bruscaglioni利用蒙特卡罗方法模拟了不同大气气溶胶条件下的点扩散函数,并在其中讨论了蒙特卡罗模拟中米散射和HG散射相函数之间的一些差异。
在国内,徐希孺 [10]基于假设的大气廓线对大气点扩散函数的模拟,以及薛妍[11]、张涵璐[12]、任小红[13]等人对蒙特卡罗模拟光子辐射传输过程等,都在将蒙特卡罗方法应用于大气光子传输上进行了有效的探索。
在辐射传输方面,以辐射传输方程为依据,蒙特卡罗方法被用以直接模拟辐射传输方程[14],[ 15],[16],[17]。
即将散射过程当成光子和介质中粒子的碰撞过程,两次碰撞之间光子所走的距离与消光系数有关,碰撞后光子将改变前进方向,散射角由相函数确定,对大量光子“行为”跟踪并进行统计就可得具体问题的结果。
其突出优点是:它实际上能够处理任意几何形状下的辐射传输问题,也能处理任意单次散射反照率和各向异性很强的散射相函数,而其它辐射传输解法在这方面有局限性.Plass和Kattawa [17]在1968年就利用蒙特卡罗方法模拟了行星大气的太阳辐射传输。
这种方法也被许多研究者用于研究三维云问题。
孙贤明,韩一平等利用蒙特卡罗方法研究了垂直方向上微物理特性连续变化的降雨融化层的后向散射特性。
[16],[18],同时,Monte Carlo方法也是“求解”辐射传递方程的经典技术之一,其实质并非根据辐射传递方程进行微分积分计算,而是对光与介质中粒子的作用过程进行模拟。
尽管与其他数值技术相比,其速度非常慢,但随着计算机硬件速度的提高,速度对某些海洋光学问题的模拟而言己不是问题,如辐照度垂直剖面分布模拟等。
Monte Carlo的可对任意用辐射公式和离散数值给出的边界条件和参数分布进行模拟;并可望更精确地模拟某些问题,如小角度散射问题。
Monte Carlo有前向模拟和后向模拟两种(Mobley1994,Gordon1 985)。
唐军武[19]等采用的是前向模拟。
后向MC模拟的典型例子,是Gordon(1985)在研究船舶对向下辐照度测量的影响时采用的方法。
对海洋光场的模拟,从模型的出发点来看,可分为二维、三维模型。
如Kirk(1981),Gordon(1989)等人的模型为典型的二维模型,而Morel(1991,1993,1996)的模型为三维模型。
成珂等人[20] 针对蒙特卡洛法计算辐射传热的核心问题,研究了如何正确模拟辐射过程中发射能束的位置、方向、吸收、反射及反射方向,提出了以积分概率分布为基础的算法。
通过对实例模型的计算表明,该算法可用于有曲面和非均匀面的辐射传热系统的计算,且具有收敛快、精度高的优点。
在气候诊断研究和短期气候预测方面,由于预报因子在相当大的程度上决定了预报工具的效果,因此在气候诊断分析与研究中也经常使用合成分析方法。
Livezey等[21]、Erickson[22]和Gordon[23]提出过使用蒙特卡洛检验,国内也有文献介绍[24][25]。
施能等根据数学界的多维统计检验的原理,提出了二维的风场进行统计检验的实施方法,再根据Livezey等与Wolter 等的思路给出进行风场蒙特卡洛的统计检验的方法。
国际上针对不同的全球气候模型(GCM)进行了大量的气候模拟试验,这些模拟结果已经成为未来气候预测的重要依据。
由于地球系统的复杂性和人类认识的局限性,其后模拟预测仍然存在着大量的不确定性,因而模拟结果的应用也存在着一定的不确定性[26]。
近年来,采用蒙特卡罗方法对GCM模拟结果分析,成为认识和诊断发生概率的一个有效途径,已被应用于气候模拟诊断以及不同下垫面对气候变化响应等领域中。
于革等[27]采用蒙特卡罗概率法分析了我国干旱、半干旱地区典型湖泊的水量对未来气候影响的发生概率和可能性。
赵 林等[28] 采用蒙特卡罗台风数值随机模拟的方法,结合上海地区35年来台风连续、逐时观测结果,优化了上海地区台风风场参数取值,蒙特卡罗方法台风数值模拟结果表明,气候模式分析结果与台风气候模式有较大的差别。
在降水量测算及降水诊断方面,刘薇等[29]基于模糊隶属度理论,结合蒙特卡罗方法,定量分析了降雨不确定性在新安江模型中的传播特性及其对流量过程的影响。
用模糊隶属度函数表示降雨量的不确定性,用蒙特卡罗方法把3 h雨量随机解集为1 h数据,以表征降雨时程分布的不确定性影响。
应用新安江模型对褒河流域进行径流模拟。
毛文书等[30]采用、蒙特卡罗显著性检验[31]等多种诊断分析方法,对江淮梅雨的年际一年代际变化特征及其与北太平洋海温的关系进行详细讨论,这对探寻梅雨影响因子强信号,为江淮梅雨预测提供思路和理论依据。
王大钧[32]等研究中采用相对的概念来确定强降水的阈值即:计算出某个站点从1961~2000年雨日的平均降水量,然后求出这些天的降水量之和,再除以有雨的天数,就得出雨的平均降水量,进而算出标准差,最后对其进行蒙特卡洛(Monte Carlo)显著性检验。
覃卫坚等[33]利用近45年广西67个气象站观测资料,使用EOF分析方法对广西云量进行分析,采用蒙特卡罗方法来估计相关系数的临界值,规定当相关系数的绝对值大于0.1、0.O5和0.0l相应的相关系数临界值时,分别被认为气候趋势或相关较显著、显著、很显著。
Liu,J一M [34]、韦庆等[35]将蒙特卡罗(Monte-Carlo)方法应用到吉林省白城地区年降水量预报工作中。
把年降水量作为随机变量来处理。
根据白城地区过去4O年降水资料,提取该地区年降水量变化所蕴含的随机性和统计规律性, 并对该地区未来2O年降水量变化进行了预报。
在雷达回波资料反演大气波导参数方面,Gerstoft工作团队(2003)[36]利用遗传算法对模拟数据进行了反演试验;Yardim等人(2006)[37]采用Bayesian-MarkovChain Monte Carlo 方法反演大气波导折射率参数[38];黄思训等人[39]利用遗传算法、贝叶斯蒙特卡罗方法和改进的遗传算法从模拟雷达观测资料中反演大气波导参数,提出了全新的变分伴随结合正则的蒙特卡罗算法。