当前位置:文档之家› 气象中的统计方法总结

气象中的统计方法总结

中国近20年来气象统计预报综述中国近20年来气象统计预报综述谢炯光曾琮(广东省气象台)摘要近20年来,多元统计分析方法有了长足的进步,涌现出不少新方法、新技术。

本文着重介绍了近20年来气象统计预报在中国气象业务科研中的一些应用和发展,主要从多元统计分析意义上来选材。

关键词:多元分析、气象统计、预报。

一、前言气象统计预报在中国气象业务预报和科研工作中占有重要的位置,特别是在模式统计释用及中长期预报业务中,统计预报更是扮演着一个重要的角色,多元分析中的回归分析、典型相关分析、EOF分析等更是气象预报和分析不可少缺的工具。

近20年来,气象统计预报在中国取得了长足的发展。

本文主要综述统计方法在气象预报业务中的各个方面的应用及其所取得的一些成绩。

二、多元统计分析在气象预报业务中的应用1、回归分析广东、江西、河北、辽宁等气象局[1]用0、1权重回归、逐步回归、多元回归等方法,得出晴雨MOS预报方程。

1978年曹鸿兴等、史久恩等[2]用逐步回归建立最高、最低气温预报方程。

新疆自治区气象台张家宝等[3]以预报员经验为基础,采用完全预报(Perfect Prog Method)方法,应用0、1权重回归建立了有无寒潮的预报。

上海气象台丁长根、黄家鑫[4]用逐步回归建立U、V和S(全风速)预报方程。

1965年W.F.Massy[5]提出的主成份回归、1970年Hoerl和Kennard[6]提出的岭估计(Ridge estimate)以及Webster等人[7]提出的特征根回归(Latent root regression, LRR)对在回归分析中出现复共线性(Multi-collinearity)有较好的处理。

冯耀煌[8]在预报集成中,应用了岭回归技术,李耀先[ 9]用岭回归作水稻产量年景预测。

魏松林[10]用特征根回归建立长春6-8月平均气温的特征根回归。

Furnialhe 和Wilson提出的穷尽所有回归的算法,比较彻底地解决了最优回归(即最优子集回归)的问题。

张万诚[11]用最优子集回归作低纬高原雨季开始预报。

在气象预报的实际工作中,常要考虑多个自变量(预报因子)与多个因变量(预报量)的关系。

中国数学家张尧庭[12]解决了这一问题的算法,徐一鸣等[13]用多预报量双重筛选逐步回归作台风路径预报,严华生等[14]用多因变量多自变量建立大气环流--区域水稻产量预报。

引入非线性回归是近年来发展的趋势。

冯耀煌等[15]、姜子俊等[16] 提出了一种选择非线性最优预报因子和建立非线性预报方程的方法,可用于长、中短期预报。

近年来由于数值预报模式的频繁更迭,使模式输出统计预报方法受到新的考验,黄嘉佑等[17]介绍了卡尔曼滤波在天气预报中的应用,刘春霞等[18]用此方法制作了广东省冬季的最低气温预报。

近年来,卡尔曼滤波技术在短期气候预测中也得到了应用[19]。

2、判别分析广东省徐闻气象局[20]用二级判别做台风登陆地段的预报。

Fisher、Bayes以及逐步判别等虽然在气象实际中广泛应用,但严格地说,这些方法仅当变量为正态分布时才可应用,Logistic判别对变量的基本假设条件较宽,对未经正态检验的变量应用本方法是可行的,且可用于既有连续变量又有多值离散变量的情形。

吕纯濂等[21] 将Logistic判别引入中国气象界,并研究了二次Logistic判别[22]分析及逐步判别[23]在气象中的应用。

3、相关分析近20年来在气象统计中用得较多的主要有典型相关(CCA)分析和奇异值分解(SVD)方法。

CCA是提取两个气象场的最大线性相关摸态的方法。

朱盛明、祝浩敏[24]在数值预报的解释应用中用典型相关分析提取有物理意义的预报因子作预报方程。

陈嘉玲、谢炯光[25]用典型相关分析作中期冷空气预报。

黄嘉佑[26]用典型相关分析作副高的统计动力预报。

近年来发展了一种新的CCA改进方法,称为典型相关分析的BP(Barnert 和Preisendorfer)方法,在气象统计中也得到了应用[27]。

奇异值分解(SVD)也是提取两个场的最大线性相关摸态的方法,SVD方法可以变成是两个要素场关系的扩大EOF分析。

谢炯光等[28]用奇异值分解方法,求出了广东省前汛期(4-6月)西太平洋场海温与广东省降水场的6对奇异向量,来作汛期降水趋势预报。

江志红等[29]用SVD方法讨论了中国夏半年降水与北太平洋海温异常的关系。

4、气象场的分解及其应用50年代中期由Loreng引入到大气科学研究中的主成份分析以及后来发展的扩展经验正交函数、复经验正交函数、旋转主分量分析、R型、Q型因子分析、对应分析、主震荡型(Principal Oscillation Parterns,PPOS)。

使气象研究及业务水平进入一个更高层次。

4.1 经验正交函数(EOF)分解章基嘉等[30]应用经验正交函数对亚洲500hPa侯平均环流与我国侯平均气温之关系的时空结构进行分析。

用EOF逐年划分自然天气季节,张邦林、丑纪范[31]提出了一种时空综合的经验正交函数分析方法,多数的经验正交函数分解是在标量场上展开的,但风场也用经验正交函数展开,周紫东等[32]、王盘兴[33] ]讨论了气象向量场的经验正交函数展开方法及其应用。

4.2 主成份(主分量)分析及其因子分析气象分析预报中,常要分析许多变量,而变量间往往互有影响,如何从多个变量中找出很少几个综合性的指标代替原来较多的指标,而且所找到的综合指标又能尽可能多地反映原来数据的信息,而且主成份之间又是相互独立的主成份分析。

何敏等[34]用主分量研究了欧亚地区大气环流年际振荡的时空分布特征,谢炯光[35]用主分量与非线性降维和相似综合作广东月降水量分布预报,陈创买等[36]提出一种气候场的主分量逐步回归预报模型,该模型将气候场的预报变成对气候场主分量的预报,并通过相关分析和逐步回归,求得气候场的主分量与各种不同的因子场的主分量因子之间的联系。

用于广东年降水的预报。

4.3 扩展经验正交函数(EEOF)1982年Weare 和Nasstrom[37]提出的EEOF分解可以得到气象场空间分布结构,也可以得到随时间变化空间分布结构的变化。

张先恭等[38]用EEOF做太平洋海表温度与中国降水准3.5年周期变化。

谢炯光[39]提出一种月、季降水预测的新方法,用EEOF分解得到的前期特征向量场,来预测后期的降水场分布特征。

4.4复经验正交函数(CEOF)Rasmusson和Barnetl提出的复经验正交函数(CEOF)[40]能表现出气象场的位相变化及空间传播特征。

黄嘉佑[41]使用复经验正交函数分析中国降水长期变化的准两年周期振动,魏凤英等[42]用CEOF分析了近百年中国东部旱涝的分布及其年际变化特征,符综斌等[43]曾将CEOF分析用于Elnino增暖的振幅和位相变化,毕幕莹[44]用CEOF分析研究了夏季西太平洋副高的振荡。

4.5 因子分析、旋转主因子分析(RPC)将主成份分析向前推进一步,就是因子分析,因子分析又分R型分析和Q型分析两种,我们知道,由于主因子是通过原始变量的线性组合得到的,因而可以了解到其天气意义。

但哪一个主因子的天气意义更重要些,可通过因子荷载矩阵进行分析,一般来说因子荷载矩阵越简单越易解释。

为此,使每个因子的荷载平方按列向0或1两端分化。

使主因子在每个变量上的荷载趋近于1,而在其它变量上的荷载接近于0,这样,就更容易解释主因子的天气意义。

这种变换称为旋转主因子分析,一般分正交旋转与斜交旋转两种方式。

极大方差旋转是正交旋转,是气象预测、科研业务中最常用的旋转方法。

谢炯光等[45]用因子分析和旋转因子分析对西太平洋8个海区进行了分析,对头4个主因子的物理意义进行了初步的解释,进而用它建立了广东省各月降水与海温的预报方程。

黄嘉佑[46]用斜旋主分量分析了我国夏季气温及降水场(1951-1987年)的时空特征,王敬方等[47]用旋转主分量(RPC)方法,分析近40年来我国夏季温度变化的规律。

4.6 对应分析对应分析是一种综合了R型及Q型因子分析特点的多元统计分析技术,黄嘉佑[48]、李麦村等[49]用该方法发现副高逐月变化曲线与赤道海温变化十分相似,谢炯光[50]用对应分析对4-6月逐月的连续变化进行分型,把各月的降水连续变化分为连升型、连降型、降后升型等四型,并利用回归分析作出各型的预报,在前汛期降水趋势和冬半年(1-3月)气温趋势的预测中收到了较好的效果。

4.7 主振荡型(POP)分析主振荡型(POP)是Hasselmamm和Storch在20世纪80年代末提出来的[51]。

章基嘉等[52]对离散化场时间序列推导了主振荡型分析方法的两个导出量:主振荡型(POP)及其伴随相关型(ACP)。

通过热带太平洋SST矩平场时间序列POP及相应区域850hPa风场ACP的计算例子,给出了它们的实际算法。

5 聚类分析郑祖光[53]在首先不能确定用几个因子和分成几类的情况下,提出用变K变N方案。

章基嘉等[54]应用K-均值聚类法对东亚各自然天气季节500hPa平均环流进行分型试验。

在聚类分析中多数的分类样品是相互独立的,分类时彼此是平等的,但在一些问题中,样品的分类是不能打破顺序的。

比如,对某一阶段气象要素数据进行分段以确定不同时段的气候特征。

这种分类,称为分割更为形象一些,Fisher提出了最优分割的算法,谢炯光等[55]利用最优分割,对中国T106数值预报输出产品的各种物理意义明确的预报因子进行最优二分割,挑选出晴雨及有无大于25毫米降水的预报因子,建立概率回归方法,做24-144小时的晴雨,大于25毫米降水的完全概率预报,在业务中收到较好效果。

最优二分割的进一步优化,产生了一种叫做AID的分割算法(Automatic Interaction Detection),利用AID方法,不但可以分类,还可以根据新的样品落区在哪一类作出预报。

AID具有解决一些非线性问题的能力。

谢炯光等[56]据天气学实践选出47个与广东省台风、暴雨关系密切的预报因子,利用AID 方法,进行计算做出台风暴雨的短期预报。

6 谱分析6.1 功率谱李小泉等[57]利用谱分析研究500hPa环流指数的变化,谱分析也常常与其它方法相结合应用于天气分析与预报中,黄嘉佑[58]在研究海温场与太平洋副热带高压之间的关系时使用交叉谱发现,海温不单有明显的两年振动周期,而且这种振动存在于太平洋地区的气压系统中,关系十分密切,它们之间的凝谱平方值高值0.65的临界值。

符淙斌[59]利用协谱与正交谱研究纬向和经向垂直环流强度之间的反相耦合振荡关系。

6.2 最大熵谱分析在连续功率谱估计中,自相关函数估计与样本量大小有关,1967年Burg提出了一种称之为“最大熵”谱估计的方法,具有分辨率高、适用于短序列等优点。

相关主题