气温统计分析方法
滑动 t 检验
对于时间序列 x(n个样本量),人为设置某一时刻为基 准点,基准点前后两段子序列 x1 和 x2 的样本分别为n1和n2, 两段子序列平均值分别为x1和x2,方差分别为s12和s22。 定义统计量:
x1 x2 t 1 1 s n1 n2
s
2 2 n1s1 n2 s2 n1 n2 2
超过临界线的范围确定为出现突变的时间 区域。
如果UFk和UBk两条曲线出现交点,且交点 在临界线之间,那么交点对应的时刻便是突变 开始的时间。
j 1,2,, i
可见,秩序列sk是第i时刻数值大于j时刻数值个数的累计 数。在时间序列随机独立的假定下,定义统计量
sk E ( sk ) UFk Var( sk )
k (k 1) E ( sk ) 4
k 1,2,, n
式中UF1=0,E(sk),Var(sk)是累计数sk的均值和方差, 在x1,x2,…,xn相互独立,且有相同连续分布时,由下式算:
五点二次平滑
实例:
对北京1951-1996年夏季降水量进行九点二次平滑。样 本量n=46,平滑后仍得到46个平滑值。 九点二次平滑曲线显然不像11年滑动平均曲线那么光 滑了,除显现出20世纪60年代末至70年代初降水量的下降趋 势外,还保留了几次明显的波动。如 70年代至90年代,相对少雨阶段,曾经历了 两次几年周期的振动。可见,滑动长度选取得不
滑动 t 检验
计算结果分析:
根据t统计量曲线上的点是否超过ta值来判 断序列是否出现过突变,如果出现过突变,确 定出大致的时间。 另外,根据诊断出的突变点分析突变前后 序列的变化趋势。
滑动 t 检验
实例:
用滑动t检验检测1911-1995年中国年平均气温等 级序列的突变(n=85) 。两子序列长度nl=n2=10。 给定显著性水平α=0.01,按t分布自由度ν=n1+n2– 2=18,t0.01=±2.898。 为便于编制程序,给定t0.01=±3.20,实际上给出 了更严格的显著性水平。将计算出的t统计量序列和 t0.01=±3.20绘成图。
同,得到的变化趋势会有差别。因此,根据分析的
目的和对象选取恰当的平滑时段是很重要的。
滑动 t 检验
方法概述:
滑动t检验是通过考察两组样本平均值的差异是否显著 来检验突变。
基本思想
把气候序列中两段子序列均值有无显著差异作为来自两 个总体均值有无显著差异的问题来检验。如果两段子序列的 均值差异超过了一定的显著性水平,可以认为均值发生了质 变,有突变发生。
短于滑动长度的周期大大削弱, 显现出变化趋势。
计算步骤:
根据具体问题的要求及样本量大小确定 滑动长度k, 用方程直接计算序列(观测数据) 的滑动平均值。 n 个数据可以得到 n–k+1个平滑值。
计算结果分析:
分析时主要从滑动平均序列曲线图来诊断其变化 趋势。看其演变趋势有几次明显的波动,是呈上升趋 势还是呈下降趋势。
20 世纪70年代初降至低点后变化平缓, 处于少雨阶段,并持续至今,虽有小的波动, 但 没有出现明显的上升或下降趋势。
五点二次平滑
方法概述:
对时间序列 x 作五点二次平滑,其作用与滑动平 均一样,亦是起到低通滤波器的作用,以展示其变 化趋势,它可以克服滑动平均削弱过多波幅的缺点。 对于时间序列x,用二次多项式拟合:
从图中看出,自1920年以来,t统计量有两处超过0.01显 著性水平,一处是正值(出现在1920年),另一处是负值(出现 在1950年)。 说明中国年平均气温在近85年,出现过两次明显的突变。 20年代经历了一次由冷到暖的转变,50年代经历了一次由增 暖转为变冷的明显突变,尽管70年代末80年代初,中国气温 与全球气温同步在回升,但没有达到显著性水平。
气候诊断及预测实习
目的:
从气候的时间序列中分离出气候变化趋势, 并应用滑动t-检验及Mann-Kendall方法进行气候 突变检测。
要求:
使用Fortran程序进行资料处理,对运 算结果利用Grads或Excel等技术进行绘图, 解释图中的等值线的气侯学意义。
气候诊断与预测技术
内容: 利用全国160站月气温和降水资料,应用 线性倾向估计、滑动平均、二次平滑等技术, 分离出气温场及降水场中的气候变化趋势; 应用滑动t-检验或Mann-Kendall方法判 断气候序列中是否存在气候突变,如果存在, 确定出突变发生的时间。
实例:
计算北京 l951-1996 年夏季 降水量的11年滑动平均。 样本量n=46, 滑动平均后得到46–11+1=36 个平滑值。 北京 l951-1996 年夏季( 6-8月 ) 降水量
年份 1951—1960 1961—1970 1971—1980 1981—1990 1991—1996 249 411 383 293 559 404 285 228 466 364 490 660 528 319 404 848 520 372 382 697
原始数据 621 185 357 620 385 859 448 578 509 612 382 484 529 469 452 204 511 545 1170 675 554 268 410 456 243 384
图中虚线为滑动平均曲线。
可以看出:
20世纪50年代中期至60年代未,北京夏季 降水量呈逐渐下降趋 势。
i
计算结果分析: 对于线性回归计算结果,主要分析回归 系数 b 和相关系数 r。
相关系数 r:
(表示变量x与时间t之间线性相关的密切程度)
当 r=0 时, b=0, 说明x的变化与时间t无关;
当 r>0 时, b>0, 说明x随时间t呈上升趋势;
当 r<0 时, b<0, 说明x随时间t呈下降趋势。
1 t ti n i 1 i 1 2 n n 1 2 xi xi n i 1 i 1
n 2 i n 2
r b
计算步骤: (1) 对变量 xi 构造其对应 t 的时间的序 i 列。 t 可以是年份;也可以是序号。
i
(2) 求回归系数 b, 回归常数α 及相关 系数r (3) 将 a 和 b 代入方程, 求出回归计 算值 x ˆ。
方程遵从自由度ν=n1+n2–2的t分布。
滑动 t 检验
该方法的缺点是子序列时段的选择带有人为性。 为避免任意选择子序列长度造成突变点的漂移, 具体使用这一方法时,可以反复变动子序列长度进 行试验比较,提高计算结果的可靠性。
滑动 t 检验
计算步骤:
(1)确定基准点前后两子序列的长度,一般取相 同长度,即 n1=n2。 (2)采取滑动的办法连续设置基准点,依次按方 程计算统计量。由于进行滑动的连续计算,可得到 统计量序列 ti,i=1,2,…,n–(n1+n2)+1。 (3)给定显著性水平α,查t分布表得到临界值ta, 若|ti|<ta,则认为基准点前后的两子序列均值无显著 差异,否则认为在基准点时刻出现了突变。
k (k 1)( 2k 5) Var ( sk ) 72
UFk为标准正态分布,它是按时间序列x 顺序x1,x2,…,xn计算出的统计量序列,给定显 著性水平α,查正态分布表,若 |UFk|>Ua, 则表明序列存在明显的趋势变化。 按时间序列x逆序xn,xn-1,…,x1,再重复上 述过程,同时使UBk= –UFk,k=n,n–1,…,1), UB1=0。 这一方法的优点:计算简便,可明确突变 开始的时间,并指出突变区域。
Mann—Kenddall 检验
Mann—Kenddall 的检验方法是非参数方 法。其优点是不需要样本遵从一定的分布,也 不受少数异常值的干扰,更适用于类型变量和 顺序变量,计算也比较简便。
方法概述:
对于具有n个样本量的时间序列X,构造一秩序列:
sk ri
i 1
k
1 xi x j ri 0 else
气候诊断与预测技术
内容: (1)线性倾向估计
(2)滑动平均
(3)五点二次平滑
(4)滑动t-检验
(5)Mann-Kendall突变检测
线性倾向估计
方法概述:
对观测序列 x,建立 性回归方程:
xi与 t i 之间的一元线
ˆi a bti x
式中
i 1,2,, n
b 回归系数
a 为回归常数
分析代表华北整个区域干旱状况的干旱指 数的变化趋势。n=45, *计算求出
a =40.7602, b =-0.0182, r=-0.3395,
*将a和b代入方程,求出
ˆi = 40.7602 - 0.0182 t i x
*绘制出线性趋势图。
结论:
该地区夏季干旱指数呈下降趋势,相关 系数|r|> r0.05=0.2875,表明这种下降趋势在 α =0.05 显著性水平上是显著的。
在编制程序计算时,设计计算五点二次 平滑的子程序,每个子程序含有计算n–k+1 个平滑值及端点平滑值过程。在主程序中用 条件语句控制执行指定平滑点数的子程序。
五点二次平滑
五点二次平滑公式: 1 ˆi 2 x (31xi 2 9 xi 1 3 xi 5 xi 1 3 xi 2 ) 35 1 ˆi 1 x (9 xi 2 13xi 1 12xi 6 xi 1 5 xi 2 ) 35 1 ˆi x (3 xi 2 12xi 1 17xi 12xi 1 3 xi 2 ) 35 1 ˆi 1 x (5 xi 2 6 xi 1 12xi 13xi 1 9 xi 2 ) 35 1 ˆi 2 x (3 xi 2 5 xi 1 3 xi 9 xi 1 31xi 2 ) 35
根据最小二乘法,有: