第一章 气象资料及其表示方法 1、 平均值2、 距平 含义:反映数据偏离平均值的状况 距平序列:单要素样本中每个样本资料点的距平值组成的序列称为距平序列,也可以记为距平向量。
3、中心化的概念:把资料处理为距平的方法叫中心化。
气象上常用距平值代替原样本中的资料值作为研究对象。
4、 中心化的必要性:因为气象要素的年变化周期影响很大,各月的平均值不一样,为了使之能在同一水平下比较,常使用距平值(比如之前的举例)。
5、中心化的特性:距平值的平均值为/偏低)。
6、方差和均方差(标准差) 对气象要素x,资料长度n, 含义:S X 是均方差,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度),S X 2是方差。
7、 方差和均方差(标准差)气象上的应用:1)如果12月份气温标准差比1月份大,反映了12月份气温随时间变化幅度比1月大。
2)对于同一个月,如果南京气温的标准差比北京小,说明北京气温变化幅度大。
(内陆日变化较沿海大,这个日变化大小的比较就使用标准差比较的)3)均方差小的要素预报比大的容易。
均方差越大,变量不确定性越大,预报越困难。
4)变量减去某常数后均方差相同。
8、累积频率:变量小于某上限的次数与总次数之比。
(样本特征—直方图)9、总体(母体):统计分析对象的全体。
样本:总体中的一部分。
10、为何要进行标准化?各要素单位不同、平均值和标准差也不同。
为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量----标准化变量。
Sx X Xt Xzt /)(-=目的:为了消去单位量纲不同所造成的影响。
正态化的必要性:各类统计预报模型和统计检验方法(F,t,u,X 2检验)要求资料是符合正态分布 正态化的处理方法:立方根或四次方根;双曲正切转换;化为有序数后的正态化转换(标准化和正态化)11、标准化变量的平均值为0。
标准化变量的方差为1。
12、峰度系数与偏度系数峰度系数与偏度系数是用来衡量随机变量分布密度曲线形状的数字特征,描述了气候变量的分布特征。
偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。
峰度系数:表征分布形态图形顶峰的凸平度(即渐进于横轴的陡度)。
13、标准偏度系数和峰度系数的计算公式为:偏:∑=-=n t t s x x 131)/)((1/6n g 峰:]3)/)((/1[n/24g 142∑=--=n t t s x x n s 为标准差14、状态资料(离散型随机变量):表征气象要素的各种状态,观测结果无法用数据表示。
15、对样本而言是频率表,总体而言就是分布列。
16、两个方面来研究问题:“R 型分析”:研究不同变量(要素)或同一要素不同格点之间的关系(行)。
“Q 型分析”:研究样本之间的关系(列)。
1718、协方差气象意义的进一步理解: 1或者两个变量的正、负相关关系。
如理解(气温为例):前冬气温负距平(冷)、后冬正距平(暖)---协方差负值----反相关;前冬气温正距平(暖)、后冬正距平(暖)----协方差正值----正相关2)变量自身的协方差就是方差。
19、协方差矩阵 T X nX S ''/1=,对角线元素是第i 个变量的方差,撇号代表距平。
20、区域资料的整理的三种方法:(1)代表站方法---平均相关系数最大的站(2)区域平均法:区域平均值要与周围格点(站点)值区别大(3)综合指数法(各站点要素方差差异较大)K 越大,异常越明显。
21、资料的订正:插补、纠正、延长22、资料的误差:1)抽样误差2)观测误差:系统误差(仪器不良);偶然误差(操作不慎);随机误差(四舍五入)23、资料的质量要求:准确性和精确性;均一性;代表性;比较性24、资料的审查分为两类:技术性检查;合理性25、气象资料的订正方法:回归订正法(关系密切的站);差值订正法(地理环境近似一致的站点);比值订正法(两站降水比值为准常数)第二章 选择最大信息的预报因子1、天气预报指标必须满足两个经验性的条件(1)P(A/B)>>P(A)或者P(A/B)<<P(A),A/B 之间有一定联系(2)P(A/B)-->1或P(A/B)-->0,预报指标有一定准确率2、二分类预报:只预报事件A 出现或者不出现(非A ),又称为正反预报。
设P(A)=p ,P(非A)=q ,p +q =1符合二项分布的条件:每次试验只有两个结果;试验条件不变,每次实验结果一样;试验的独立性。
用于计算天气现象出现的概率特别是小概率事件,天气预报指标的检验。
3、状态要素:可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。
定量数据要素:主要用相关系数选择预报因子或因子集,并用t 检验方法检验其可靠性。
4、样本相关是否意味着总体相关?正态总体的相关检验实质上是两个变量间或不同时刻间观测数据的独立性检验。
所谓相关检验,就是检验 ρ=0的假设是否显著 。
在假设总体相关系数ρ=0成立条件下,样本相关系数r 的概率密度函数正好是t 分布的密度函数。
于是,就可以用t 5、t 检验 在原假设ρ=0的条件下,统计量 n -2的t 分布。
给定∑∞-∞==j yy xx j R j R T )()()(1.22.1y y rr信度α 和样本相关系数r ,根据自由度查出ta,若|t|大于等于ta ,即否定ρ=0,总体相关;反之接受ρ=0,总体非相关。
6、由ta 计算出ra 故有 式中, ra 实际应用中,若已知自由度(n-27、自相关系数:衡量气象要素不同时刻之间的关系密切程度的量是自协方差和自相关系数。
8、落后交叉协方差和相关系数:衡量两个变量不同时刻之间的相关密切程度的量,常用落后交叉协方差和落后交叉相关系数表示。
9、高自相关变量间的相关系数及其统计检验:(1)两个变量无持续性(非高自相关)t 检验(2)两变量本身有强持续性或高自相关,t 检验的自由度不能用,需要计算有效自由度n/T ,其中10、偏相关系数:当存在三个以上变量互相影响时(如考虑y 和x1、x2之间的关系),需要考虑消除了x1(x2)影响后,x2(x1)与y 的相关关系,这时候的相关系数称为偏相关系数,记为 11、简单相关系数:描述两个变量线性相关的统计量,一般简称为相关系数或者点相关系数,用r 表示。
它也做为两总体相关系数ρ的估计。
12、相关系数是标准化变量的协方差。
(2)有-1<=r<=1(3) 绝对值越大,表示变量之间关系越密切。
当r>0,表明两变量呈正相关,越接近1 ,正相关越显著;当r<0,表明两变量呈负相关,越接近‐1,负相关越显著;当r=0,则表示两变量相互独立。
计算出的相关系数是否显著,需要经过显著性检验。
第三章 气候稳定性检验1、假设检验的一般步骤为:1)写出零假设和备选假设;2)确定检验统计量;3)确定显著性水平;4) 根据数据计算检验统计量的实现值;5)根据这个实现值计算p-值;6)进行判断:如果p-值小于或等于alpha ,就拒绝零假设,这时犯(第一类)错误的概率最多为alpha ;如果p-值大于alpha ,就不拒绝零假设,因为证据不足。
2、气候稳定性检验涉及两种情形:(1)某一地区气候是否具有稳定性,比较不同时段气候变量的均值或者方差是否发生显著变化。
(2以通过检验均值和方差来判断。
3、t 统计量2----S1、S2表示样本均方差, n1,n2服从自由度n1+n2-2的t 分布。
若|t|>=ta 若样本量足够大,/)(y x t -=4、F 检验------ 上述统计量遵从自由度显著差异,或者说气候有显著差异。
第四章 气候变化趋势分析1、气候时间序列:随时间变化的一列气候数据。
2、气候序列的基本特点: 1)数据取值随时间变化;2)每一时刻取值的随机性;3)前后时刻数据之间存在相关性、持续性;4)序列整体有上升或下降趋势,呈周期振荡;5)某一时刻数据取值出现转折或突变。
3、回归系数b (气候倾向率):回归系数b 表示了变量x 的趋势倾向。
b 符号为正,说明∑=-=t i i t x x x 1)(ˆ变量随时间t 的增加呈上升趋势,反之则为下降趋势,b 值的大小反应了上升和下降的速率,即倾向程度。
4、相关系数r (气候趋势系数):变量与时间的相关系数表示变量x 随时间变化程度。
要判断变化趋势的程度是否显著,就要对相关系数进行显著性检验。
5、滑动平均是趋势拟合技术最基础的方法,它相当于低通滤波器。
用确定时间序列的平滑值来显示变化趋势。
主要从滑动平均序列曲线图来诊断其变化趋势。
6、累积距平也是一种常用的、由曲线直观判断变化趋势的方法。
对于序列x,其某一时刻t的累积距平表示为:7、累积距平计算结果分析: 1)累积距平曲线呈上升趋势,表示距平值增加;2)呈下降趋势,表示距平值减小;3)从曲线明显的上下起伏,可以判断其长期显著的的演变趋势及持续性变化,甚至还可以判断出发生突变的大致时间。
从曲线小的波动可以考察其短期的距平值变化。
图1b 1976 年是个明显的转折点, 在这之前累积曲线基本上呈上升趋势, 海温以正距平主, 这之后累积曲线呈下降趋势, 海温以负距平为主。
1951- 1975 年平均海温距平为12℃, 而1977- 1993 年平均海温距平为-128℃。
这就是说西风漂流区年平均海温从1951- 1975 年至1977- 1993 年下降了0148℃。
图1c 1981 年是个明显的转折点,在这之前累积曲线呈下降趋势, 海温以负距平为主, 这之后累积曲线呈上升趋势, 海温以正距平为主。
1951- 1980 年平均海温距平为0.08℃, 1982- 1993 年为0.21℃, 赤道太平洋年平均海温1981 年后比1981 年前增加了0.29℃。
8、五、七和九点二次平滑方法概述:对时间序列做五点二次、七点二次和九点二次平滑,与滑动平均一样,也起到低通滤波的作用,以展示出变化趋势。
优点:可以克服滑动平均削弱过多波幅的缺点。
第五章 一元线性回归1 2、距平形式的回归方程3、回归问题的方差分析 (残差方差)之和。
4、方差分析表明,预报量y 的变化可以看成由前期因子x 的变化所引起的,同时加上随机因素e 变化的影响,这种前期因子x 的变化影响可以归为一种简单的线性关系,这部分关系的变化可以用回归方差的大小来衡量。
如果回归方差大,表明用线性关系解释y 与x 的5、U 和Q Syy 称为总离差平方和。
U6、三个平方和的意义概括如下:总平方和(Syy):反映因变量的 n 个观察值与其均值的总离差。
回归平方和(U):反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和。