当前位置:
文档之家› 气候统计基本气候状态的统计量
气候统计基本气候状态的统计量
21 7 7 3 5 8
27 6 2 4
20 6 4 5 7
26 25 8
19 4 6
1998年7月北京最高温度 1998年7月北京最低温度
注:适用于数据量很小时
图例——柱状(Histogram)图
1998年7月北京最高温度 1998年7月北京最低温度
10
8
Frequency Frequency
8 6
例如,当数据遵循于高斯分布(正态 分布)时,平均值能够很好的体现数据的 中心趋势。
而当数据不满足高斯分布时,通常 的平均值计算方法很可能会产生错误的中 心趋势结果。
Robustness以及Resistance
• 一个统计分析被称为resistance,则表 明它不会受到数据极值的影响,或者 说当数据中的小部分,甚至较大部分 发生变化后,所采用的统计方法计算 结果不会发生大的变化。
34 7 1 7 0 33 0 6 32 2 9 7 31 7 0 2 8 4 5 30 5 2 1 0 29 6 5 3 4 7 5 3 28 4
枝叶 26 0
mean 22.7 median 23
25 0
24 4 1 2 6 8 1 7 23 5 3 9 0 6 4 3
22 3 8 1 4
• 对称性统计量(Symmetry)---偏态系数 R&R:Yule-kendall 指数
YK
(q0.75
q0.5 ) (q0.5 IQR
q0.25 )
(q0.25
2q0.5 q0.75 ) IQR
经验分布
图例——枝-叶(Stem-and-Leaf)图
mean 30.8 枝 叶 median 30.5
正态分布
众数/中位数/平均数
正/右偏态分布
负/左偏态分布
正和负偏更为robustness和 resistance的统计量
• 位置统计量(Location)---平均数 R&R:中位数 剪裁平均 (trimmed mean---trimean)
Trimean q0.25 2q0.5 q0.75 4
例如,一组数据为11,12,13,14,15, 16,17,18,19,其平均值为15,但改变 数据为11,12,13,14,15,16,17,18, 91,其平均数为23。(平均值计算方法失 效)
百分位数
• 百分位数经常应用于气候分析中; • 百分位数是本章需要重点强调的部分; • 怎么计算百分位数?
3. 在学习以上统计量的同时,学会绘制 相关的统计图。
统计量
中心趋势统计量
• 所谓中心趋势统计量,指的是我们用一个 数值来描述样本资料在哪一个位置或者集 中在哪个中心位置上的数据是最有代表性 的。
• 常见的中心趋势统计量包括:
平均数(mean) 中位数(median) 众数(mode)
一组数据为 {x1, x2, x3, x4, x5,K , xn}
由小到大重新排序
变为
{x(1) , x(2) , x(3) , x(4) , x(5) ,K , x(n)}
得到各种百分位数,如中位数,上四分位数, 下四分位数等。
中心趋势统计量——中位数
• 中位数(median)
对于重新排列的数据
相对于方差的更为robustness和 resistance的统计量
• 离散程度统计量(Spread)---方差 R&R:内四分位数的范围 (interquartile range--- IQR)
IQR q0.75 q0.25
相对于偏态系数的更为robustness和 resistance的统计量
{x(1) , x(2) , x(3) , x(4) , x(5) ,K , x(n)}
中位数为:
q0.5
x , ([n1]/ 2)
x(n / 2) x([n / 2]1)
2
,
n odd n even
类似计算可以得到四分位数 q0.25 和 q0.75 , 即“hinges”(Tukey,1977)
中心趋势统计量——众数
• 众数(mode) 一个数据序列中出现频次(概率)最高 的数。
变化幅度统计量
• 统计量中的平均数、中位数和众数等描述 的仅仅是气候变量分布中心在数值上的大 小,并没有告诉我们这种变化与正常情况 的偏差和变化的波动。变化幅度统计量即 表征距离分布中心远近程度的统计量。
• 变化幅度统计量包括:
中心趋势统计量——平均数
• 平均数(mean) 对于包含有 n 个样本的一个变量 x
x1, x2,K , xi,K , xn
样本平均值为:
x
1 n (x1
x2
K
xn )
1 n
n i 1
xi
,即
Robustness以及Resistance
• 一个统计分析被称为robustness,则 表明该分析不会受到数据分布特征的 影响;
幅度
s 2
1 n 1
n i 1
( xi
x )2
• 标准差(standard deviation)
方差的平方根
分布特征统计量
• 通常用样本的偏态系数来体现数据的分布 特征,即对称性。
• 计算公式如下:
n
[1/(n 1)] (xi x )3
i 1
s3
正态以及偏态分布示意图
第二章 基本气候状态的 统计量
Part 1 统计资料的整理:统计量以及
经验分布
学习目的
资料
实测 模式 资料 资料
气象和气 候分析的
根本
第一步
分析数据的 基本特性
进 一 步
……
学习目标
1. 介绍常用的表征基本气候状态的统计 量的特性;
2. 学习有关表征中心趋势、变化幅度以 及经验性的数据分布特征的统计量;
6 4
4
2 2
0
25 26 27 28 29 30 31 32 33 34 35 36
Tmax (oC)
0
19 20 21 22 23 24 25 26 27
Tmin (oC)
距平(anomaly) 方差(variance)和标准差(standard
deviation)
变化幅度统计量——
距平、方差和标准差
• 距平( anomaly )
一组数据中的某一个数 xi与 x (平均数)之间的 差就是距平 ,即 x
•
x
方差(variance)
xi
x
描述样本中数据与以平均数为中心的平均振荡