当前位置:
文档之家› GIS算法基础lecture4_空间自相关
GIS算法基础lecture4_空间自相关
全局Moran 统计量公式:
I n wij xi x x j x
n n i 1 j 1 n
w x
i 1 j 1 ij i 1
n
n
i
x
w ( x
i 1 j i ij
n
n
i
x)(x j x)
n ij
2
S
2
w
i 1 j i
ArcGIS 空间统计工具箱
空间统计工具箱是为那些需要使用高级的方法来解决其空间分 析问题的gis用户设计的。 空间统计主要的工作是研究空间自 相关性(Spatial Autocorrelation),分析空间分布的模式, 例如聚类(cluster)或离散(dispersed)。通过使用 ArcGIS 9中的空间统计工具,用户可以以一种非常直观而简单 的方式获得这些信息。
1 3323.19 (138.8)(155.7) 12 1 1 2 2 3056.16 (138.8) 3616.11 (155.7) 12 12 0.9995
正态分布
生产与科学实验中很多随机变量的概率分布都可以 近似地用正态分布来描述。例如,在生产条件不变 的情况下,产品的强力、抗压强度、口径、长度等 指标;同一种生物体的身长、体重等指标;同一种 种子的重量;测量同一物体的误差;弹着点沿某一 方向的偏差;某个地区的年降水量;以及理想气体 分子的速度分量,等等。一般来说,如果一个量是 由许多微小的独立随机因素影响的结果,那么就可 以认为这个量具有正态分布(见中心极限定理)。 从理论上看,正态分布具有很多良好的性质 ,许 多概率分布可以用它来近似;还有一些常用的概率 分布是由它直接导出的,例如对数正态分布、t分 布、F分布等
Moran’s I 公式的由来:
Moran’s指数接近1表示集聚,接近-1表示离散。 可以计算出相应的Z值来评价观测的集聚或离散是 否统计显著
G统计量--高/低 集中趋势
G统计量
全局G统计量的计算公式为
G wij xi x j / xi x j
i j i j
对每一个区域单元的统计量为
r
( X X )(Y Y ) ( X X ) (Y Y )
2
2
l XY l XX lYY
1 (∑xi ) (∑yi ) n
l xy = l xx = l yy =
∑( x ∑( x
i
x )( yi x) = y)2 =
2
y) =
∑x y
i
i
i
∑x
2
i
∑( yi
2 y ∑i
•举例,北京市多年各月平均气温与5cm深的平均地温,如表所 示,请计算两者的相关系数
月 份 1 2 3 4 5 6 7 8 9 10 11 4.0 4.6 12 -2.8 -1.9
气 温
地 温
-4.7 -2.3 4.4 -3.6 -1.4 5.1
13. 2
14. 5
20. 2
22. 3
24. 2
空间自相关有三种:
正自相关:是指附近的观测值很可能是彼此 相似的 负自相关:是指附近的观测值很可能是彼此 不同的,较少见 零自相关:是指无法辨别空间效应,观测值 在空间上似乎是随机分布的
空间自相关分析
自相关分析的结果可用来解释和寻找存在的 空间聚集性或“焦点”。空间自相关分析需 要的空间数据是点或面数据,分析的对象是 具有点/面分布特性的特定属性。 全程空间自相关分析用来分析在整个研究范 围内指定的属性是否具有自相关性。 局部空间自相关分析用来分析在特定的局部 地点指定的属性是否具有自相关性
26.01 210.25 497.29
6
7 8 9
24.2
26.0 24.6 19.5
26.9
28.2 26.5 21.1
650.98
733.20 651.90 411.45
585.64
676.00 605.16 380.25
723.61
795.24 702.25 445.21
10
11 12 总和
12.5
n
S2
1 2 ( x x ) ; i n i 1 n x xi 。 n i 1
x) 局部Moran指数被定义为: I i ( xi wij ( x j x ) 2 S
j
可进一步写成
I i
n( xi x ) wij ( x j x )
2 ( x x ) i i j
Lecture 4 空间自相关
数学基础,相关分析,正态分布 空间自相关
1、描述地理数据分布离散程度的指标
极差 指所有数据中最大值与最小值之差,计算公式为
R = max {xi } min{xi }
离差
i
i
指每一个地理数据与平均值的差,计算公式为
di = xi
离差平方和
x
它从总体上衡量一组地理数据与平均值的离散程度,其计 n 算公式为
空间统计学
空间自相关是指空间位置上越靠近事物或现象就越 相似,即事物或现象具有空间位置的依赖关系。如 气温、湿度等的空间分布体现了与海陆距离、海拔 高程的相关性。如果没有空间自相关性,地理事物 和现象的分布将是随意的,地理学中的空间分布规 律就不能体现。 空间自相关性使得传统的统计学方法不能直接用于 分析地理现象的空间特征,因为传统的统计学方法 的基本假设就是独立性和随机性。为了分析具有空 间自相关性的地理现象,需要对传统的统计学方法 进行改进和发展,空间统计学就应运而生了。
4.0 -2.8 138.8
13.4
4.6 -1.9 155.7
167.50
18.40 5.32 3323.19
156.25
16.00 7.84 3056.16
179.56
21.16 3.61 3619.11
r
( xi )( yi ) xi yi n 2 2 ( xi ) ( yi ) 2 2 xi yi n n
例子
测度不同时段少数民族的分化——这种分化 的趋势是在扩大还是在减小。 总结疾病或趋势在空间和时间上的扩散—— 也就是说疾病趋势是保持集中在一些地区还 是扩散到很多地区 。 比较一个城市内不同犯罪类型的分布模式 比较一个城市内不同时段的人口集中程度
Moran’s I 统计量
moran’s I 统计量度量空间自相关(要素属性 相近程度)的程度,它的计算不但考虑要素的 属性值而且还包括要素之间的距离。给定一系 列的要素和相应的属性值,它评估要素的分布 是否使集聚分布,离散分布还是随机分布。 Moran’s指数接近1表示集聚,接近-1表示离 散
G统计量--高/低 集中趋势
Getis-Ord General指数(高/低变化工具)度量对整体区域 的高低值的集中度。 例1:可以用这个统计工具去比较一个城市内不同犯罪类型的 分布模式,这样我们就能够看出该地区是犯罪比较集中(热点 地区多),还是犯罪很分散。计算得出很高的值说明在研究区 域高于平均值的区域比较聚集。较低的值说明低于平均值的区 域趋向聚集。可以计算得出该区域的标准化z值使我们能看出高、 低值是否具有统计显著性。 例2:比较总结空间现象在不同地方和不同时段的聚集程度。 典型的有城市和城市人口集中。用高/低值聚集分析,你能够比 较西方城市与东方城市的集聚水平(城市形态学),或者在一 个城市内不同时段的人口集中程度的比较(城市增长和密度分 析)
3、地理相关程度的度量方法
简单直线相关程度的度量
相关程度
研究两个地理要素之间的相互关系是否密切
相关方向
正相关:y值随x的增加而变大或随x的减少而变小 负相关:y值随x的增加而变小或随x的减少而增大
相关系数(correlation coefficient)
Covariance
相关系数(correlation coefficient) 样本相关系数的计算公式为
nzi wij z j
j
z z
T
z i wij z j
j
式中: zi 和 z j 是经过标准差标准化的观测值。 局部Moran指数检验的标准化统计量为
Z (I i ) I i E(I i ) VAR( I i )
Moran’s I 公式的由来:
方差
协方差
Moran’s I 公式的由来:
正态分布
正态分布normal distribution一种概率分布。
正态分布是具有两个参数μ和σ2的连续型随机变量的分布 第一参数μ是服从正态分布的随机变量的均值, 第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。 服从正态分布的随机变量的概率规律为: 取 μ邻近的值的概率大 ,而取离μ越远的值的概率越小; σ越小,分布越集中在μ附近,σ越大,分布越分散。
2 1 (∑xi ) n 2 1 (∑yi ) n
相关系数(correlation coefficient)
rxy为要素x与y之间的相关系数,它就是表 示该两要素之间相关程度的统计指标,其 值在[-1,1]区间之内
rxy>0,表示正相关,即两要素同向发展 rxy<0,表示负相关,即两要素异向发展 rxy 的绝对值越接近于1,表示两要素的关系越 密切; 越接近于0,表示两要素的关系越不密 切
d =
2
∑( x
i= 1
i
x)
方差与标准差 方差是从平均概况衡量一组地理数据与平均值 的离散程度。方差计算公式为
n 1 ∑ (x σ2 = n i= 1 i
x) 2
标准差为方差的平方根,计算公式为
σ= 1 n