空间统计分析方法
❖ 1854年8月到9月英国伦敦霍乱 流行时,当局始终找不到发病的 原因,后来医生约翰·斯诺 (John Snow) 参与调查。
❖ 他在绘有霍乱流行地区所有道路、 房屋、饮用水机井等内容的1: 6500比例尺地图上,标出了每 个霍乱病死者的居住位置,得到 了霍乱病死者居住分布图。
霍乱病死者居住分布图(John Snow, 1854)
Tobler, W. R. (1970). "A computer movie simulating urban growth in the Detroit region". Economic Geography, 46(2): 234-240.
Waldo Tobler(born in 1930) receiving a plaque for his contributions to geography. On the event of his November 2000 birthday.
则的)观测值,而无重复观测数据。因此,空间现象的了 解与描述是极为复杂的,而传统方法,尤其是建立在独立 样本上的统计方法,不适合分析空间数据。
经典统计:独立性、随机性假设 空间统计:自相关、依赖性、异质性
空间统计的基本思想:
地理学第一定律(FLG): everything is related to everything else, but near things are more related than distant things (Tobler,1970).
FLG的一般性: 自然地理、人文地理、社会经济
空间自相关是普遍存在的,否则地理分 析便没有多大意义。 经典统计:独立
空间自相关的存在,使得经典统计学所要求的样 本独立性假设不满足。
如果地理学从根本上值得研究,必然是 因为地理现象在空间上的变化不是随机 的。 经典统计:随机
为什么要用空间统计
《地理信息系统科研方法》课程
第5讲 空间统计分析
授课人:王 杰 Email:
本讲内容
➢探索性空间统计分析 ➢地统计分析方法
空间统计分析
✓ 空间统计分析,即空间数据(spatial data)的统 计分析,是现代计量地理学中一个快速发展的方向 和领域。
✓ 空间统计分析,其核心就是认识与地理位置相关的 数据间的空间依赖、空间关联或空间自相关,通过 空间位置建立数据间的统计关系。
i1
i1
Moran指数I的取值一般在[-1,1]之间,小于0表示负相 关,等于0表示不相关,大于0表示正相关;
Geary系数C的取值一般在[0,2]之间,大于1表示负 相关,等于1表示不相关,而小于1表示正相关。
(三)局部空间自相关
描述一个空间单元与其领域的相似程度,能够 表示每个局部单元服从全局总趋势的程度(包括 方向和量级),反映了空间异质性,说明空间依 赖是如何随位置变化的。
一. 探索性空间统计分析
➢基本原理与方法 ➢应用实例
探索性空间数据分析(ESDA)
ESDA是指利用统计学原理和图形图表相结合对空 间信息的性质进行分析、鉴别,用以引导确定性模 型的结构和解法。
ESDA与EDA区别在于它考虑了数据的空间特性, 在方法上它将数据分解为一般趋势和叠加于其上的 局部变化两部分。然后用一定的数学函数去拟合由 样本点产生的经验变率函数,进行诸如克立格内插 等空间操作。
1. 基本原理与方法
(一)空间权重矩阵
✓ 通常定义一个二元对称空间权重矩阵W,来表达n个 位置的空间区域的邻近关系,其形式如下
w11 w12 W w21 w22
wn1 wn2
w1n
w2
n
n
式中:Wij表示区域i与j的临近关系,它可以根据邻接标准 或距离标准来度量。
两种最常用的确定空间权重矩阵的规则
①简单的二进制邻接矩阵
1 当区i域 和j相邻接
wij 0
其他
②基于距离的二进制空间权重矩阵
1 当区i和 域j的距离d小 时于
wij 0
其他
(二)全局空间自相关
全局空间自相关概括了在一个总的空间范围内空间 依赖的程度。
✓ Moran指数和Geary系数是两个用来度量空间自相
关的全局指标。
✓ Moran指数反映的是空间邻接或 空间邻近的区域单元属性值的相 似程度。
✓ 空间统计分析的任务,就是运用有关统计方法,建 立空间统计模型,从凌乱的数据中挖掘空间自相关 与空间变异规律。
空间统计 VS. 经典统计
空间数据分析与传统统计分析主要有两大差异: (1)空间数据间并非独立,而是在维空间中具有某种空间相关
性,且在不同的空间分辨率下呈现不同之相关程度; (2)地球只有一个,大多数空间问题仅有一组(空间分布不规
i1 ji
nn
S 2
wij
i1 ji
式中: I 为Moran指数;
S2 1
n
i
(xi x)2 ;
1 n
x n i1 xi 。
✓
Geary 系数C计算公式如下
n n
n 1
wij xi x j 2
C
i1 j1
nn
n
2wijxi x2
i1 j1 i1
式中:C为Geary系数;其他变量同上式。
✓ Geary 系数与Moran指数存在负 相关关系。
Patrick A.P.Moran (1917-1988)
如果是位置(区域)的观测值,则该变量的全局Moran指
数I,用如下公式计算
n n
n
wij xi x xj x
I i1 j1
nn
n
wijxi x2
i1 j1 i1
nn
wij (xi x)(x j x)
✓
如果引入记号
nn
S0
wij
i1 j1
zi (xi x)
zj (xj x) zT[z1,z2,,zn]
则全局Moran指数I的计算公式也可以进一步写成
nn
nn
n
I
S0
wij(xi x)(xj x)
i1 j1
n
(xi x)2
n S0
i1
wijzi z j
j1
n
zi 2
n S0
zTWz zT z
➢ 可以借助空间统计更好地理解地理现象。
或许学习空间统计最重要的原因是我们不仅仅想知道问题“怎么
样”,更想知道“哪里怎么样”
➢ 空间统计学可以帮助我们准确地判断具体地理模 式的原因。
John Snow的霍乱地图 当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可
能是病源。
➢ 空间统计学可以帮助我们处理大的复杂数据集, 这是GIS经常面对的事情。