当前位置:文档之家› 空间统计分析方法

空间统计分析方法


Moran散点图
以(Wz,z)为坐标点的Moran散点图,常来研究局部的 空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视 化的二维图示。
全局Moran指数,可以看作是Wz对于z的线性回归系数, 对界外值以及对Moran指数具有强烈影响的区域单元,可通 过标准回归来诊断出。
由于数据对(Wz,z)经过了标准化,因此界外值可易由 2-sigma规则可视化地识别出来。
空 间 联 系 的 局 部 指 标 ( local indicators of spatial association ,缩写为LISA)满足下列两个条件:
(1)每个区域单元的LISA,是描述该区域单元周围 显著的相似值区域单元之间空间集聚程度的指标;
(2)所有区域单元LISA的总和与全局的空间联系指 标成比例。
《地理信息系统科研方法》课程
第5讲 空间统计分析
授课人:王 杰 Email: wangjie09@
安徽大学 资源与环境工程学院
本讲内容
➢探索性空间统计分析 ➢地统计分析方法
空间统计分析
✓ 空间统计分析,即空间数据(spatial data)的统 计分析,是现代计量地理学中一个快速发展的方向 和领域。
一. 探索性空间统计分析
➢基本原理与方法 ➢应用实例
探索性空间数据分析(ESDA)
ESDA是指利用统计学原理和图形图表相结合对空 间信息的性质进行分析、鉴别,用以引导确定性模 型的结构和解法。
ESDA与EDA区别在于它考虑了数据的空间特性, 在方法上它将数据分解为一般趋势和叠加于其上的 局部变化两部分。然后用一定的数学函数去拟合由 样本点产生的经验变率函数,进行诸如克立格内插 等空间操作。
FLG的一般性: 自然地理、人文地理、社会经济
空间自相关是普遍存在的,否则地理分 析便没有多大意义。 经典统计:独立
空间自相关的存在,使得经典统计学所要求的样 本独立性假设不满足。
如果地理学从根本上值得研究,必然是 因为地理现象在空间上的变化不是随机 的。 经典统计:随机
为什么要用空间统计
nn
wij (xi x)(x j x)
i1 ji
nn
S 2
wij
i1 ji
式中: I 为Moran指数;
S 2 1
n
i
(xi x)2 ;
x
1 n
n i 1
xi


Geary 系数C计算公式如下
n n
n 1
wij xi x j 2
C
i1 j1
nn
n
2 wij xi x2
上图进一步显示了30个省级行政区人均GDP局部集聚的空间结构。 可以看出,从人均GDP水平相对地来看:
高值被高值包围的高高集聚省(直辖市)有:北京、天津、河 南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、 江苏;
低值被低值包围的低低集聚省(自治区)有:黑龙江、内蒙古、 新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、 贵州;
东部的江苏、上海、浙江三省市的Z值在0.05的显著性水 平下显著,天津的Z值在0.1的显著性水平下显著。而东部 上海、江浙等发达省市趋于为一些相邻经济发展水平相对 较高的省份所包围,东部发达地区的空间集聚分布特征也 显现出来。
以(Wz,z)为坐标,进一步绘制Moran散点图
可以发现,多数省(直辖市、自治区)位于第1和第3象限内, 为正的空间联系,属于低低集聚和高高集聚类型,而且位于第3象 限内的低低集聚类型的省(直辖市、自治区)比位于第1象限内的 高高集聚类型的省(直辖市、自治区)更多一些。
1. 基本原理与方法
(一)空间权重矩阵
✓ 通常定义一个二元对称空间权重矩阵W,来表达n个 位置的空间区域的邻近关系,其形式如下
w11 w12 W w21 w22
wn1 wn2
w1n
w2
n
wnn
式中:Wij表示区域i与j的临近关系,它可以根据邻接标准 或距离标准来度量。
两种最常用的确定空间权重矩阵的规则
(三)局部空间自相关
描述一个空间单元与其领域的相似程度,能够 表示每个局部单元服从全局总趋势的程度(包括 方向和量级),反映了空间异质性,说明空间依 赖是如何随位置变化的。
局部空间自相关分析方法包括3种: 空间联系的局部指标(LISA); G统计量; Moran散点图
空间联系的局部指标(LISA)
I i
j
(xi x)2
j
zT z
zi wij zj
j
i
式中:zi 和 z j是经过标准差标准化的观测值。
✓ 局部Moran指数检验的标准化统计量为
Z(Ii )
Ii E(Ii ) VAR(Ii )
G统计量
探测区域单元是属于高值集聚还是低值集聚的空 间分布模式.
❖ 全局G统计量的计算公式为
i1 j1
i 1
式中:C为Geary系数;其他变量同上式。

如果引入记号
nn
S0
wij
i1 j 1
z j (xj x)
zi (xi x)
zT [z1, z2 , , zn ]
则全局Moran指数I的计算公式也可以进一步写成
nn
nn
I n
wij (xi x)(x j x)
i1 j1
✓ 空间统计分析,其核心就是认识与地理位置相关的 数据间的空间依赖、空间关联或空间自相关,通过 空间位置建立数据间的统计关系。
✓ 空间统计分析的任务,就是运用有关统计方法,建 立空间统计模型,从凌乱的数据中挖掘空间自相关 与空间变异规律。
空间统计 VS. 经典统计
空间数据分析与传统统计分析主要有两大差异: (1)空间数据间并非独立,而是在维空间中具有某种空间相关
①简单的二进制邻接矩阵
1 当区域i和j相邻接
wij 0
其他
②基于距离的二进制空间权重矩阵
1 当区域i和j的距离小于d时
wij 0
其他
(二)全局空间自相关
全局空间自相关概括了在一个总的空间范围内空间 依赖的程度。
✓ Moran指数和Geary系数是两个用来度量空间自相
关的全局指标。
✓ Moran指数反映的是空间邻接或 空间邻近的区域单元属性值的相 似程度。
Moran散点图的4个象限, 分别对应于区域单元与其邻居 之间4种类型的局部空间联系 形式:
第1象限代表了高观测值的 区域单元被高值的区域所包围 的空间联系形式;
第2象限代表了低观测值的 区域单元被高值的区域所包围 的空间联系形式;
第3象限代表了低观测值 的区域单元被低值的区域所 包围的空间联系形式;
年份 1998 1999 2000 2001 2002
I 0.5001 0.506 9 0.511 2 0.505 9 0.501 3
Z 4.503 5 4.555 1 4.597 8 4.553 2 4.532 6
P 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0
从表中可以看出,在1998—2002年期间,中国大陆30 个省级行政区人均GDP的全局Moran指数均为正值;在正 态分布假设之上,对Moran指数检验的结果也高度显著。这 就是说,在1998—2002年期间,中国大陆30个省级行政区 人均GDP存在着显著的、正的空间自相关,也就是说各省 级行政区人均GDP水平的空间分布表现出相似值之间的空 间集聚,其空间联系的特征是:较高人均GDP水平的省级 行政区相对地趋于和较高人均GDP水平的省级行政区相邻, 或者较低人均GDP水平的省级行政区相对地趋于和较低人 均GDP水平的省级行政区相邻。
➢ 可以借助空间统计更好地理解地理现象。
或许学习空间统计最重要的原因是我们不仅仅想知道问题“怎么
样”,更想知道“哪里怎么样”
➢ 空间统计学可以帮助我们准确地判断具体地理模 式的原因。
John Snow的霍乱地图 当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可
能是病源。
➢ 空间统计学可以帮助我们处理大的复杂数据集, 这是GIS经常面对的事情。
选取2001年我国30个省级行政区人均GDP数据,计算 局部Gi统计量和局部Gi统计量的检验值Z(Gi),并绘制统计 地图如下。
检验结果表明,贵州、四川、云南西部3省的Z值在0.05的显著 性水平下显著,重庆的Z值在0.1的显著性水平下显著,该4省市在 空间上相连成片分布,而且从统计学意义上来说,与该区域相邻的 省区,其人均GDP趋于为同样是人均GDP低值的省区所包围。由此 形成人均GDP低值与低值的空间集聚,据此可认识到西部落后省区 趋于空间集聚的分布特征。
性,且在不同的空间分辨率下呈现不同之相关程度; (2)地球只有一个,大多数空间问题仅有一组(空间分布不规
则的)观测值,而无重复观测数据。因此,空间现象的了 解与描述是极为复杂的,而传统方法,尤其是建立在独立 样本上的统计方法,不适合分析空间数据。
经典统计:独立性、随机性假设 空间统计:自相关、依赖性、异质性
G
wij xi x j /
xi x j
ijBiblioteka ij❖ 对每一个区域单元的统计量为
Gi wij x j / x j
i
j
✓ 对统计量的检验与局部Moran指数相似,其检验值为
Z
(Gi
)
Gi E(Gi ) VAR(Gi )
✓ 显著的正值表示在该区域单元周围,高观测值的区域单 元趋于空间集聚,而显著的负值表示低观测值的区域单元趋 于空间集聚,与Moran指数只能发现相似值(正关联)或非相似 性观测值(负关联)的空间集聚模式相比,具有能够探测出区 域单元属于高值集聚还是低值集聚的空间分布模式。
空间统计的基本思想:
地理学第一定律(FLG): everything is related to everything else, but near things are more related than distant things (Tobler,1970).
相关主题