第4章空间统计分析
本节内容:
1 空间分布模式 2 空间权重矩阵(空间接近性矩阵) 3 全域型空间自相关指标 4 区域型空间自相关指标
1 空间分布模式
在研究某一变量的空间分布模式时,我们 希望将所观测到的模式与某一理论模式(统计 特性及相关空间过程已知)进行比较。 如果所研究的空间模式符合某一特定的理 论模式,我们就可以运用该理论模式的已知性 质来解释观测到的模式,并且能够借用我们所 拥有的与该已知模式相关的经验和知识来进行 深入的研究。
空间分布模式可以划分为聚集模式(clustered pattern)、分散模式(dispersed pattern)和随机模式 (random pattern)三类。
聚集模式
分散模式
随机模式
真实世界中的大部分模式都介于随机与分散 模式或随机与聚集模式之间,极少能遇到极端聚 集、极端分散或极端随机的模式。
既然现实模式很难轻易归入聚集、分散或 随机型,那么我们就要考虑某一给定的空间模 式与这三种模式中的某一种到底有多接近?如 果它接近其中的一种模式,那么这种接近到底 是有偶然因素还是系统过程造成的?
我们在分析某变量的空间分布模式时,实际 上是在测度空间自相关程度或者说空间依赖程度。 空间自相关是指属性值在空间上相关是由要 素的地理位置造成的。
C
n 1 wij xi x j 2
n n i 1 j 1 n
2 wij xi x
i 1 j 1 i 1
n
n
2
0≤C≤2
C>1表示负相关, C=1表示不相关, C<1表示正相关。
3.3 广义G统计量
I和C都具有描述全局空间自相关的良好统计特 性,它是它们不具有识别不同类型的空间聚集模 式的能力。这些模式有时被称为“hot spots”和 “cold spots”。
第三产比重%x2 20 40.2 31.8
南阳
焦作 周口 安阳 新乡
4
6 7 8 9
19000
26000 35700 13000 25000 22000 15000 14000 12000
27.5
25 23.2 24.8 26.2 28.6 29.1 31.4 30.7
平顶山 5
商丘 10 信阳 11 驻马店12
人均GDP局部G统计量表
河南地级市人均GDP局部G统计量
4.3 Moran散点图
以( Wz , z )为坐标点的 Moran 散点图,常 来研究局部的空间不稳定性,它对空间滞后因子 Wz和z数据对进行了可视化的二维图示。
Moran散点图的4个象限,分别对应于区域单元与其邻 居之间4种类型的局部空间联系形式: 第1象限代表了高观测值的区域单元被同是高值的区 域所包围的空间联系形式;
如果高值面积单元相互之间接近,I和C将指示 相对高的空间自相关,这些高值面积单元之间的 聚集可被标注为“hot spots”。但是I和C指出的高 的正空间自相关也可有相互接近的低值面积单元 构成,这种类型的聚集可被称为“cold spots”. I和C不能区分这两种类型的空间自相关。
广义G统计量采用交叉积的形式,其优势是能 检测研究区中的“hot spots”和“cold spots”。
w11 w 21 W wn1
w12 w22 wn 2
w1n w2 n wnn
式中:Wij表示区域i与j的临近关系,它可以根据邻 接标准或距离标准来度量。
2.1 简单的二进制邻接矩阵
1 当区域i和j相邻接 wij 其他 0
位置的相似性可以通过空间接近性矩阵(或 权重矩阵)W来描述; 属性的相似性一般通过交叉乘积xixj,或平方 差异(xi-xj)2,或绝对差异│xi-xj│来描述。
本节内容:
1 空间分布模式 2 空间权重矩阵(空间接近性矩阵) 3 全域型空间自相关指标 4 区域型空间自相关指标
2 空间权重矩阵(空间接近性矩阵)
w
i 1 j 1
i 1 n n
I
n
i
ij
局部Moran指数检验的标准化统计量为:
Z (I i )
I i E(I i ) VAR( I i )
人均GDP局部Moran指数表
河南地级市人均GDP局部Moran指数
4.2 G统计量
全局G统计量的计算公式为:
G wij xi x j / xi x j
第4章 空间统计分析
§4.1 空间自相关 Spatial autocorrelation
空间统计分析,即空间数据的统计分析,通过 空间位置建立数据间的统计关系。
空间统计学产生的原因: 大多数经典统计学分析要求样本相互独立, 而空间数据间并非完全独立,而是存在依赖性。
空间统计分析可包括“空间数据的统计分 析”及“数据的空间统计分析”
3.1 Moran’s I
设研究区域中存在n个面积单元,第i个 单元上的观测值记为xi,观测变量在n个单 元中的均值记为 x ,Moran’s I定义为:
n wij xi x x j x
n n i 1 j 1 n
I
w x
i 1 j 1 ij i 1
n
n
第2象限代表了低观测值的区域单元被高值的区域所 包围的空间联系形式;
第3象限代表了低观测值的区域单元被同是低值的区 域所包围的空间联系形式; 第4象限代表了高观测值的区域单元被低值的区域所 包围的空间联系形式。
与局部 Moran 指数相比,其重要的优势 在于能够进一步具体区分区域单元和其邻 居之间属于高值和高值、低值和低值、高 值和低值、低值和高值之中的哪种空间联 系形式。
Z
பைடு நூலகம்
I E(I ) VAR( I )
当Z值为正且显著时,表明存在正的空间自相 关,也就是说相似的观测值(高值或低值)趋于空间 集聚; 当Z值为负且显著时,表明存在负的空间自相 关,相似的观测值趋于分散分布; 当Z值为零时,观测值呈独立随机分布。
3.2 Geary 系数C
基于相关位置间的数字差分:
( xi x ) wij ( x j x ) I i 可进一步写成: S S j
zi wij z j
j
I
w z z
i 1 j 1 n n ij i
n
n
j
w
i 1 j 1
z w z
i 1 i
n
n
ij
w
i 1 j 1
n
j 1 n
ij
j
ij
基于“距离”的空间接近性测度就是使用面 积单元之间的距离定义接近性。 如何测度任意两个面积单元之间的距离呢?
① 按照面积单元之间是否有邻接关系的邻接法; ② 基于面积单元中心距离的重心距离法。 空间权重矩阵是空间接近性的定量化测度。
假设研究区有n个多边形,任何两个多边形都存 在一个空间关系,这样就有n×n对关系,需要n×n的 矩阵存储这n个单元之间的空间关系。
w (d ) x x G (d ) x x
ij i i j i j i j
j
, 其中i j
当单元i和j的距离小于d时,Wij(d)=1,否则Wij(d)=0
本节内容:
1 空间分布模式 2 空间权重矩阵(空间接近性矩阵) 3 全域型空间自相关指标 4 区域型空间自相关指标
4 区域型空间自相关指标
开封 13
三门峡14 濮阳 15 漯河 16 鹤壁 17 济源 18 均值 标准差
18000
36000 21000 26000 29000 50200 26514 11420
33.3
23.5 19.6 17.5 18 19.7 26.1 6.076
空间自相关是根据位置相似性和属性相 似性的匹配情况来测度的。
本节内容:
1 空间分布模式 2 空间权重矩阵(空间接近性矩阵) 3 全域型空间自相关指标 4 区域型空间自相关指标
3 全域型空间自相关指标
功能在于描述某要素的整体分布情况,判 断此现象在空间是否有聚集特性存在,但并不 能确切地指出聚集在哪些地区。 Moran指数和Geary系数是两个用来度量 空间自相关的全局指标。
i
x
wij ( xi x)(x j x)
i 1 j 1
n
n
2
S
2
w
i 1 j 1
n
n
w z z
i 1 j 1 n n
n
n
ij i j
ij
w
i 1 j 1
ij
-1≤ I ≤1
1表示极强的正空间自相关,-1表示极强的 负空间自相关。
对于Moran指数,可以用标准化统计量Z来检 验n个区域是否存在空间自相关关系,Z的计算公 式为:
对于任何空间变量(属性)z,空间自相关测度的 是z的近邻值对于z的相似或不相似程度。 如果近邻位置上相互间的数值接近,我们就说空 间模式表现出的是正空间自相关;如果相互间的数 值不接近,我们说空间模式表现出的是负空间自相 关。
地级市 许昌 郑州 洛阳 1 2 3
人均GDPx1 30367 49000 36000
全域型空间自相关统计量是对整个研究区概 括出的统计量。 在某些区域上空间自相关值可能是高的,另 外一些区域上的值可能是低的,甚至可能在研究 区的某一部分中找到正的空间自相关而在另一些 区域中找到负的空间自相关。
这一现象出现的原因在于空间异质性 的存在。对全域测度统计量的适当修正 可用于探测局部尺度上的空间自相关。
1 4 7 2 5 8 3 6 9 1 4 7 2 5 8 3 6 9
车的行走方式
王、后的行走方式
2.2 基于距离的二进制空间权重矩阵
1 wij 0