当前位置:文档之家› 空间数据的统计和分析方法

空间数据的统计和分析方法


18
核密度估计法
19
核密度估计法
20
核密度估计法
核密度估计法的特点:
21
核密度估计法

关于KDE中的带宽
22
核密度估计法
23

KDE中的边缘效应
这是位于R内的体积,当R是一个非规则的多边形区域时,将 导致计算量的急剧增加。
24
KDE方法在热带气旋源地分析中的应用:
25
KDE方法在热带气旋源地分析中的应用:
63
面状数据空间模式分析方法

面状数据是地理学研究中的一类重要数据,很多地理现象都通 过规则的或不规则的多边形表示,这类地理现象的显著特点是 空间过程与边界明确的面积单元有关。 面状数据通过各个面积单元变量的数值描述地理现象的分布特 征。例如气候类型区、土壤类型区、土地利用类型区、行政区 、人口普查区等。
根据G(d)曲线的形状分析空间点模式: 如果点事件的空间分布趋向聚集,具有较小的最邻近距离的点 的数量就多,那么G函数会在较短的距离内快速上升; 如果点模式中事件趋向均匀分布,具有较大的最邻近距离的点 的数量多,那么G函数值得增加就比较缓慢。
如果G(d)在短距离内迅速增长,表明点空间分布属于聚集模式; 如果G(d)先缓慢增长后迅速增长,表明点空间分布属于均匀模式。
4
空间点模式分析方法
点模式分析技术曾经在20世纪60年代的计量革命时代 十分盛行,但是早期的系统和方法缺乏直观的地图表 示。 随着GIS的发展和地理空间数据的丰富,以及对GIS空 间分析能力的广泛需求促进了空间数据分析方法的发 展。 点模式空间统计分析方法重新引起了人们的兴趣,基 于GIS或地图环境的交互式模式分析工具不断出现,或 作为方法库被统计分析程序所调用,或作为GIS软件包 的宏模块,或作为空间分析软件包的函数。
27
基于距离的方法
最邻近距离:
最邻近距离是指任意一点到其最邻近的点之间的距离。 图4.10中编号1的点的最邻近点是2,最邻近距离为3.67。
28
基于距离的方法
CSR模式:完全随机模式
29
基于距离的方法

最近邻指数测度方法
为了使用最邻近距离测度空间点模式,1954年Clark和Evans提出 了最邻近指数法(NNI)。 NNI的思想:首先对研究区内的任意一点都计算最邻近距离,然 后取这些最邻近距离的均值作为评价模式分布的指标。对于同一 组数据,在不同的分布模式下得到的NNI是不同的,根据观测模 式的NNI计算结果与CSR模式的NNI比较,即可判断分布模式的 类型。 聚集模式由于点在空间上多聚集于某些区域,计算得到的NNI应 当小于CSR模式的NNI; 均匀分布模式下,点之间的距离比较平均,计算得到NNI大于 CSR模式的NNI。 因此,通过最邻近距离的计算和比较就可以评价和判断分布模式。
14
2)样方分析方法 当样方的尺寸确定后,利用这一尺寸建立样方网格覆 盖研究区域或者采用随机覆盖的方法,统计落入每个 样方中的数量,建立其频率分布。 根据得到的频率分布和已知的点模式的频率分布的比 较,判断点分布的空间模式。
15
核密度估计法 核密度估计法(kernel density estimation, KDE)认为地 理事件可以发生在空间的任何位置上,但是在不同的 位置上,事件发生的概率不一样。
8
空间点模式分析方法
点模式空间分析方法
空间模式的研究一般是基于所有观测点事件在地图上 的分布,也可以是样本点的模式。 点模式关心的是空间点分布的聚集性和分散性问题, 地理学家在研究过程中发展了两类点模式分析方法: (1)以聚集性为基础的基于密度的方法: 主要有样方计数法和核函数方法两种; (2)以分散性为基础的基于距离的技术: 通过测度最近邻点的距离分析点的空间分布模式,主 要包括最邻近指数、G-函数、F-函数、K-函数方法等。
点密集的区域事件发生的概率高,点稀疏的地方事件 发生的概率低。 KDE反映的就是这样一种思想:使用事件的空间密度 分析表示空间点模式。 和样方计数法相比较,KDE更加适合于可视化方法表 示分布模式。
16
核密度估计法
在KDE中,区域内任意一个位置都有一个事件密度,这是和 概率密度对应的概念。
空间模式在点S上的密度或强度是可测度的,一般通过测量定 义在研究区域中单位面积上的事件数量来估计。
最简单的事件密度估计方法是在研究区域中使用滑动的圆来统 计出落在圆域内的事件数量,再除以圆的面积,就得到估计点 S处的事件密度。
17
核密度估计法
根据概率理论,核密度估计的一般定义为: 设X1, …, Xn 是从分布密度函数f的总体中抽取的独立同 分布样本,估计f在某点x处的值f(x),通常有RosenblattParen核估计:


38

G函数与F函数
G函数和 F函数就是用最近邻距离的分布特征揭示空间点模式 的方法。这两个函数是关于最邻近距离分布的函数。
G函数
39
G函数
40

示例
G函数
如图所示的研究区域中分布有10个事件(点),计算其G函数
41
G函数
首先,计算最邻近距离,并按照升序对这些距离排序。
42
G函数
43
G函数
51

K函数
1. 定义与K函数估计
52

K函数
1)定义
(4.36)
53

K函数
(4.36)
54

K函数
55

K函数
56

K函数
3)K函数的边缘效应与校正
57

K函数
2. K函数的点模式判别准则
58

实例研究

K函数
59

K函数
60

L函数
61

L函数:实例
62
面状数据 空间模式分析方法
5
空间点模式分析方法
空间点模式的概念 点模式是研究区域R内的一系列点的组合
[S1=(x1, y1), S2=(x2, y2), … , Sn=(xn, yn) ]
其中,Si是第i个观测事件的空间位置。 研究区域R的形状可以是矩形,也可以是复杂的 多边形区域。
6
空间点模式分析方法
点在空间上的分布千变万化,但不会超出从均匀到集中的模式。 一般将点模式区分为三种基本类型:聚集分布、随机分布、均 匀分布。
区域内点集对象或事件分布模式的基本问题:这些对象或事件 的分布是随机的、均匀的、还是聚集的? 研究分布的模式对于探索导致这一分布模式形成的原因非常重 要。例如:在一个城市区域中大型商业网点的空间分布模式是 否显著地影响了餐饮网点的分布,这是二元空间点模式问题。
7
空间点模式分析方法
从统计学的角度,地理现象或事件出现在空间任意位 置都是有可能的。 如果没有某种力量或者机制来“安排”事件的出现, 那么分布模式最有可能是随机分布的, 否则将以规则或者聚集的模式出现。对于此类问题, 地理世界中的事物可能存在某种联系。 一种现象的分布模式是否对另一种现象的分布模式产 生影响也是点模式需要解决的重要问题。
(1)按照面积单元是否有邻接关系的邻接法,
(2)基于面积单元中心之间距离的重心距离法。
65
(1)边界邻接法:面积单元之间具有共享的边界,被称为是 空间邻接的,用边界邻接可以定义一个面积单元的直接邻接, 然后根据邻接的传递关系还可以定义间接邻接,或者多重邻接。 (2)重心距离法:面积单元的重心或中心之间的距离小于某 个指定的距离,则面积单元在空间上是邻接的。这个指定距离 的大小对于一个单元的邻接数量有影响。
12
样方分析方法 除了规则网格外,采用固定尺寸的随机网格也能得到 同样的效果。 从统计意义上看,使用大量的随机样方估计才能获得 研究区域点密度的公平估计。
13
样方分析方法
样方的尺寸选择对计算结果会产生很大的影响。(b)和(c) 两种不同尺寸的网格,可能会导致不同的分析结论。 根据专家的研究,最优的样方尺寸是根据区域的面积和分布于 其中的点的数量确定的,计算公式为: Q=2A/n 式中, Q是样方的尺寸(面积);A为研究区域的面积;n为研究 区域中点的数量。最优样方的边长取 2 A / n 。
44
图4.16是聚集、随机、均匀三类点模式的G函数曲线的形状。 在实际应用中还需要进行显著性检验。
45
F函数
46
F函数
47
F函数
48

实例分析
F函数
49
F函数
50

K函数和L函数
为了在更加宽泛的尺度上研究地理事件空间依 赖性与尺度的关系,
Ripley提出了基于二阶性质的K函数方法, 随后,Bessage又将K函数变换为L函数。 K函数和L函数是描述在各向同性或均质条件 下点过程空间结构的良好指标。
9
基于密度的方法——样方计数法与核函数法
样方分析:
样方分析(quadrat analysis, QA)是研究空间点模式最常 用的直观方式。
基本思想: 通过空间上点分布密度的变化探索空间分布模式,一 般使用随机分布模式作为理论上的标准分布,将QA 计算的点密度和理论分布做比较,判断点模式属于聚 集分布、均匀分布还是随机分布。
11
样方分析方法 QA中对分布模式的判别产生影响的主要因素:
样方的形状,采样的方式,样方的起点、方向和大小等,这些 因素会影响到点的观测频次和分布。 QA分析中样方的形状一般采用正方形的网格覆盖,也可以自 己定义样方的形状,如圆形、正六边形等,以适合于所要研究 的问题。 无论采用何种形式的样方要求网格形状和大小必须一致,以避 免在空间上的采样不均匀。
10
基于密度的方法——样方计数法与核函数法
样方分析:
QA的一般过程: (1)将研究区域划分为规则的正方形网格区域; (2)统计落入每个网格中点的数量。由于点在空间 上分布的疏密性,有的网格中点的数量多,有的网 格中点的数量少,有的网格中点的数量甚至为零; (3)统计出包含不同数量点的网格数量的频率分布。 (4)将观测得到的频率分布和已知的频率分布或理 论上的随机分布(如泊松分布)作比较,判断点模 式的类型。
相关主题