空间分析的概念空间分析:是基于地理对象的位置和形态特征的空间数据分析技术,其目的在于提取和传输空间信息。
包括空间数据操作、空间数据分析、空间统计分析、空间建模。
空间数据的类型空间点数据、空间线数据、空间面数据、地统计数据属性数据的类型名义量、次序量、间隔量、比率量属性:与空间数据库中一个独立对象(记录)关联的数据项。
属性已成为描述一个位置任何可记录特征或性质的术语。
空间统计分析陷阱1)空间自相关:“地理学第一定律”—任何事物都是空间相关的,距离近的空间相关性大。
空间自相关破坏了经典统计当中的样本独立性假设。
避免空间自相关所用的方法称为空间回归模型。
2)可变面元问题MAUP:随面积单元定义的不同而变化的问题,就是可变面元问题。
其类型分为:①尺度效应:当空间数据经聚合而改变其单元面积的大小、形状和方向时,分析结果也随之变化的现象。
②区划效应:给定尺度下不同的单元组合方式导致分析结果产生变化的现象。
3)边界效应:边界效应指分析中由于实体向一个或多个边界近似时出现的误差。
生态谬误在同一粒度或聚合水平上,由于聚合方式的不同或划区方案的不同导致的分析结果的变化。
(给定尺度下不同的单元组合方式)空间数据的性质空间数据与一般的属性数据相比具有特殊的性质如空间相关性,空间异质性,以及有尺度变化等引起的MAUP效应等。
一阶效应:大尺度的趋势,描述某个参数的总体变化性;二阶效应:局部效应,描述空间上邻近位置上的数值相互趋同的倾向。
空间依赖性:空间上距离相近的地理事物的相似性比距离远的事物的相似性大。
空间异质性:也叫空间非稳定性,意味着功能形式和参数在所研究的区域的不同地方是不一样的,但是在区域的局部,其变化是一致的。
ESDA是在一组数据中寻求重要信息的过程,利用EDA技术,分析人员无须借助于先验理论或假设,直接探索隐藏在数据中的关系、模式和趋势等,获得对问题的理解和相关知识。
常见EDA方法:直方图、茎叶图、箱线图、散点图、平行坐标图主题地图的数据分类问题等间隔分类;分位数分类:自然分割分类。
空间点模式:根据地理实体或者时间的空间位置研究其分布模式的方法。
茎叶图:单变量、小数据集数据分布的图示方法。
优点是容易制作,让阅览者能很快抓住变量分布形状。
缺点是无法指定图形组距,对大型资料不适用。
茎叶图制作方法:①选择适当的数字为茎,通常是起首数字,茎之间的间距相等;②每列标出所有可能叶的数字,叶子按数值大小依次排列;③由第一行数据,在对应的茎之列,顺序记录茎后的一位数字为叶,直到最后一行数据,需排列整齐(叶之间的间隔相等)。
箱线图&五数总结箱线图也称箱须图需要五个数,称为五数总结:①最小值②下四分位数:Q1③中位数④上四分位数:Q3⑤最大值。
分位数差:IQR = Q3 - Q13密度估计是一个随机变量概率密度函数的非参数方法。
应用不同带宽生成的100个服从正态分布随机数的核密度估计。
空间点模式:一般来说,点模式分析可以用来描述任何类型的事件数据。
因为每一事件都可以抽象化为空间上的一个位置点。
空间模式的三种基本分布:1)随机分布:任何一点在任何一个位置发生的概率相同,某点的存在不影响其它点的分布。
又称泊松分布2)均匀分布:个体间保持一定的距离,每一个点尽量地远离其周围的邻近点。
在单位(样方)中个体出现与不出现的概率完全或几乎相等。
3)聚集分布:许多点集中在一个或少数几个区域,大面积的区域没有或仅有少量点。
总体中一个或多个点的存在影响其它点在同一取样单位中的出现概率。
点模式的描述:1)一阶效应:事件间的绝对位置具有决定作用,单位面积的事件数量在空间上有比较清楚的变化,如空间上平均值/密度的变化。
2)二阶效应:事件间的相对位置和距离具有决定作用,如空间相互作用。
空间点模式分析方法:1)基于密度的方法:测度一阶效应①样方分析,包括选取所有点和随机取样法。
步骤:a )研究区域中打上网格,建议方格大小为OuadratSize=2A/n A :研究区域面积,n :点的个数。
b )确定每个网格中点的个数。
c )计算均值(Mean )、方差(Var )和方差均值比:VMR=Var/Mean {对于均与分布,方差=0,因此VMR 的期望值=0;对于随机分布,方差=均值,因此VMR 的期望值=1;对于聚集分布,方差大于均值。
因此VME 的期望值>1.}样方分析的缺点:结果依赖于样方的大小和方向;样方分析主要依据点密度,而不是点之间的相互关系,所以不能区别图示的两种情况。
②样方分析的统计检验,包括K-S 检验和方差均值比的检验。
③核密度估计 基本思想:在研究区域内的任一点都有一个密度,而不仅仅是在事件点上。
该密度通过计数一定区域内的事件点数量,或核(Kernel)进行估计。
核以估计点为中心,一定距离为半径。
C (s ,r )是以点s 为圆心、r 为半径的圆域,#表示事件S 落在圆域C 中的数量。
核密度估计(KDE)用途:a ) 可视化点模式进行热点 (hot spot)探测;b ) 离散 连续。
如,疾病与污染。
2)基于距离的方法:测度二阶效应①最近邻距离计算每个点到其最近邻点之间的距离, 然后计算所有点最近邻距离的平均值。
对每一个点,根据其欧几里德距离最小确定其最近邻点。
平均最近邻距离的大小,反映点在空间的分布特征。
最近邻距离越小,说明点在空间分布越密集,反之,越离散。
②最近邻距离的方法G 函数:欧几里德距离 计算G 函数的一般过程:1、计算任一点到其最邻近点的距离d ;2、将所有最邻近距离列表,并按照大小排序;3、计算最邻近距离的变程R 和组距;4、根据组距上线,累计计数点的数量,并计算累计频数;5、画出G (d )关于d 的曲线。
F 函数:与G 函数仅仅基于事件间最近邻距离的频率分布不同,F 函数基于区域内任意位置点与事件间最近邻距离的频率分布。
F 函数计算的三个步骤:随机选择m 个位置{p1, p2, …, pm}; 计算dmin(pi, s) :pi 到点模式S 中的任一事件的最小距离;计算:K 函数:与G 函数、F 函数只使用事件或点的最近邻距离不同,K 函数基于事件间的所有距离。
因此,K 函数不仅能探测空间模式,而且可以给出空间模式和尺度的关系。
定义22)()(),(j i j i j i y y x x s s d -+-=(#())()d K d λ=E 距任一事件距离小于的事件经验K 函数估计的四个步骤:1) 对于每一个事件s i ,以s i 为圆心、d 为半径画圆C (s i ,d )2) 计算圆内其他事件点的数量 3) 计算同一半径下所有事件的均值4) 均值除以研究区内事件密度得:空间接近性与空间权重矩阵 实质上,空间接近性就是面积单元之间的距离关系,根据地理学第一定律,空间接近性描述了不同距离关系下的空间相互作用,而接近性程度一般使用空间权重矩阵来描述。
空间自相关:空间自相关描述空间中位置上的变量与其邻近位置上同一变量的相关性。
空间权重矩阵为了测度一组地理对象的空间自相关性,必须讨论识别多边形之间关系的方法。
空间自相关衡量的是邻接区域内各单元属性值的相似程度,但首先必须定量地界定“邻接区域”的概念。
即,在计算这些统计量之前,必须定量地界定区域单元之间的邻接关系,即,空间权重矩阵。
邻居的类型:两种规则– 邻接 (公共边):二值或标准– 距离 (距离带,K -近邻)连接数统计量连接数统计量(Join Count Statistics):一般用于名义量(nominal )数据,尤其是二值变量数据。
全局空间自相关指标 ①Mo ran’s I 指数及其统计检验 、②Geary’s C 指数、③Getis’s G 指数。
三个指标计算方法相似,一般用于间隔量(interval )和比率量(ratio )数据,最常用的是Moran’s I 。
局部空间自相关指标 LISA :全局自相关的分解,描述一个面元在多大程度上与其邻居相似,或不同。
①局部 Moran’s I i 指数②局部 Geary’s C i 指数③ 局部 Getis’s G i 指数倒距离权重差值、趋势面分析倒距离加权 (IDW) 插值方法假定每个输入点都有着局部影响,这种影响随着距离增加而减弱。
步骤:a) 计算未知点到所有点的距离;b) 计算每个点的权重: 权重是距离倒数的函数。
c)计算结果之半。
1克立金方法的基本形式:对误差项的假设:期望值为0,并且 和之间的自相关不取决于s 点的位置,而取决于位移量h 。
为确保自相关方差有解,必须允许某两点间的自相关可以相等。
如,下面有箭头相连的两对位置点假设具有相同的自相关性。
)],([#d s C S i ∈2()()()ij i j i j ij i i j i w z z z z n I w z z --=-∑∑∑∑∑()s ε()s h ε+趋势值 可以被简单地赋予一个常量。
即在任何位置处①如果未知,就是普通克里金模型。
②如果在任何时候趋势已知,无论趋势是否是常量,都形成简单克里金模型。
③趋势也可以表示为:若趋势中的系数未知,就是泛克里金模型。
空间自回归模型的一般形式式中,y 是因变量,为n ×1向量;X 表示解释变量的n ×k 阶矩阵;m 是随空间变化的误差项;e 是白噪声。
W 1,W 2是空间权重矩阵。
如果对式 施加某些限定,可导出多种不同形式的空间自回归模型。
①设X =0,W 2=0,则由式推出一阶空间自回归模型(SAR ): 意义:y 的变化是邻接空间单元的因变量的线性组合,解释变量X 对于y 的变化没有贡献。
包含空间效应的方法:通过因变量自身②设W 2=0,则由式 推出回归-空间自回归组合模型(MAR ):意义:y 的变化不仅和邻接空间单元的因变量有关,而且解释变量X 对y 的变化也有贡献。
y 是因变量,经过空间加权 (W 1); ρ为系数。
③设W 1=0,则由式 推出空间误差模型:μ 是空间加权的(W 2) 误差项; λ 系数; ε 不相关的、同方差的误差向量。
包含空间效应的方法:通过误差项。
④空间Durbin 模型(SDM ):将因变量的空间延迟(spatial lag )和自变量的空间延迟项加在模型中便得到空间Durbin 模型。
地图代数中的函数与类型函数是建立在基本运算符基础上的对栅格数据的高级操作,主要函数类型包括:局部函数、焦点函数、类区函数、块函数。
①局部函数函数运算:栅格数据以某种函数关系作为分析依据进行逐网格运算,从而得到新的栅格数据。
又分为数学函数、选择函数、重分类函数、统计函数。
②焦点函数,又称邻域函数邻域分析也称窗口分析,主要应用于栅格数据模型。
邻域函数计算出的栅格数据每个象元位置上的值都是输入数据中相应位置下指定的一些邻域单元的函数. 计算出的邻域统计值是一个移动窗口,它可以对数据进行扫描。