当前位置:文档之家› 第七章 空间数据分析模型

第七章 空间数据分析模型


盖度
蚁蝗密度
蝗虫密度、草场盖度的半方差图和交叉检验图
蚁蝗密度的协同克立格分析结果
使用地统计方法进行空间分析的优缺点仍在争论之中 1)克立格是一种最优估值技术,数据符合内蕴假设并且方差 函数定义得当的条件下。预测误差与其他局部权重方法相 比要低。 2)“真实”变异越平滑,方差函数拟合和估值越容易,基底方 差也越低, 预测误差也低。
3 生态学谬误
• 当特定汇总层次的观察值之间的统计关系 假定可以接受,并且在更细的层次接受同 样关系的时候,产生这个问题
• 将得到的整体内的关系推论到个体之中
4 空间尺度
• 不同对象的表现需要的不同尺度
• 在大陆尺度,城市用点来表示。在区域尺 度,城市用面来表示。在局部尺度,城市 成为复杂的点、线、面和网络的集合体。 • 研究对象的空间尺度影响空间分析。因此, 应当选定正确的或合适的空间尺度
• 空间数据分析(Spatial data analysis)
– 对具有空间坐标的属性 数据的分析
空间数据分析模型
• 针对空间数据所建立起来的反映数据空间 变异规律的模型,这些模型可以揭示地理 现象的本质特征,并用来进行空间预测
一 空间数据分析中的若干问题
• • • • • 空间自相关 可变区域单位问题 生态学谬误 空间尺度 空间非均一性和边界效应
wij
pi p j dij
k
近邻
• 特定空间实体的近邻是与该实体邻接的其 他空间实体的集合 • 近邻依赖于邻接的定义
距离、邻接、交互、近邻的关系
三 空间自相关分析
• 空间中相近的样点具有某种相似性,相距 较远的样点往往不相似-空间自相关 • 解释和寻找存在的空间聚集性或“焦点”
空间自相关的类型
2. GerayC参数
• 进行局部自相关分析 • C值大于0,表明正的值四周为高值环绕, 小于0,则为低值环绕,0则为无聚集特征。
3. G统计量
• 局部自相关分析
• 较高的G值表明位置周围是较高的数据,即数据 具有聚集性 • 模拟表明 (Ord 和 Getis 1994),在xi 周围不存在 空间聚集的原假设的条件下,G的分布接近与正 态。对于不同的观察值N,在不同的显著性概率 下G值各不相同。 • 例如,在90%的概率下,N=40对应的G值为 2.7913。
1 空间自相关
• 空间中相近的样点具有某种相似性, 相距较远的样点往往不相似-空间自
相关
空间自相关
• 空间自相关性使得传统的统计学方法不能 直接用于分析地理现象的空间特征 • 传统的统计学方法的基本假设就是独立性 和随机性。为了分析具有空间自相关性的 地理现象,需要对传统的统计学方法进行 改进与发展,从而产生了空间统计学
第七章 空间数据分析模型
空间数据分析模型
一 空间数据分析中的若干问题 二 空间数据关系 三 空间自相关分析 四 空间变异性 五 趋势面分析 六 区域化变量与克里格插值
区分两个概念
• 空间分析(Spatial analysis)
– 对空间对象之间关系的 分析 – 通过分析空间坐标的关 系得到对空间对象的关 系
当dZ很小时两者接近
不同方向的方差云图
高 程 差 异 的 平 方 根
高程点间的距离
高 度 差 的 平 方 根
XLS
间隔
草地蝗虫分布的空间变异
• 倪绍祥教授国家基金的中相关工作 • 草地蝗虫的危害性
<10
<15
<5
<20
A
B
半方差图 A:各向同性 B:各向异性
A
B
半方差模型参数 A:各向同性 B:各向异性
• 2协方差的二阶平稳性 和半方差函数的内秉 性平稳
– 在相同方向和相同距离 的任意两点之间的协方 差相同。协方差依赖于 距离而不是位置
2 方差变异函数
度量Z的空间连续性的自然方法是比较间隔为 h的两个点x,x+h的值Z(x)和Z(x+h) 一个直接的度量关系是两个值间的绝对差 dZ( h)= Z(x)- Z(x+h)
• 全程自相关 • 局部自相关
– 相关的范围
自相关性测度
• 空间数据类型:点或面
• Moran’sI, GearyC和G参数(Getis和Ord, 1992, 1995, 1996)
• 有关算法参PDF
1. Moran’sI
• 包括全程和局部两个参数,用来分析空间 的相关性 • I值越大,表明正的空间相关性越强
距离
• 空间实体间的直线距离或球面距离
ห้องสมุดไป่ตู้
D
邻接
• 是名义的、双向的相 等的距离
• 指定距离 内
– 有相对性
• 实体相邻
D
交互
• 是距离和邻接的综合 • 出发点:事物与近处的关系更密切 • 从数学上讲,可将两个空间实体之间的交 互度表示为0(无交互)和1(高度交互) 之间的数
交互的一个定义方式
1 wij k dij
要处理的问题是:有两个空间变量,如果第二个变量的分
布广,采样密度更高,而第一个变量难以测定或测定的费 用较高,那么,可以利用有限样本的变量之间的空间关系 来改进对于第一个变量的估计。
步骤
1 定义协同变量(第一个变量和第二个变量) 2 对两个变量进行半方差分析(包括方差图 模型),识别观察值的空间关系特征,并 用函数模型化 3 进行交叉半方差分析,确认两个变量相关 性 4 进行空间估计和预测
为什么叫空间自相关?
• 相关 • 自相关 • 空间自相关
2 可变区域单位问题
• 统计汇总的区域层次不同,统计结果间的 关系也就不同 • 由汇总单位产生的影响有两个
– 第一个影响与分析的空间尺度和汇总效应有关。 汇总之后的平均值更接近于回归线,使得散点 图的结果更接近于线性,导致相关系数增加。 一般通过汇总往往产生更好的拟合结果。 – 第二个影响是不同汇总方法得到的结果实质上 是不同的。
3)数据越多,方差函数估计越准确。
4)一旦实验方差函数拟合成理论方差函数,点位和块段克立 格插值方差取决于数据空间结构和方差函数模型的形态, 而不是数值本身。常规制图方法的预测误差决定于均质土 壤区域的确认。
5)块段克立格在点位数据集成到更大区域时非常有用,它通 过概括可以降低预测误差。
6)大多数插值技巧,包括克立格,都平滑数据,所以极大和 极小值都被去除。这些极端值可能有必要保留。 7)当数据不足时,所有非地统计方法都可以给出一张图。但 是你不知道它的质量到底如何。当数据足以计算方差函数 时,克立格方法就具有连续变异的独立样点预测方差而言 优于其他方法,当变异不连续时,单值景观制图结果可能 更好。 8)当数据丰富时,所有插值方法结果相近。效率最高的计算 和插值工具就是最好选择。克立格方法的主要困难之一就 是缺乏便宜、易用的软件
• 传统上,科学家通过定义系统分类单元和 均质制图单元来逐渐排除过多的变异,直 到可以操作的程度
两种模型的差异
• 假设是均质的 • 通过采样确定均质区 的差异 • 产生分布图 • 假设是变异的 • 通过采样确定变异的 程度和范围 • 产生分布图
分析变异的方法
• 确定性方法
– 不承认属性观测值的不确定 性 – 连续模型认为性质的变化是 一个平稳的可微分过程,而 常规模型认为类型图没有内 部变异
怎么获得趋势面
• 多项式回归分析
– 趋势面分析的实质是进行数据的拟合,对因变 量无特别的要求,自变量是地理坐标
• Y=f(x,y)
– Y=c0+a1*x1+b1*y1+c1x1*y1+…
• 不注重精度和检验
六 区域化变量与克吕格插值
1 区域化变量
• 地统计学方法假定在一定空间范围内性质的 变异可以用一个连续随机但是空间上相关的 随机域来模拟。这样的性质称为区域化变量
A. 单值图
A1
...
An
计算和上色
B. 单值图加点位数据
A1
...
An 计算平均和上色
C. 点位数据
插值
等值线图
A1
...
An 栅格图
4 空间数据插值
• 利用点的信息估计未知点的值 • 存在多种插值方法
– – – – – GRID TIN 克里格 等方位差值 趋势拟合法
五 趋势面分析
• 空间的变化规律 • 原因分析 • 观测面=区域趋势十局部异常+随机干扰
各向同性的点克立格插值
3.2 泛克里格
普通克立格方法(OK)要求数据是二阶平稳的 或纯平稳的。如果数据在空间上存在明显 的趋势,那么,应该使用泛克立格方法进 行分析
步骤
1趋势分析 分析数据中存在的空间上的变化趋势,获得拟合模型。 这部分的分析内容与前面的趋势面分析相同 2 残差的克立格分析 与普通克立格分析相同,不同的是,使用的数据是原 始数据减去趋势数据,即残差数据
四 空间变异分析
• 特定时刻现象在空间上的变 化 • 地理学的主要研究内容
1 空间变异
空间变异是空间不相似 从量变到质变的过程
• 空间连续性是空间属性的最基本性质
• 空间中相近的样点具有某种相似性,相距较远的 样点往往不相似 • 不相似性增大到某种程度即产生了空间变异 • 空间变异
– 复杂变异 – 规则变异
3 克里格插值
• 利用原始数据和半方差函数的结构性,对 未采样点的区域化变量进行无偏最佳估值 的一种方法。该方法的一个有用特点是能 够计算出每个估值的误差大小(估值方差), 从而能知道估值的可靠性程度。 • 多种类型,如简单克立格,正常克立格, 点状克立格,块段克立格,通用克立格, 协克立格,不连续克立格及指标克立格等
3 泛克立格插值 将趋势面分析和残差的克立格插值结果加和,即构成 了泛克立格方法分析的结果
相关主题