第九章空间统计分析
2. 模式分级
模式分级就是指按固定模式进行分级,在固 定模式中,级差由特定的算法自动设定。
主要包括:等间距分级 分位数分级 等面积分级 标准差分级 自然裂点法分级等
10.5 空间插值
空间内插可被定义为根据已知的空间数据估 计(预测)未知空间的数据值。
空间内插的根本是对空间曲面特征的认识和 理解。
目标
缺值估计:估计某一点缺失的观测数据,以 提高数据密度
内插等值线:以等值线的形式直观的显示数 据的空间分布
数据格网化:把无规则分布的空间数据内插 为规则分布的空间数据集,如规则矩形格网、 三角网等
插值的工作流程
插值方法(模型)的选择 空间数据的探索分析,包括对数据的均值、
方差、协方差、独立性和变异函数的估计等 插值方法评价 重新选择插值方法,直到合理 空间内插
克立金法(Kriging)
克立金法与最小二乘配置比较类似,也是将变量的空间 变化分为趋势、信号与误差三个部分,求解过程也比较 相似。不同之处在于所采用的相关性计算方法上,最小 二乘采用协方差矩阵,而克立金法采用半方差,或者称 为半变异函数。
克立金法的内蕴假设条件是区域变量的可变性和稳定性, 也就说,一旦趋势确定后,变量在一定范围内的随机变 化是同性变化,位置之间的差异仅仅是位置间距离的函 数。通过不同数据点之间半方差的计算,可作出半方差 随距离的变化的半方差图,从而用来估计未采样点和采 样点之间的相关系数,进而进行插值。
10.6.1经典统计回归模型
如果认为因变量Y与解释变量x1,x2,…,xp之 间具有线性相关关系,那么,它们的关系可以 表示为线性回归预测模型。
其中,b0为常量,表示不能用其它自变量表示 的部分,b1,b2,…,bp为各解释变量的系数, 其标准化值表示对因变量的影响大小,为误差 项,要求符合正态分布。
方法
数据分布规律 :有基于规则分布数据的内插方法、基于 不规则分布的内插方法和适合于等高线数据的内插方法 等;
内插函数与参考点的关系方面 :曲面通过所有采样点的 纯二维插值方法和曲面不通过参考点的曲面拟合插值方 法;
内插曲面的数学性质 :多项式内插、样条内插、最小二 乘配置内插等内插函数;
插点的值。
逐点内插法需要解决的问题
内插函数 邻域大小和形状 邻域内数据点的个数 采样点的权重 采样点的分布 附加信息
原则
对于众多的空间内插方法而言,没有绝对最 优的空间内插方法,只有特定条件下的最优 方法
必须依据数据的内在特征,依据对数据的空 间探索分析,经过反复实验,选择最优的空 间内插方法。同时,应对内插结果做严格的 检验。
10.6空间回归分析
回归分析是研究两个或两个以上的变量之间 关系的一种统计方法,在进行分析、建模时, 常选用其中一个为因变量,其余的作为解释 变量,然后根据样本资料,研究解释变量与 因变量之间的关系。空间回归在经典的统计 回归分析中考虑了空间的自相关性,这种模 型在上世纪七十年代后期开始出现并逐步成 熟。由于在经典的回归中加入了空间关系, 通过空间关系把属性数据与空间位置关系结 合起来,空间回归可以更好的解释地理事物 的空间关系。
10.5.1整体内插
整体内插的优点,整个区域上函数具有唯一 性、能得到全局光滑连续的空间曲面、充分 反映宏观地形特征等。
整体内插函数常常用来揭示整个区域内的地 形宏观起伏态势。在空间内插中,一般是与 局部内插方法配合使用,例如在使用局部内 插方法前,利用整体内插去掉不符合总体趋 势的宏观地物特征。
对地形曲面理解的角度 :克立金法、 多层曲面叠加法、 加权平均法、分形内插等;
内插点的分布范围 :整体内插、局部内插和逐点内插法。
10.5.1整体内插
就是在整个区域用一个数学函数来表达地形曲 面
10.5.1整体内插
整体内插函数通常是高次多项式,要求地形 采样点的个数大于或等于多项式的系数数目。
第10章 空间统计分析
10.4 分级统计分析
分级是对数据进行 加工处理的一种重 要方法,通过分级 可以把数据划分成 不同的级别,进行 专题制图
分级统计图法
又称分区分级统计图法或平均值统计图法。 表示一定区域范围内某种制图现象平均密度的方法。
一般通过不同色级或不同疏密的晕线,反映各区现 象的集中程度和发展水平的分布差别,并只能显示 不同区域单位的差别,同一区域内局部差异得不到 反映。
简化表示 :
10.6.2空间加权回归模型
10.6.3空间联立自回归模型
y是空间自相关的,模型形式变化为空间滞后模型:
误差是空间自相关的,模型的形式变化为空间误差模型:
本章小结
通过统计分析进行描述 通过空间探索分析确定异常和总体的趋势 通过数据分级进行表达 通过单要素的空间插值获取未知点的数据 通过多要素的空间回归获取未知点的数据
克里金插值的基本流程
分析数据的分布特征,进行必要数据转换 分析数据的空间变化趋势 确定变异方差的函数类型 选择合适的搜索半径和邻近数据点数,选择
合适的插值方法进行插值
10.5.3逐点内插
所谓逐点内插,就是以内插点为中心,确定一 个邻域范围,用落在邻域范围内的采样点计算 内插点的高程值
故该法采用的统计单位愈大,反映的现象分布愈概 略,一般使用相对数量指标。
指标的分级愈多,反映制图现象愈详细,但分级过 多,会造成界线混乱,使现象差别显示不清。
10.4.1 数据分级与目的
概念
根据一定的方法或标准把数据分成不同的级别, 也就是把一个数据集划分成不同的子集,在此 过程中,还可设置分级精度和分级数目等。
10.5.2局部分块内插
将地形区域按一定的方法进行分块,对每一块根据地形 曲面特征单独进行曲面拟合和高程内插,称为空间分块 内插
多项式内插 样条函数 多层曲面叠加法 克立金法(Kriging) 有限元内插
10.4.2 分级的原则
科学性原则 完整性原则 适用性原则 美观性原则
10.4.3 分级统计的方法
按使用分级方法的多少可分为单一分级法和 复合分级法
按级差是否相等可分为等值分级法和不等值 分级法
按确定级差的方法可分为自定义分级法和模 式分级法
1. 自定义分级
自定义分级即对一个数据集,根据自己的应 用目的设定各个级别的数值范围来实现分级 的方法。这种方法适用于研究者对该数据集 比较了解,能够找到合适的分级临界点。
当地形采样点的个数与多项式的系数相等时, 这时能得到一个唯一的解,多项式通过所有 的地形采样点,属纯二维插值;而当采样点 个数多于多项式系数时,没有唯一解,这时 一般采用最小二乘法求解,即要求多项式曲 面与地形采样点之间差值的平方和为最小, 属曲面拟合插值或趋势面插值。
10.5.1整体内插
从数学角度讲,任何复杂的曲面都可用多项式在任 意精度上逼近, 但在整体内插中有如下问题: 整体内插函数保凸性较差 不容易得到稳定的数值解 多项式系数物理意义不明显 解算速度慢且对计算机容量要求较高 不能提供内插区域的局部地形特征
数据分级之后,仅使原来的数据重新归类,数 据的属性没有发生改变,研究人员可以根据分 级后的数据进行下一步的应用分析。
10.4.1 数据分级与目的
目的
数据分级的根本目的在于区分数据集中个体的 差别,分级统计的过程就是区别个体性质的过 程。
分级的应用目的有两点:一是为了分级后,图 面制图效果好,有利于用户读图;二是用不同 的分级方法来突出显示制图区域内不同的地貌 特征。
与局部分块内插的区别
局部内插中的分块范围一经确定,在整个内 插过程中其大小、形状和位置是不变的,凡 是落在该块中的内插点,都用该块中的内插 函数进行计算
逐点内插法的邻域范围大小、形状、位置乃 至采样点个数随内插点的位置而变动,一套 数据只用来进行一个内插点的计算
逐点内插法的基本步骤
定义内插点的邻域范围; 确定落在邻域内的采样点; 选定内插数学模型; 通过邻域内的采样点和内插计算模型计算内