当前位置:文档之家› 地理信息科学B考试题库以及答案

地理信息科学B考试题库以及答案

1.什么是空间插值?空间插值就是利用离散点构建一个连续的曲面。

它的目的是使用有限的观测值,通过估计值对无数据的点进行填补。

(推论1)当只有内蕴量信息时,可通过地统计分析,弥补外蕴量信息缺口,运用HASM 构建高精度曲面。

空间插值常用于将离散点的测量数据转换为连续的数据曲面,以便与其它空间现象的分布模式进行比较,它包括了空间内插和外推两种算法。

(百科)尺度转换是指利用某一尺度上所获得的信息和知识来推测其它尺度的现象,包括升尺度和降尺度。

2.什么是空间降尺度?降尺度转换是指将粗分辨率数据向细分辨率转换。

(推论2)当粗分辨率宏观数据可用时,应补充地面观测信息,并运用HASM对此粗粉辨率数据进行降尺度处理,可获取更高精度的高分辨率曲面。

许多模型和数据由于空间分辨率太粗而无法用于分析区域尺度和局地尺度问题。

为了解决这个问题,需要研发降尺度方法,将粗分辨模型输出结果和粗分辨率数据降尺度为高空间分辨率数据。

3.什么是空间升尺度?升尺度是指将细分辨率数据向粗分辨率转换。

在许多情况下,为了节约计算成本,需要将细分辨率数据转换为粗分辨率数据,此过程称之为升尺度。

推论3(升尺度):当运用HASM将细分变率曲面转化为较粗分辨率曲面时,引入地面细节数据可提高升尺度结果的精度。

4.什么是数据融合?数据融合是将表达同一现实对象的多源、多尺度数据和知识集成成为一个一致的有用形式,其主要目的是提高信息的质量,使融合结果比单独使用任何一个数据源都有更高精度。

推论4(数据融合):卫星遥感信息可用时,必须补充来自地面观测信息,尚可运用HASM构建地球表层及其环境要素高精度曲面,得到较遥感信息更高精度的结果。

推论5(数据融合):卫星遥感信息和地面观测信息可用时,可运用HASM构建地球表层及其环境要素高精度曲面,获得较卫星遥感信息和地面观测信息精度都高的结果。

5.什么是数据同化?数据同化就是将地面观测数据并入系统模型的过程,其目的是提高系统模型的精度。

推论6(数据同化):当动态系统模型可用时,补充地面观测信息可提高HASM构建曲面的精度,其精度高于动态系统模型模拟结果。

推论7(数据同化):当动态系统模型和地面观测信息可用时,可运用HASM构建高精度曲面,获得较动态系统模型和地面观测信息精度都高的结果。

6.简述空间相关性的含义。

空间上相关的一系列对象表现出的特殊的统计性联系。

空间自相关(spatial autocorrelation)是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性。

Tobler(1970)曾指出“地理学第一定律:任何东西与别的东西之间都是相关的,但近处的东西比远处的东西相关性更强”。

(百科)7.简述Moran's I的含义和应用。

Moran's I是用来度量空间自相关的全局指标,反映的是空间邻接或空间邻近的区域单元属性值的相似程度。

(中心值与周围值之和的线性回归)Moran指数I的取值一般在[-1,1]之间,<0负的空间自相关,>0正的空间自相关,=0表示表明不存在空间自相关,即观测值在空间上随机排列。

应用:中国大陆省级行政区人均GDP的空间关联分析,如果全局Moran指数均为正值;在正态分布假设之上,对Moran指数检验的结果也高度显著。

就是说各省级行政区人均GDP 水平的空间分布并非表现出完全的随机性,而是表现出相似值之间的空间集聚,其空间联系的特征是:较高人均GDP水平的省级行政区相对地趋于和较高人均GDP水平的省级行政区相邻,或者较低人均GDP水平的省级行政区相对地趋于和较低人均GDP水平的省级行政区相邻。

全局指标计算结果只有整体的一个值局部指标是每个省份都能算出一个值8.简述LISA指数的含义和应用。

空间联系的局部指标(local indicators of spatial association,缩写为LISA)满足下列两个条件:(1)每个区域单元的LISA,是描述该区域单元周围显著的相似值区域单元之间空间集聚程度的指标;(2)所有区域单元LISA的总和与全局的空间联系指标成比例。

LISA包括局部Moran指数(local Moran)和局部Geary指数(local Geary)应用:将Moran散点图与LISA显著性水平相结合,可得到“Moran显著性水平图”;作图可显示出显著的LISA区域,并分别标识出对应于Moran散点图中不同象限的相应区域,仍以中国大陆省级行政区人均GDP进行计算,如果位于第1和第3象限内,为正的空间联系,属于低低集聚和高高集聚类型,如果位于第2和第4象限内,为负的空间联系,属于低高集聚和高低集聚类型9.简述空间数据的特点。

空间自相关:相邻的点属性值相似(详见6)和空间异质性:一个区域内某一性状、事件或关系的不均匀分布,可分为空间局域异质性(spatial local heterogeneity)和空间分层异质性(spatial stratified heterogeneity)。

前者是指该点属性值与周围不同,例如热点或冷点;后者是指多个区域之间互相不同,例如分类和生态分区。

空间局域异质性可用LISA,Gi和SatScan来检验;空间分异性可用地理探测器q-statistic来检验。

or它指的是一个区域内每个物种的不同浓度的不均匀分布or空间上的特征差异,这个特征可以是均值、方差、空间自相关等(课件上)空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据,它可以用来描述来自现实世界的目标,它具有定位、定性、时间和空间关系等特性。

定位是指在已知的坐标系里空间目标都具有唯一的空间位置;定性是指有关空间目标的自然属性,它伴随着目标的地理位置;时间是指空间目标是随时间的变化而变化;空间关系通常一般用拓扑关系表示。

空间数据是一种用点、线、面以及实体等基本空间数据结构来表示人们赖以生存的自然世界的数据。

空间数据具有三个基本特征:空间特征(定位)、属性特征(非定位)、时间特征(时间尺度)。

(百度)10.简述空间抽样三位一体原理。

(王劲峰,第二讲里面)EIV三位一体:地学对象ℜ,空间抽样ℑ,统计推断Ψ●地学对象:独立同分布(σ)、空间自相关(r)、空间分异性(q)、混合(&=r+q)●空间抽样:随机R,系统T,分层S,聚类C●统计推断:简单平均A,分层统计S,IDW(D),kriging(K),MSN(M)11.简述样本纠偏方法。

Biased sample remedy。

(王老师2-34)样本有偏是:样本的均值不等于总体均值。

在进行抽样时,如果样本没有比较客观地反映原始总体的信息就会得到有偏的样本。

B-shade 模型充分利用了地理空间横向相关性,以及样本与区域总体之间的纵向相关性。

即使样本有偏,用B-shade模型也可以得到区域总体无偏最优估计。

考虑样本之间的相关性,通过赋予合适的权重来校正可能的偏差,最小化估计方差。

12.简述空间分异性的定义和度量。

(王劲峰,以下英文都是自己翻译的,供参考)(1)空间分异性的定义:Heterogeneous(异质性):a term used in statistics to indicate the inequality of some quantity of interest(usually a variance)in a number of different groups,populations,etc统计学中的术语,用来表示一些不同的群体、人群等的数量(通常是方差)的不均等性。

Spatial heterogeneity(空间异质性、分异性):the uneven distribution of a trait,event,or relationship across a region一个区域内某一性状、事件或关系的不均匀分布。

A property generally ascribed to a landscape or to a population.It refers to the uneven distribution of various concentrations of each species within an area.这些性质由地形或者群落引起,它是一个区域内每个物种的不同浓度的不均匀分布。

The differences of a characteristic across space.跨空间的差异The uneven distribution of a trait,event,or relationship across a region(Anselin,2010).The features might be the mean,variance and autocorrelation(Dutilleul2011).在一个地区上不均匀分布的事物的特性、活动以及相互之间的联系,这种特性可以是平均值、方差和自相关。

(2)空间分异性的度量(可参考裴韬老师讲的部分,G统计量、LISA、SatScan)13.简述数据结构在路径算法中的重要性。

数据结构是算法实现的基础,算法的操作对象是数据结构,数据结构与算法是程序的灵魂和朴素的基础。

在程序的设计中,数据结构的选择是一个基本的设计考虑因素,算法的设计取决于数据结构,而算法的实现依赖于采用的数据结构。

同样路径算法实现的困难程度和算法运行的效率(复杂度)都严重的依赖于所选择的数据结构是否合适。

例如:采用k叉堆、二项堆或Fibonacci堆优先级队列来实现Dijkstra算法,时间复杂度为O(mlogn)或O(m+nlogn);采用桶结构基数堆实现的Dijkstra算法,在假定弧段整数权值前提下,复杂度为O(m+nlogC/loglogC)(C为最大整数权值),而基数堆和F堆相结合的Dijkstra算法复杂度仅为O(m+n(logC)1/2)。

14.简述Dijkstra算法和A*算法的差异及算法的适用性。

Dijkstra算法特点:通用性好,效率依赖于具体的实现方法或运行结构。

A*算法特点:搜索下一个节点时引入了启发式估计函数,搜索过程具有方向感;但存在局部最优问题。

1.Dijkstra算法计算源点到其他所有点(single souce all destinations)的最短路径长度,A*关注点到点(single source single destination)的最短路径(包括具体路径)。

2.Dijkstra算法建立在较为抽象的图论层面,A*算法可以更轻松地用在诸如游戏地图寻路中。

3.Dijkstra算法的实质是广度优先搜索,是一种发散式的搜索,所以空间复杂度和时间复杂度都比较高。

相关主题