空间数据分析报告—使用Moran's I统计法实现空间自相关的测度1、实验目的(1)理解空间自相关的概念和测度方法。
(2)熟悉ArcGIS的基本操作,用Moran's I统计法实现空间自相关的测度。
2、实验原理2.1空间自相关空间自相关的概念来自于时间序列的自相关,所描述的是在空间域中位置S 上的变量与其邻近位置Sj上同一变量的相关性。
对于任何空间变量(属性)Z,空间自相关测度的是Z的近邻值对于Z相似或不相似的程度。
如果紧邻位置上相互间的数值接近,我们说空间模式表现出的是正空间自相关;如果相互间的数值不接近,我们说空间模式表现出的是负空间自相关。
2.2空间随机性如果任意位置上观测的属性值不依赖于近邻位置上的属性值,我们说空间过程是随机的。
Hanning则从完全独立性的角度提出更为严格的定义,对于连续空间变量Y,若下式成立,则是空间独立的:式中,n为研究区域中面积单元的数量。
若变量时类型数据,则空间独立性的定义改写成式中,a,b是变量的两个可能的类型,i≠j。
2.3Moran's I统计Moran's I统计量是基于邻近面积单元上变量值的比较。
如果研究区域中邻近面积单元具有相似的值,统计指示正的空间自相关;若邻近面积单元具有不相似的值,则表示可能存在强的负空间相关。
设研究区域中存在n 个面积单元,第i 个单位上的观测值记为y i ,观测变量在n 个单位中的均值记为y ,则Moran's I 定义为∑∑∑∑∑======n i n j ij n i n j ijn i W W n I 1111j i 12i )y -)(y y -(y )y -(y式中,等号右边第二项∑∑==n 1i n 1j j i ij)y -)(y y -(y W 类似于方差,是最重要的项,事实上这是一个协方差,邻接矩阵W 和)y -)(y y -(y j i 的乘积相当于规定)y -)(y y -(y j i 对邻接的单元进行计算,于是I 值的大小决定于i 和j 单元中的变量值对于均值的偏离符号,若在相邻的位置上,y i 和y j 是同号的,则I 为正;y i 和y j 是异号的,则I 为负。
在形式上Moran's I 与协变异图{}{}u ˆ-)Z(s u ˆ-)Z(s N(h)1(h)C ˆj i ∑=相联系。
Moran's I 指数的变化范围为(-1,1)。
如果空间过程是不相关的,则I 的期望接近于0,当I 取负值时,一般表示负自相关,I 取正值,则表示正的自相关。
用I 指数推断空间模式还必须与随机模式中的I 指数作比较。
通过使用Moran's I 工具,会返回Moran's I Index 值以及Z Score 值。
如果Z score 值小于-1.96获大于1.96,那么返回的统计结果就是可采信值。
如果Z score 为正且大于1.96,则分布为聚集的;如果Z score 为负且小于-1.96,则分布为离散的;其他情况可以看作随机分布。
3、实验准备3.1实验环境本实验在Windows 7的操作系统环境中进行,使用ArcGis 9.3软件。
3.2实验数据此次实习提供的数据为以湖北省为目标区域的bount.dbf 文件。
.dbf 数据中包括第一产业增加值,第二产业增加值万元,小学在校学生数,医院、卫生院床位数,乡村人口万人,油料产量,城乡居民储蓄存款余额,棉花产量,地方财政一般预算收入,年末总人口(万人),粮食产量,普通中学在校生数,肉类总产量,规模以上工业总产值现价(万元)等属性,作为分析的对象。
4、实验步骤本报告用Moran's I检验湖北省各区域规模以上工业总产值现价(万元)的空间分布的空间自相关性。
(1)Feature to Points对于线类要素和多边形要素,程序会计算要素的几何中心点,然后对几何中心点进行分析。
这就会造成有些要素的几何中心点不在几何要素内部,如果想达到此目的,需要先用Feature to Points工具进行转换后再进行分析。
在ArcToolbox中选择Data Management Tools----->Features----->Feature To Point,在Input Features选项中选择bount.shp文件。
图1转换对话框图2转换结果(2)Moran's I指数计算在ArcToolbox中选择Spatial Statistics Tools----->Analyzing Patterns----->Spatial Autocorrelation(Moran's I),在Input Features Class选项中选择bount_FeatureToPoint2.shp文件,在Input Filed中选择属性“规模以上工”,在Conceptualization of Spatial Relationships中选择Inverse Distance Squared。
图3Spatial Statistics Tools图4Spatial Autocorrelation对话框图5Moran's I结果展示(3)Anselin Local Moran's I指数计算在ArcToolbox中选择Spatial Statistics Tools----->Mapping clusters------> Cluster and Outlier Analysis(Anselin Local Moran's I),在Input Features Class选项中选择bount.shp文件,在Input Filed中选择属性“规模以上工”,在Conceptualization of Spatial Relationships中选择Inverse Distance Squared。
图6Anselin Local Moran's I对话框图7Anselin Local Moran's I结果展示图8Anselin Local Moran's I结果一览图9新增要素使用该工具会输出一个新的要素类。
该要素类在原要素类上添加了两个字段,分别为LMi Index<distanc e_method>、LMi ZScore<distance_method>和IMi PValue,前两个分别代表各个要素的索引值I和Z score值。
如果索引值I为正,则要素值与其相邻的要素值相近,如果索引I值为负值,则与相邻要素值有很大的不同。
如果Z score为正且越大,则要素越与相邻要素值相近,相反,如果Z scor e值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。
5、结果分析(1)Moran's I结果分析图10Moran's I指数结果图Moran's I指数的变化范围为(-1,1)。
如果空间过程是不相关的,则I的期望接近于0,当I取负值时,一般表示负自相关,I取正值,则表示正的自相关。
用I指数推断空间模式还必须与随机模式中的I指数作比较。
上图显示Moran's I的值为0.09,接近于0,可以认为整体上湖北省各区域的规模以上总产值的空间分布是不相关的。
图11湖北省地图从上述湖北省地形图可以知道,湖北省地形复杂,且东西地形差异大,导致交通要素的差异(西部山区交通不便,而东部尤其是武汉城市圈交通十分便捷);地理区位差异大,资源丰富度不同(如大冶市拥有丰富的铁矿资源),经济发展起步不同及各区域的经济地位的不同,导致各区域经济发展差异且无规律分布,因而呈现出空间自相关模式中的随机模式。
(2)Anselin Local Moran's I结果分析图12Z Score值图示图13Anselin Local Moran's I结果视图图14原因分析根据聚集及分析特例工具的原理,z score为正且越大,则要素越与相邻要素值相近,相反,如果z score值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。
图12显示,颜色越红表示要素与相邻要素值越接近,颜色越蓝,表示与相邻要素值差异越大。
而通过下图使用Graduated symbols所展示出来的结果显然和上面所呈现出的结果是一样的。
图15Z Score值图示图16Anselin Local Moran's I结果视图图17相关性结合本实验分析对象,即京山、应城市、天门市、汉川市、仙桃市五个地区的规模以上工业总产值比较相近;而大冶市则与其相邻的咸宁市、江夏区、鄂州市、黄冈市、阳新等地区的规模以上工业总产值差异较大。
分析原因,京山、应城市、天门市、汉川市、仙桃市地形地势因素接近,最主要的是都位于武汉城市圈的辐射圈内,交通区位、市场潜力等因武汉市发展所带动的相关地方经济的机遇是类似的,因此其规模以上工业总产值空间分布呈现出较强的空间相关性。
对于大冶市,大冶市的大冶矿产丰富,素有“百里黄金地,江南聚宝盆”之美誉。
已发现和探明的大小矿床273处,金属矿、非金属矿53种是全国6大铜矿生产基地,10大铁矿生产基地和建材重点产地。
黄金、白银产量居湖北省之冠,硅灰石储量居世界第二。
其工业发展起步早,发展快,丰富的矿产资源推动了大冶市的经济发展,因而其工业总产值明显高于周围其他市县。
导致其周围地区的规模以上工业总产值的空间分布的相关性较弱。