1.零假设(null hypothesis):指进行统计检验时预先建立的假设。
在空间统计中,零假设指的就是空间位置在一定区域里面呈现完全随机(均匀)分布。
在检验结果之前,先对这些结果假设一个数值区间,这个区间一般是符合某种概率分布的情况,如果真实结果偏离了设定的区间,就表示发生了小概率事件。
这样原来的假设就不成立了。
如果计算结果落在-2到2之间,就表示假设是可以接受,但是不在这个范围内,就说明发生小概率事件了。
有两种可能:1,假设有错误;2,出现了异常值。
2.z得分(Z scores)表示标准差的倍数标准差:总体各单位标准值与其平均数离差平方的算术平均数的平方根”也就是“标准差能反映一个数据集的离散程度”。
比如z得分是+2.5,得到的结果是标准差的正2.5倍,表示数据已经高度聚集。
反之,如果是-2.5,那么就表示标准差的负2.5倍,就是高度离散的数据。
置信度:数据落在期望区间的可能性在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的6.Moran’s I 法高的自相关性代表了空间现象聚集性的存在,空间自相关分析的主要功能在于同时可以处理数据的区位和属性。
全域型Moran’s I 计算方式是基于统计学相关系数的协方差关系推算出来的。
I 值一定介于-1 到1 之间,大于0 为正相关,且值越大表示空间分布的相关性越大,即空间上聚集分布的现象越明显,反之,值越小代表空间分布相关性小,而当值趋于0 时,代表此时空间分布呈现随机分布的情形。
若I 值大于0,说明相邻地区拥有相似的数据属性,属性值高或低的地区都有聚集现象;若I 小于0,说明相邻地区属性差异大,数据空间分布呈现高地间隔分布的状态;若I 趋近于0,则相邻空间单元间相关低,某空间现象的高值或低值呈无规律的随机分布状态。
若I 值显著大于I 的期望值(I 值为正值且显著),说明两点存在相似关系,若I 值显著小于I 的期望值(I 值为负值且显著),说明两点存在不相似关系。
区域空间自相关值累加之和即全域空间自相关Moran’s I 值。
其对应的公式为:7. 多距离空间聚类分析(Ripley's K 函数)Ripley's K方法是一种点数据模式的分析方法,利用Ripley's K函数对点数据集操作步骤(方法)一、参考文献《多尺度人口增长的空间统计分析》,练习多距离L(d)、全局Moran’I与G*统计量分析,显著性检验的置信区间定义为90%定义工作空间,对province数据添加投影,选择兰勃特投影处理数据,将统计数据汇总连接到省区的shp文件;右键点击“province”,采用Symbology/Quantities/Graduated colors来符号化“人口增长率”字段;观察分布格局;分布格局为:西部部分地区的人口增长率要明显高于东部,如青海,西藏,新疆。
北方地区主要是京津地区增长率较高,南方的上海和广东地区人口增长率高。
由此可知,人口增长率最高的地方主要是发达的地区和贫困地区。
发达地区由于人口迁入导致,而贫困地区是由于出生率高于死亡率导致。
提取质心点,求取点对之间的距离;k(d)函数先利用province计算点距离,最短为30734米,最长为2216312米则步长为十,Beginning_Distance (起算距离)选择30000米,Distance_Increment (递增步长)选择220000米红线是观察值,蓝线是期望值,当观察值在期望值上面的时候,是有集聚关系当观察值处于期望值之下的时候是离散分布。
Global Moran’I分析:通过Morans’I 指数判断可以判断人口增长率是否存在集聚。
Moran’s Index:0.202915大于0,是观测的Moran’s 指数,表示要素呈现空间正相关。
Expected Index-0.030303 小于0,是期望的Moran’s 指数,表示按期望应该是空间负相关。
Variance:0.011789,方差很小接近于0 表示统计值之间差异并不大。
z-score:2.147959,绝对值小于2.58 对应显著性水平,表示正相关不是非常显著。
p-value:0.031717 小于0.1,表示随机分布的可能性小于10%,相关的可能性大于90%。
二、对adabg00数据进行全局与局部的moran I与G统计量分析;拉丁人口分布:进行G统计量分析利用Getis-Ord General G 统计量度量高值或低值的聚集程度。
打开ArcToolbox—Spatial Statistics Tools—Average Patterns—High/Low Clustering (Getis-Ord General G)输入图层选择adabg00.shp,统计的字段是Latino 字段。
勾选Generate Report 选项。
空间关系选择Inverse Distance(反距离),选项还有反距离平方等。
计算距离方法选择欧式距离。
是否进行标准化选择默认NONE。
点击OK。
结果显示:分析:阿达县的拉丁裔人口分布具有空间集聚特征,且是高密度人口和高密度人口聚集。
Expected General G:0.000172,表示期望的G 统计量。
Variance:0.000000,方差很小接近于0 表示统计值之间差异很小。
z-score:3.770902,绝对值大于2.58 对应显著性水平,表示聚集非常显著。
p-value:0.000163 小于0.1,表示随机分布的可能性小于10%,聚集分布的可能性大于90%,即聚集显著。
全局moran I利用全局Moran's I 统计量根据要素位置和属性值测量空间自相关性。
打开ArcToolbox, Spatial Statistics Tools, Average Patterns(分析式), Spatial Autocorrelation (Moran I)输入图层选择adabg00.shp,统计的字段是Latino 字段。
勾选Generate Report 选项。
空间关系选择Inverse Distance(反距离),计算距离方法选择欧式距离。
是否进行标准化选择默认NONE。
点击OK。
分析:阿达县的拉丁裔人口分布具有空间集聚特征,但通过Morans’I 指数无法判断是高密度人口和高密度人口聚集还是低密度人口和低密度人口聚集。
Moran’s Index:0.053588 大于0,是观测的Moran’s 指数,表示要素呈现空间正相关。
Expected Index-0.006849 小于0,是期望的Moran’s 指数,表示按期望应该是空间负相关。
Variance:0.000096,方差很小接近于0 表示统计值之间差异并不大。
z-score:6.164895,绝对值大于2.58 对应显著性水平,表示正相关非常显著。
p-value:0.000000 小于0.01,表示随机分布的可能性小于1%,相关的可能性大于99%。
局部的moran ICluster and Outlier Analysis (Anselin Local Moran's I)该工具是局部Moran I 算法的实现,可以反映要素与周边要素的相似程度打开ArcToolbox, Spatial Statistics Tools, Mapping Clusters, Cluster and Outlier Analysis(Anselin Local Morans I)。
输入图层选择adabg00.shp,统计的字段是Latino 字段。
空间关系选择Inverse Distance(反距离),计算距离方法选择欧式距离。
是否进行标准化选择默认NONE。
点击OK。
打开生成的新图层。
该新图层有147 条记录,8 个字段,若Local Moran's I index为正,说明该点与邻域内点相似,若为负,说明该点与邻域内点相异。
COType_IDW 有4 种结果:HH,HL,LL,LH(HH 代表高高值聚集,LL 代表低低值聚集,HL 代表高值被低值包围,LH 代表低值被高值包围)。
检测该县拉丁裔人口是否存在局部“热点”该工具是局部G 指数的实现,可以反映高值或低值在空间上的聚集区域。
也就是我们常说的热点分析,可用来生成热点图。
输入图层选择adabg00.shp,统计的字段是Latino。
空间关系选择FIXED_DISTANCE_BAND,计算距离方法选择欧式距离。
是否进行标准化选择默认NONE。
点击OK。
打开生成的新图层。
该新图层有147 条记录,6 个字段,在属性表中添加Z 分数和P 值两个字段。
如果Z 值越大且P 值越小,说明为热点区域(即高高值的聚集区域);如果Z 值很小(为负)且P 值很小,说明为冷点区域(即低低值的聚集区域)。
标准差越小聚集度越高(是热点或冷点的可能性就越大)。
阿达县的拉丁裔人口分布存在局部的“热点”。
三、对deer数据进行基于距离的最近邻分析与L(d)分析;统计检验的置信区间设定为90%。
(1)Average Nearest Neighbor Summary(最近邻统计)信息z-score:-10.955129,绝对值大于2.58 对应显著性水平,在这里表示聚集非常显著。
p-value:0 小于0.01,表示随机分布的可能性小于1%,非随机分布的可能性大于99%,在这里表示聚集非常显著。
Observed Mean Distance:25.313385 Meters,表示观测平均距离值。
Expected Mean Distance:41.983181 Meters,表示期望平均距离值。
Nearest Neighbor Ratio(最近邻指数):0.602491,表示观测平均距离值与期望平均距离的比值。
存在问题与解决办法1.利用k(d)函数计算province点距离的时候,权重字段选择人口增长率的时候,会出现操作失败,当不选择权重字段的时候可以实现。
当不选择权重字段的时候,是没有权重还是说有默认的权重,如果是用默认的权重,那么默认的权重是什么呢?解决办法:通过将province导出后生成新的一个文件重新进行操作,可以实现。
关于是否有默认的权重,不是很清楚,需要咨询老师。
2.红线是观察值,蓝线是期望值,当观察值在期望值上面的时候,是有集聚关系当观察值处于期望值之下的时候是离散分布。
通过右侧这个表还可以发现什么信息,灰色的两条线是什么?该如何准确表达右图的信息?3.希望老师能给讲解一个样本:例如如下的表的信息如何读取,能得到那些规律?Welcome To Download !!!欢迎您的下载,资料仅供参考!。