当前位置:
文档之家› 空间分析-(5-6):空间点数据分析
空间分析-(5-6):空间点数据分析
第五讲 空间点数据分析
--Spatial Point Data Analysis--
1. 引言 2. 点数据概述 3. 点数据分析
1. 引言
点模式分析由植物学家和生态学家在 1930s应用。但是,随后许多不同领域也 开始应用点模式分析,如考古学、流行 病学、天文学和犯罪学。 一般来说,点模式分析可以用来描述任 何类型的事件数据(incident data)。因 为每一事件都可以抽象化为空间上的一 个位置点。
ESO 99-4是一个拥有奇特形状的星系,它可能是一个早期合并过程的残余物,没有成形。ESO 99-4位于北 三角座内,距离地球大约4亿光年。
/photo/2008-04/25/content_8047673_6.htm
混凝土(10×10×10毫米) (白色为切的刚玉颗粒,黑色为气孔)
如果α=0.05,那么1000次模拟当中50个较大的值用于 获取临界值(50/1000=0.05)。如果把1000次模拟的VMR 值从小到大依次排序,第25个值将作为VMRL ,当 H0为真时1000次中有25次低于VMRL ;相似地,第 975个值将作为VMRH,当H0为真时1000次中有25 次高于VMRH 。这样,当采用该临界值时,1000次 当中有50次,或5%的几率犯第I类错误。
均匀
聚集
怎样描述点模式?
一阶效应(First-Order Effects)
– 事件间的绝对位置具有决定作用,单位面 积的事件数量在空间上有比较清楚的变化。
如,空间上平均值/密度的变化。
二阶效应(Second-Order Effects) – 事件间的相对位置和距离具有决定作用。 如,空间相互作用。
(m 1)VMR (m 1) z (m 1) / 2(VMR 1) 2(m 1)
是均值为0、方差为1的标准正态分布。 在α=0.05的情况下, 临界值分别为zL=-1.96、zH=+1.96。如果z< zL或z >zH ,则拒 绝原假设。上例中:
99 0.77 99 1.96 z 1.618 1.96 2(99)
– 对于均匀分布,方差=0,因此VMR的期望值= 0; – 对于随机分布,方差=均值,因此VMR的期望值= 1; – 对于聚集分布,方差大于均值。因此VMR的期望值 >1 。
3 5 2 1 3
1 0 1 3 1
2 2 2 2 2
2 2 2 2 2
0 0 10 0 0
0 0 10 0 0
x
随机
Quadrat # 1 2 3 4 5 6 7 8 9 10 Number of Points Per Quadrat (xi -xa )^2 3 1 1 1 5 9 0 4 2 0 1 1 1 1 3 1 3 1 1 1 20 20 2.222 2.000 1.111
蒙特卡罗模拟方法的基本思想
圆的外切正 方形的边长。
蒙特卡罗模拟方法的基本思想
当H0为真时,有一个简单的方法可以避免采用前述的模拟方 法。临界值可用x2 =(m-1)VMR具有m-1个自由度的x2 分布表 确定。 当自由度(df)比较大时, x2 =(m-1)VMR趋于正态分布。特 别地,当H0为真、df > 30的情况下, (m-1)VMR具有均值为 m-1、方差为2(m-1)的正态分布。这意味着
均匀
Number of Points Quadrat Per # Quadrat (xi -xa )^2 1 2 0 2 2 0 3 2 0 4 2 0 5 2 0 6 2 0 7 2 0 8 2 0 9 2 0 10 2 0 20 0 Variance Mean Var/Mean 0.000 2.000 0.000
轧制钢横截面(100×100 微米)573个碳化物颗粒中心
血液样本(红细胞为黑色) 矩形大小:225×182 微米
细胞表面的蛋白质位置 矩形大小:107×119 微米
“点”模式在自然与社会经济中普遍
存在。 识别空间点模式(spatial point pattern)的
目的是为了更好地理解空间点过程
总的模式是分散的,但局部有聚集现象。
②样方分析的统计检验-方差均值比的x2检验
如何比较精确地检验零假设? H0:没有空间模式 假设在一区域内通过随机放点来模拟零假设,并计算 其方差-均值比(VMR)。更进一步地,假如重复 模拟1000次,得到模拟结果的直方图,当H0为真时, 1000次VMR的均值将接近于1。直方图中VMR的尾 部值(VMR的抽样分布),当零假设为真时相对 稀少。
其中:C(p,r) 是以待估点p为 圆心、r为半径的圆。
带宽:r 如果 r太大/小,那么…… ? r 固定? r 变化?
Kernel Windows
边界?
© Paul Bolstad, GIS Fundamentals
(spatial point progress),揭示隐藏在空
间模式表象之下的空间过程的机理。
— 空间随机/ 聚集/均匀 — 过程建模
2. 点数据概述
空间点数据的三种基本分布模式
随机分布:任何一点在任何一个位置发生的概率 相同,某点的存在不影响其它点的分布。又称 泊松分布(Poisson distribution)。
③ 核密度估计(Kernel Density Estimation, KDE)
基本思想:在研究区域内的任 一点都有一个密度,而不仅仅 是在事件点上。 该密度通过计数一定区域内的 事件点数量,或核(Kernel)进行 估计。核以估计点为中心,一 定距离为半径。
#.[ S C ( p, r )] p r2
3. 点数据分析
3.1 基于密度的方法:测度一阶效应 ① 样方分析 ② 样方分析的统计检验 ③ 核密度估计
3.2 基于距离的方法:测度二阶效应
① 最近邻距离: G 函数、 F 函数 ② 最近邻距离的统计检验 ③ K 函数 (K Function)
Data 点数据
Visualization
Exploration
x
聚集
Variance Mean Var/Mean
随机
X
i 1 N i
均匀
聚集
X
N
2.00
S2
( Xi X ) 2 i 1 N 1
N
注: N = 样方数量 = 10
样方分析的缺点
结果依赖于样方的大小和方向。 密度:
n # ( S A) a a
密度依赖于研究区域的大小。 a: a, 4a, 16a, 64a n: 2, 2, 5, 10 :2.0, 0.5, 0.31, 0.15 样方分析主要依据点密度, 而不是 点之间的相互关系,所以不能区别 图示的两种情况: 样方分析不能探测区域内的变化。
①样方分析-两种方式
利用所有点: – 样方的形状、大小、方向对结果 有影响 – 如果样方太大/小,那么 ……?
随机抽样方法: – 有增加样本量的作用 – 可以描述一个没有完全数据的 空间点过程
样方形状
The term “Quadrat” strictly means a four sided figure, but in practice this term is used to mean any sampling unit, whether square, rectangular, circular, hexagonal or even irregular in outline.
Arp 240是一对大小相似的螺旋星云——NGC 5257 和NGC 5258。这两个星系显然通 过一个暗淡的恒星桥相互作用。它们两个的中心都有超大质量黑洞。Arp 240位于室 女座内,距离地球大约3亿光年。
/photo/2008-04/25/content_8047673_4.htm
均匀分布:个体间保持一定的距离,每一个点尽 量地远离其周围的邻近点。在单位(样方)中个 体出现与不出现的概率完全或几乎相等。 聚集分布:许多点集中在一个或少数几个区域, 大面积的区域没有或仅有少量点。总体中一个 或多个点的存在影响其它点在同一取样单位中 的出现概率。
点数据的三种基本空间分布模式
随机
x
Number of Quadrat Points Per # Quadrat (xi -xa )^2 1 0 4 2 0 4 3 0 4 4 0 4 5 10 64 6 10 64 7 0 4 8 0 4 9 0 4 10 0 4 20 160 Variance Mean Var/Mean 17.778 2.000 8.889
VMR = 0.77/1 = 0.77<1,趋于均匀分布。如果H0为真, 0.77是否小到可以拒绝原假设?
方法:随机模拟,均值=1
重复模拟1000次,建立VMR的抽样分布,得到的结 果从小到大排序。第25个最小值VMRL =0.747,第 975个值VMRH =1.313。 由于VMRL <0.77< VMRH ,接受原假设,即随机情况 下VMR=0.77不是特别不正常。 上述方法即所谓的蒙特卡罗模拟(Monte Carlo Simulation)。 优点:易于理解和实现 缺点:不同的人得到的模拟结果不同,e.g. 10个人可能 得到 10个不同的临界值。
抢 劫 案
Data
城市发展的空间演变模式
星罗棋布的村庄
http://www.sphere.ad.jp/togen/photo-n.html
来源:USGS
Arp 272是两个螺旋星云——NGC 6050 和 IC 1179相撞形成的,这两个星云的螺旋 臂相互扭结在一起。它们是武仙座星群的一部分。武仙座星群是已知的宇宙中最 大的结构:所谓的长城的一部分。Arp 272距离地球大约4.5亿光年。
/lundy/quadrat.htm