当前位置:文档之家› 总复习-空间分析&区域模型

总复习-空间分析&区域模型


三、探索性空间数据分析
1. 2. 3. 4. 概述 茎叶图 箱线图&五数总结 核密度估计(Kernel Density Estimation, KDE)
1. 概述
三种类型的数据分析
Classical
Problem Data Model Analysis Conclusions
EDA
• 核密度估计(KDE) 是估计一个随机变量概率密度 函数(pdf)的非参数方法。 • If x1, x2, ..., xn ~ ƒ is an independent and identicallydistributed(i.i.d) sample of a random variable, then the kernel density approximation of its probability density function is
Exploratory Data Analysis(EDA)
“Exploratory data analysis is an attitude, NOT a bundle of techniques” (Tukey 1977). “Let data speak for themselves”
可变面元问题:尺度效应
x = 均值,n=9
x=(10+5+5+15+10+10+5+15+5)/n=8.88;
x=8.47; n=3
x=9.33; n=3
可变面元问题:区划效应 原 始 数 据 左 右 平 均 上 下 平 均
O’Sullivan&Unwin(2003),p.31
3.3 边界效应
1. 概述
• 点模式分析由植物学家和生态学家在1930s 应用。但是,随后许多不同领域也开始应用 点模式分析,如考古学、流行病学、天文学 和犯罪学。 • 一般来说,点模式分析可以用来描述任何类 型的事件数据(incident data)。因为每一事 件都可以抽象化为空间上的一个位置点。
空间点模式的三种基本分布
Number of observations)
Outliers
Hinge (1.5 times IQR)
75th percentile Median 25th percentile IQR
Hinge (1.5 times IQR) Variable name: Percent students
4. 核密度估计(Kernel Density Estimation, KDE)
空间分析与区域模型 总复习
1. 2. 3. 4. 名词解释(20 ± ) 简答题(30 ± ) 做图题(30± ) 论述题(20± )
“空间分析”总复习
一.绪论 二.空间基础&量测 三.探索性空间数据分析 四.空间点数据分析 五.空间格数据分析 六.空间插值与地统计 七.空间回归 八.地图代数
一 绪论
点模式的三种基本空间分布
随机
均匀
聚集
2. 空间点模式分析方法 2.1 基于密度的方法:测度一阶效应
① 样方分析 (Quadrat Analysis) ② 样方分析的统计检验 ③ 核密度估计 (Kernel Density Estimation)
2.2 基于距离的方法:测度二阶效应
① 最近邻距离 (Nearest Neighbor Distance) ② 最近邻距离的统计检验 ③ G 函数 (G Function) ④ F 函数 (F Function) ⑤ K 函数 (K Function)
2. 空间分析的框架
属性数据
数据库
空间数据
图示
可视化
GIS 数据库管理系统
模式描述
探索性分析
统计软件
假设检验
模型构建
基于Anselin和 Getis(1992)提出的 一般框架,GIS环 境下空间分析模块 的关系见右图。参 照GIS输入、存储、 分析和输出等功能, GIS环境下空间分 析可进一步细分为 选择、操作、探索 和确认4种。
0. 1. 2. 3. 空间分析概念 空间数据与属性数据的类型 空间分析的框架 空间统计陷阱
0. 空间分析概念
空间分析( Spatial Analysis) :没有统一定义。
• 空间分析是对数据的空间信息、属性信息或二者 共同信息的统计描述或说明。 --Goodchild(1987) • 空间分析是对于地理空间现象的定量研究,其常 规能力是操纵空间数据成为不同的形式,并且提 取潜在信息。 --Openshaw(1997)&Bailey and Gartell(1995) • 空间分析是结果随着分析对象位置变化而改变的 一系列方法。 --Longley et al.(2001, p.278) • 空间分析是基于地理对象的位置和形态特征的空 间数据分析技术,其目的在于提取和传输空间信 息。 —郭仁忠
3. 箱线图&五数总结 箱线图(boxplot)也称箱须图(boxwhisker plot)需要五个数,称为五数总结: ① 最小值 ② 下四分位数:Q1 ③ 中位数(median) ④ 上四分位数:Q3 ⑤ 最大值 The inter-quartile range :IQR = Q3 - Q1
Box plot
Problem Data Analysis Model Conclusions
Bayesian
Problem Data Model Prior Distribution Analysis Conclusions
来源:NIST/SEMATECH e-Handbook of Statistical Methods, /div898/handbook/
均匀
Number of Points Quadrat Per # Quadrat (xi -xa )^2 1 2 0 2 2 0 3 2 0 4 2 0 5 2 0 6 2 0 7 2 0 8 2 0 9 2 0 10 2 0 20 0 Variance Mean Var/Mean 0.000 2.000 0.000
3 5 2 1 3
1 0 1 3 1
2 2 2 2 2
2 2 2 2 2
0 0 10 0 0
0 0 10 0 0
x
随机
Quadrat # 1 2 3 4 5 6 7 8 9 10 Number of Points Per Quadrat (xi -xa )^2 3 1 1 1 5 9 0 4 2 0 1 1 1 1 3 1 3 1 1 1 20 20 2.222 2.000 1.111
Tukey was an American statistician, born in New Bedford, Massachusetts, and obtained a B.A. in 1936 and M.Sc. in 1937, in chemistry, from Brown University, before moving to Princeton University where he received a Ph.D. in mathematics.
3. 空间统计分析陷阱(基本问题)
3.1 空间自相关(Spatial autocorrelation)
地理学第一定律: everything is related to everything else, but near things are more related than distant things (Tobler,1970).
2.1 基于密度的方法 ①样方分析-两种方式 利用所有点:
样方的形状、大小、方向对 结果有影响 – 如果样样本量的作用 – 可以描述一个没有完全数 据的空间点过程

样方分析步骤
a). 研究区域中打上网格,建议方格大小为:
QuadratSize = 2A /n
2 3 5 6 6 6 8 9 9 4 5 6 7 8 9 2 4 9 8
茎叶图制作方法
① 选择适当的数字为茎,通常是起首数字, 茎之间的间距相等; ② 每列标出所有可能叶的数字,叶子按数值 大小依次排列;
③ 由第一行数据,在对应的茎之列,顺序记 录茎后的一位数字为叶,直到最后一行数 据,需排列整齐(叶之间的间隔相等)。
A:研究区域面积,n:点的个数。
b). 确定每个网格中点的个数。 c). 计算均值(Mean)、方差(Var)和方差均值 比:VMR=Var/Mean
– 对于均匀分布,方差=0,因此VMR的期望值= 0; – 对于随机分布,方差=均值,因此VMR的期望值= 1; – 对于聚集分布,方差大于均值。因此VMR的期望值 >1 。
随机分布:任何一点在任何一个位置发生的概率 相同,某点的存在不影响其它点的分布。又称 泊松分布(Poisson distribution)。
均匀分布:个体间保持一定的距离,每一个点尽 量地远离其周围的邻近点。在单位(样方)中个体 出现与不出现的概率完全或几乎相等。 聚集分布:许多点集中在一个或少数几个区域, 大面积的区域没有或仅有少量点。总体中一个 或多个点的存在影响其它点在同一取样单位中 的出现概率。
1.2 属性数据的类型
属性(Attribute):与空间数据库中一个独 立对象(记录)关联的数据项。属性已成 为描述一个位置任何可记录特征或性质的 术语。 • • • • 名义(Nominal)量 次序(Ordinal)量 间隔(Interval)量 比率(Ratio)量
Stevens S. S. On the Theory of Scales of Measurement[J]. Science, 1946, 103(2684): 677-680.
1. 空间/属性数据的类型 1.1 空间数据的类型
• • • • 空间点数据(Point Data) 空间线数据(Line Data Network) 空间面数据(Areal Data) 地统计数据(Geostatistical Data)
相关主题