当前位置:文档之家› 计量地理学期末复习

计量地理学期末复习

计量期末考试复习要点第一章绪论➢第一节计量地理学的形成和发展➢第二节计量地理学中的数学方法➢第三节计量地理学评价及其应用➢第二章地理数据的来源及其预处理➢第一节地理数据的类型划分➢第二节地理数据的基本特征➢第三节地理数据的来源说明➢第三章地理数据处理➢第一节地理数据的统计处理➢第二节地理数据的分布测量➢第四章相关分析方法第一节相关分析的计算问题第二节相关分析方法的应用第五章简单线性回归模型●回归分析与回归函数●简单线性回归模型参数的估计●拟合优度的度量●方程显著性的假设检验●回归系数的假设检验●回归模型预测●实际应用➢第六章趋势面分析方法➢趋势面分析的一般原理➢趋势面模型的适度检验➢趋势面分析应用实例第七章系统聚类分析模型➢第一节聚类要素的数据处理➢第二节距离的计算➢第三节直接聚类法➢第四节最短距离聚类法➢第五节最远距离聚类法➢第八章马尔可夫预测方法➢第一节几个基本概念➢第二节马尔可夫预测方法➢第三节应用案例➢第九章时间序列分析➢第一节时间序列的概念和表示方法➢第二节时间序列分析的基本原理➢第三节趋势拟合方法➢第四节季节变动预测第十章 AHP决策分析方法➢第一节基本原理➢第二节分析过程➢第三节计算方法➢第四节方法评价➢第五节应用案例第十一章主成分分析➢主成分分析的基本原理➢主成分分析的计算步骤➢主成分分析的软件实现➢主成分分析方法应用实例• 地理数据地理数据是用一定的测度方式描述和衡量地理对象的有关量化标志,是对地理问题进行定量化描述和研究的基础,是一切数学方法在地理学中应用的先决条件。

观测数据观测数据是指通过观测仪器获取的数据,包括台站观测数据、定点观测数据、遥感观测数据等。

实验数据实验数据是指利用实验仪器设备分析样品或模拟环境动力得到的数据,主要包括样品分析数据和模拟实验数据。

统计数据统计数据是指通过全面统计或随机抽样调查获得的数据,主要包括统计年鉴数据、抽样调查数据、测量统计数据等。

空间数据空间数据主要用于描述地理实体、地理要素、地理现象、地理事件及地理过程的产生、存在和发展的地理位置、区域范围及空间联系。

属性数据属性数据主要用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性特征,包括数量标志数据与品质标志数据两种。

地理计算地理计算(Geocomputation )的实质是借助于现代化的计算理论、计算方法和计算技术,通过对“整体”和“大容量”的地理数据进行处理,揭示复杂地理系统的运行机制,探索和寻求新的地理系统理论。

平均数平均数是集中趋势指标中最重要的一种指标,代表研究对象的一般水平。

一般地,平均数包括算术平均数和几何平均数两种类型,能反映出同质总体和样本数值的平均水平和一个数列的数值的“集中趋势”。

平均发展速度 平均发展速度的求解公式: X0为基期(或基年)数据 n 为间隔年数(不包括基年) 平均增长速度平均增长速度反映社会经济现象或人口在一个较长时期内的平均递增速度。

平均增长速度的求解公式:为基期(或基年)数据 n 为间隔年数(不包括基年) 平均增长速度=平均发展速度-1中位数中位数也称中央值,是地理数据按大小顺序排列,位居中间的那个数值。

众数众数是一个地理观测(或调查)系列中出现频数(次数)最多的数。

它也有典型性和代表性 极 差极差是指所有数据中最大值与最小值之差,计算公式为:n ng x x x 0=1r x =-}{min }{max i ii ix x R -=离 差离差是指每一个地理数据与平均值的差,计算公式为:x x d i i -=离差平方和离差平方和是它从总体上衡量一组地理数据与平均值的离散程度,其计算公式为:方差(Variance )方差是从平均概况衡量一组地理数据与平均值的离散程度。

方差计算公式为标准差(Std.deviation )标准差为方差的平方根,计算公式为:∑=-=ni i x x n12)(1σ 如果以样本方差对标准差进行估计,则计算公式为:1)(12--=∑=n x xS ni i变异系数变异系数表示地理数据的相对变化(波动)程度,其计算公式:罗伦次曲线20世纪初,意大利统计学家罗伦次(M. Lorenz ),首先使用累计频率曲线研究工业化的集中化程度。

后来,这种曲线就被称之为罗伦次曲线。

221()n i i d x x ==-∑100%v S C x =⨯=∑=-=ni x i x n 12)(12σ此图的画法:1,2,3:基尼系数基尼系数用于对经济发展、收入分配等均衡(不均衡)状况,进行定量化的描述。

基尼系数的计算假若罗伦次曲线的解析式为: 显然,该曲线下方区域的面积为: X X f A d )(1⎰=对应于绝对均衡分布,其罗伦次曲线就是正方形的对角线,其下方区域的面积为R =1/2。

锡尔系数锡尔系数又称锡尔熵,有两个锡尔系数指标,即锡尔系数T 和锡尔系数L 。

如果以人口比重加权,锡尔系数 L 的计算公式为 :)log(1iini i y p p L ∑==式中:n 为区域(部门)个数; 为i 地区(部门)收入占全区(各部门总计)的份额; 为i 地区(部门)的人口占全区(各部门总计)的份额。

如果以收入比重加权,则锡尔系数 T 的计算公式为: ∑==ni iii p y y T 1l og锡尔系数越大,就表示收入分配差异越大;反之,锡尔系数越小,就表示收入分配越均衡。

相关系数∑∑∑===----=ni ini ini i ixy y yx xy y x xr 12121)()())((和 为两要素的平均值。

秩相关系数又称等级相关系数,或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。

)1(61212--='∑=nn d r ni i xy普通最小二乘法普通最小二乘法的基本原理XX f X f G d )(212/1)(2/111⎰⎰-=-=]1,0[)(∈=X X f Y yx马尔可夫(Markov)预测方法对事件的全面预测,不仅要能够指出事件发生的各种可能结果,而且还必须给出每一种结果出现的概率。

马尔可夫(Markov)预测方法,就是一种预测事件发生的概率的方法。

它是基于马尔可夫链,根据事件的目前状况预测其将来各个时刻(或时期)的变动状况的一种预测方法。

状态:马尔可夫(Markov)预测中,状态指某一事件在某个时刻(或时期)出现的某种结果。

状态转移过程:马尔可夫(Markov)预测中,状态转移过程事件的发展,从一种状态转变为另一种状态,称为状态转移。

马尔可夫过程:在事件的发展过程中,若每次状态的转移都仅与前一时刻的状态有关,而与过去的状态无关,则这样的状态转移过程就称为马尔可夫过程。

主成分主成分分析的基本原理主成分分析的应用思路拟合优度拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。

显然若观测点离回归直线近,则拟合程度好;反之则拟合程度差。

度量拟合优度的统计量是可决系数(亦称确定系数)。

趋势面分析趋势面分析,是利用数学曲面模拟地理系统要素在空间上的分布及变化趋势的一种数学方法。

它实质上是通过回归分析原理,运用最小二乘法拟合一个二维非线性函数,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。

自回归模型基本原理与应用思路•当一个要素(变量)按时间顺序排列的观测值之间具有依赖关系或自相关性时,可以建立该要素的自回归模型,并由此对其发展变化趋势进行预测。

•自相关性是建立自回归模型的基础,只有具有显著自相关性的时间序列才可以建立自回归模型。

• 1.自相关性判断①时间序列的自相关,是指序列前后期数值之间的相关关系,对这种相关关系程度的测定便是自相关系数。

②测度:设y1,y2,…,yt,…,yn,共有n个观察值。

把前后相邻两期的观察值一一成对,便有(n-1)对数据,即(y1,y2),(y2,y3),…,(yt,yt+1),…,(y n-1,y n)。

✓其一阶自相关系数r1为∑∑∑-=-=++-=++-⋅---=1111211211111)()())((n t n t t t t tn t t t t ty y y yy y y yr✓ 二阶自相关系数r2为:∑∑∑-=-=++-=++-⋅---=2121222221222)()())((n t n t t t t tn t t t t ty y y yy y y yr✓ k 阶自相关系数为 :∑∑∑-=-=++-=++-⋅---=kn t k n t k t k t k tkn t k t k t t tk y y y yy y y yr 11221)()())((• 2.自回归模型的建立常见的线性自回归模型:① 一阶线性自回归预测模型为② 二阶线性自回归预测模型为③ 一般地,p 阶线性自回归模型为在以上各式中, 为待估计的参数值,它们可以通过最小二乘法估计获得。

地理数据的基本特征一、数量化、形式化与逻辑化 二、不确定性三、多种时空尺度 四、多维性地理数据的来源渠道(一)来自于观测、测量部门的有关专业数据。

(二)来自于统计年鉴、统计公报中有关自然资源及社会经济数据。

(三)来自于有关单位或个人的不定期典型调查数据、抽样调查数据。

(四)来自于政府公报、政府文件中的有关数据。

(五)来自于档案、图书等文献资料中的有关数据。

(六)来自于互联网(internet )的有关共享数据。

(七)来自地图图件。

主要包括地形图、影像地图、专题地图等。

(八)来自。

遥感数据。

主要包括各种航空遥感数据和卫星遥感数据。

t t t y y εϕϕ++=-110t t t t y y y εϕϕϕ+++=--22110t p t p t t y y y εϕϕϕ++++=-- 110),,2,1,0(p i i =ϕ(九)其他来源的有关数据地理数据的时间特征要求 (一)数据的即时程度 (二)数据的时段长度 (三)数据的时间完整性 (四)数据的时间同步性 (五)数据的时间代表性 (六)数据的时序间隔回归的现代意义与目的• 一个应变量对若干解释变量依存关系 的研究。

• 由固定的解释变量去估计应变量的平均值聚类分析中常用的聚类要素的数据处理方法总和标准化。

标准差标准化。

极大值标准化。

极差标准化。

①总和标准化。

分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即 :这种标准化方法所得到的新数据满足:② 标准差标准化,即:由这种标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有:),,2,1;,,2,1(1n j m i xx x mi ijijij ==='∑=∑==='mi ijn j x 1),,2,1(1 ),,2,1;,,2,1(n j m i s x x x jjij ij ==-='1)(101121='-'=='=∑∑==m i j ij j m i ij j x x m s x m x③ 极大值标准化,即:经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1。

相关主题