当前位置:
文档之家› 1.2 计量地理学中的数学方法
1.2 计量地理学中的数学方法
i 1 n
变异系数表示地理数据的相对变化(波动) 程度,其计算公式
S 1 Cv 100% x x ( xi x ) 2 n 1 100%
(2.4.13)
例如:对于表2.4.2中的数据,分别计算极差、 离差、离差平方和、方差、标准差、标准差的 无偏估计,以及变异系数。
表2.4.2
地块编号 面积/hm2 1 12 2 83 3 50 4 35
某农场各农田地块的面积
5 55 6 50 7 72 8 40 9 85 10 29 11 65 12 75 平均值 54.25 中位 数 52.5 众 数 50
步骤 : (1)按照公式(2.4.7)计算极差
R 85 12 73
离差
i
i
(2.4.7)
指每一个地理数据与平均值的差,计算公式为
离差平方和
di xi x
(2.4.8)
它从总体上衡量一组地理数据与平均值的离散程 度,其计算公式为
d2
(x
i 1
n
i
x)
(2.4.9)
• 方差与标准差 方差是从平均概况衡量一组地理数据与平 均值的离散程度。方差计算公式为
1 xi x g1 i 1 n
n
3
(2.4.14)
g1<0,表示负偏,即均值在峰值的左边;g1>0,表 示正偏,即均值在峰值的右边;g1=0,表示对称分 布(如下图)。
图2.4.3
偏度系数的三种情形
• 峰度系数 它测度了地理数据在均值附近的集中程度,其 计算公式为标准正态分布的峰度系数 g2 =0; g2>0, 表示地理数据分布的集中程度高于正态分布; g2<0, 表示地理数据分布的集中程度低于正态分布(图 2.4.4)。 4 n 1 xi x (2.4.15) 3 g2 i 1 n
多目标规划
非线性规划 动态规划 网络分析 层次分析法
用于研究有关规划与决策问题。
用于研究有关规划与决策问题。 用于有关多阶段地理决策问题的求解。 用于交通网络、通讯网络、河流水系等地理网 络的研究。 用于有关多层次、多要素战略决策问题的分析。
风 险 型 决 策 分 用于各种风险型地理决策问题的分析。 析法
众数
众数就是出现频数最多的那个数,计算 方法分为以下两种情况: ①未分组的地理数据,可以根据每一 个数据出现的频数大小直接确定众数。 ②对于已经分组的地理数据,中位数 的计算步骤如下: 确定频数最多的组为众数所在组。 按以下公式计算众数
1 M0 L d 1 2 2 M0 U d 1 2
第2节 计量地理学中的数学方法
数学方法
概率论
用途
用于地理现象、地理要素的随机分布研究。
抽样调查
相关分析 回归分析 方差分析 主成分分析
用于地理数据的采集和整理。 分析地理要素之间的相关关系。
拟合地理要素之间的数量关系、预测发展趋势。 研究地理数据分布的离散程度。 用于地理数据的降维处理及地理要素的因素分析 与综合评价。
第5节 地理数据分布的集中化 与均衡度指数
罗伦次曲线与集中化指数
ห้องสมุดไป่ตู้
基尼系数
锡尔系数
(一)罗伦次曲线 绘制罗伦次曲线实例
(1)将表2.5.1各产业部门的收入及其占总收 入比重(百分比),从大到小重新排序; (2)从大到小,逐次计算累计百分比; (3)以自然序号为横坐标(x),累计百分比为 纵坐标(y);以(部门代码,累计百分比)为坐标点, 连成一个上凸的曲线(图2.5.1和图2.5.2),即罗 伦次曲线。
(3) 计算众数 , 先确定众数所在组,再按 照公式(2.4.5)或(2.4.6)计算众数。
显然,众数所在组应该在第二组。
众数M0 =3 476.19 (元)。
(二)描述地理数据分布离散程度的指标
•
极差 指所有数据中最大值与最小值之差,计算公式为
R max {xi } min{xi }
•
用于有关地理系统、地理过程的组织与演化 问题研究。
用于有关地理系统、地理过程的自组织问题 研究。 用于灰色地理系统的分析、建模、控制与决 策研究。
系 统 动 力 学 方 用于对地理系统的仿真、模拟和预测。 法 分形理论 小波分析 人工神经网络 遗传算法 用于有关地理实体的形态及要素分布形态的 自相似机理研究。 用于多层次、多尺度、多分辨率的地理时空 过程的时频分析。 用于有关地理模式的识别、地理过程机制的 自学习及预测等。 用于复杂的非线性地理问题的计算。
表2.4.2
地块 编号 面积 /hm2 1 2 3 4 5
某农场各农田地块的面积
6 7 8 9 10 11 12 平均值 中位 数 52.5 众 数 50
12
83
50
35
55
50
72
40
85
29
65
75
54.25
应按照未分组数据计算其平均值、 中位数和众数,计算结果见上表最后三 列。
例2:表2.4.3给出了中国西部地区某城市2000年家 庭月收入的抽样调查结果,试计算其平均值、中 位数和众数。
1 n x xi n i 1
(2.4.1)
② 分组的地理数据
x
fx
i i 1 m
m
i
f
i 1
(2.4.2)
i
• 中位数
① 对于未分组的地理数据,样本数n为奇数时, 中位数是位置排在第(n+1)/2位的数据;样本数n为偶 数时,中位数是排在中间位置的两个数据的平均值。 ②分组的地理数据,中位数的计算方法: 确定中位数所在的组位置,按下述公式计算中位数
(2)按照公式(2.4.8)计算离差,结果见表 2.4.4。
表2.4.4
序号 面积 1 12 2 83 3 50 4 35 5 55
地理数据的离差
6 50 7 72 8 40 9 85 10 29 11 65 12 75
离差
-42.25
28.75
-4.25
-19.25
0.75
-4.25
17.75
-14.25
(2.4.5) (2.4.6)
或
在式(2.4.5)和 (2.4.6)中:
M0代表众数;
L为众数所在组的下限值;
U为众数所在组的上限值; ∆1为众数组频数与下一组频数之差; ∆2为众数组频数与上一组频数之差; d为众数所在组的组距。
例1:表2.4.2给出了某农场各农田地块的面积, 试计算其平均值、中位数和众数。
时间序列分析 用于地理过程时间序列的预测与控制研究。
聚类分析 判别分析
趋势面分析
用于各种地理要素分类、各种地理区域划 分。 用于判别地理要素、地理单元的类型归属。
用于拟合地理要素的空间分布形态。
协方差与变异函 用于研究地理要素的空间相关性及空间分 数 布的数量规律。 克立格法 马尔可夫过程 线性规划 投入产出分析 用于地理要素分布的空间局部估计与局部 插值。 用于研究随机地理过程、预测随机地理事 件。 用于研究有关规划与决策问题。 用于产业部门联系分析、劳动地域构成分 析、区域相互作用分析。
图2.4.5 1978—2002年中国大陆省份人均GDP的变异系数
从图2.4.5中可以看出,在1978—2002年 期间,人均GDP的变异系数,以1990年为转折 点,呈现出一个 U 形曲线。即:人均 GDP 的变 异系数,在 1978—1990 年期间基本上呈现下 降趋势,而在 1990—2002 年期间则基本上呈 现上升趋势。 这说明,在 1978—1990 年期间,中国大 陆经济发展的省际差异,基本上呈缩小趋势, 而 1990—2002 年期间则基本上呈扩大趋势。 这一变化与国家宏观经济政策变动的时间、 趋势大体一致。
30.75
-25.25
10.75
20.75
(3)按照公式(2.4.9)计算离差平方和
d d i 5 666.25
2 12
(4)按照公式(2.4.10)计算方差
i 1
2
(5)按照公式(2.4.11)计算标准差 (6)按照公式(2.4.12)计算标准差的无偏估计
S
1 2 d 472 .19 12
6 000~7 000
7 000~8 000 8 000~9 000 合 计
100
50 30 2130
2 050
2 100 2 130 —
180
80 30 —
解题步骤:
(1)用公式(2.4.2)计算平均数
x =3 899.06(元)
(2)计算中位数。先确定中位数所在 组的位置,再按照公式(2.4.3)或者 (2.4.4)计算中位数 Me =3 588.46(元)
非 确 定 型 决 策 用于各种非确定型地理决策问题的分析。 分析法
模糊数学方法
控制论 信息论 突变论
用于各种模糊地理现象、地理过程、地理决策 和系统评价研究。
用于地理过程、地理系统的调控研究。 用于各种地理信息的分析、处理。 用于有关突发性地理现象、地理事件的研究。
耗散结构理论
协同学 灰色系统方法
σ 2 472.19 21.73
(7)按照公式(2.4.13)计算变异系数
Cv S 100 % 0.418 4 x
d2 21.729 9 12 1
(三)描述地理数据分布特征的参数
• 偏度系数 测度地理数据分布的不对称性情况,刻画以平 均值为中心的偏向情况,计算公式为
表2.4.3
家庭月收入/元
2 000~3 000 3 000~4 000 4 000~5 000 5 000~6 000
中国西部地区某城市2000年家庭月收入的 抽样调查结果