102用数据说话
五 问题验证
距离和收入两类产生4个组合,分别为EA贫 EA富 EA近 EA近,分别计算EA和人口的贫远类型占贫类型 (其中包含近类型)的比率 对归结1:贫困且远离公园的EA比例 PEA贫远=(EA贫&EA远)/ EA贫 对归结2:贫困且远离公园的人口占EA贫人口总数 Pop贫远=(Pop贫&PopA远)/ Pop贫 对归结3:收入I远,I近 用D为依据,远部分的收入平均I远 近部分的收入平均I近 类型 数值 EA贫远 73.5% Pop贫远 45.5% I远 22040 I近 25310
二 建立提案定量关系 1 提案问题定量关联 提案提出的问题很笼统,要判定成立与否, 需要数据支持,事实说话,把问题与数据和事实 联系,需要进行问题分解,使问题具体化,数据 化,把问题、数据、信息联系起来 建立语言模型,通过语言模型中介,引申出 数据 本问题的语言概括模型为: 1) 住户分布状况:若成立,则应有50%以上贫 困住户离公园较远
4 图形数据:多伦多市区公园分布图
5 图形数据:多伦多市居民小区分布图
6 调查数据:多伦多市区小区调查表
EA-ID
EA总人口
EA总住户数
户年均收入
35002163 35002101 35002204 35002207 …
935 614 889 877 …
260 140 240 230 …
11911 10879 19251 16945 …
1.02 用数据说话
什么是科学管理?就是实事求是。实事求是 的一个具体体现,就是“用数据说话”。 用数据说明——“实事” 用数据论证——“求是”。 实践是检验真理的唯一正确标准,真理来源 于实践和逻辑推理,所以,逻辑也是真理的一个 检验方式。 “实事”的研究、分析就是数据与科学方法。
案例主题:城市公园分布的合理性
2) 人口分布:应是大部分贫困人口住在离公园 较远的地方 3) 收入情况:离公园远的居民收入较离公园近 的人 均收入低 上述3点并不全面,也不互相独立,但非常直观 1)和2)在某种程度上具有相同的含义,不同的角 度与数据的存在和处理方式有关
信 息 分 析 模 型
3
三 解决思路 1 确定指标 数据从小到大,有多个值,通过数据进行类型 划分,要有一些数值标准。 1)富裕度与方便性指标 富裕度指标: 贫困——居住区居民人均收入低于本地区人均收入 富裕——居住区居民人均收入高于或等于本地区人 均收入
一 案例问题 1 提案 加拿大多伦多市的一个民间组织向政府指 出: (1)市内公园分布偏向于富人居住区 (2)在市内贫困地区增设公园和其他娱乐设施 公园分布偏向于富人居住区的原因: 公园区域环境好,地价高,富人才花费得 起,因此,提案似有一定的道理。
2 简要分析 随着社会经济发展和民众民主和管理参与 意识的增强,市民对城市管理越来越关注。作 为社会要求和提案,政府应当认真对待处理; 社会提案,有不同的社会背景,代表一定的 利益群体,直接接受办理,会引发另外的反对意 见,如“浪费纳税人钱财”,因此,必须加以分 析论证。分析论证必须用数据说话,否则无从定 论。 本案例介绍如何对这个提案用数据说话。
按 收 入 划 分 结 果
按 距 离 划 分 结 果
六 小结
1 具体问题的研究分析过程 2 实际计算方法和依据 3 分析思想与方法 如何把问题归结为具有分析意义的概念 如何把归结的概念与数据结合起来 分析过程的设计 结果表达
4 思路开拓 1) 增设公园和娱乐设施的位置选择 把民间组织提出的问题加入考虑),解决第二个 问题。 2) 分析收入的空间分布与其它事物的关系 与商业设施的关系,按收入与消费关系确定社会 经济状况划分及分布规律性
选取与空间精度相一致的数据。以西安市 为例,若选取县区级数据,太笼统,精度低, 若以家庭为单位,无必要。
3 分析需要的数据 通过上述过程,确定建立概念所需要的基本 数据 1) 多伦多市公园分布图 用于确定公园空间点位,作为距离计算的依据 2) 多伦多市居民地小区分布图 用于确定居民区空间点位,作为距离计算的依 据 3) 相应的EA调查统计数据 包括人口,收入,住户数,用于分类指标计算
3 方便性指标变量及意义 1)每个EA到所有公园距离的值之和的平均, D作为方便性划 分指标 到公园 到居住区 公园 居住区
4 用D分类 用某一个EA到所有公园的平均距离作为评价至于平 均距离比较 EA近 Di <D EA远 Di >D 5 富裕性计算 全市家庭人均收入 I=∑Ii/m m 为家庭数 各EA平均家庭收入 In = ∑Ij/n,则有: 当 In<I 为贫困,EA贫 In>I 维富裕,EA富 6 按上述指标划进行EA划分 分析距离与收入之间是否存在关系,是什么样的 关系。二者仅仅存在空间上的关联系,即每一个EA, 同时具有收入与距离两重属性,且从属一定类别
四 分析计算
运 算 模 型 1
2 数据预处理 1)数据格式转换,包括矢量化,坐标、投影转换 2)地理编码:居民地,公园标识和属性数据建立 3)点化为面——质点为计算单位,忽略内部差异 3 距离计算(方便性计算) dij 第i个EA到第j公园的距离 Dj=∑dij/n 所有小区到公园的平均距离 N 公园总数 普查小区到公园的平均距离 D=∑Dj/m 全市EA到公园的平均距离 m 全市EA总数
2)方便性指标 方便——居住区居民到公园的平均距离小于本地 区所有居民到公园的平均距离,即近 不便——居住区居民到公园的平均距离大于本地 区所有居民到公园的平均距离,即远 至此,抽象和建立了可用数据表现的概念及 进行概念对比分析的方法: 收入,高于和低于平均收入, 距离,小于和大于平均距离
2 确定空间统计和分析单元 空间精度确定: 人口普查小区(Enumeration Area)