大数据环境下手机定位数据在城市规划中实践
冉 斌 邱志军 裘炜毅 陆俊贤
薛美根 董志国 蒋 寅 高志刚
【摘要】城镇化、信息化快速发展的时代,利用海量、多源的大数据环境,支撑城市规划的焦点问
题量化分析,是当前重要的发展方向,手机数据是其中一种很好的技术选择。目前手机移动网络实现了城
乡空间区域的全覆盖,城乡人口中手机终端的持有率和使用率已经达到相当高的比例,手机定位数据契合
了城乡人口空间分布与活动规律的分析需求。根据手机信号在真实地理空间上的覆盖情况,将手机用户时
间序列的移动信号数据,映射至现实的地理空间位置,即可完整、客观地还原出手机用户的现实活动轨迹,
从而挖掘得到人口空间分布与活动联系特征信息。本研究总结了手机定位数据在城市规划中的应用方向,
在国内部分大城市初步探索并实践了的典型应用,研究成果的数据趋势和分布规律与现状基本相符,为城
市规划提供了基础性的数据资料。
【关键词】城市规划;人口分布;人口活动;大数据;手机定位数据 1.引言
1.1 背景
信息化技术作为城市规划领域的新技术应用,在过去十多年间的实践中,从办公自动化、
到计算机技术的引进、大型地图数据库的广泛应用,获得了丰硕的成果。当今信息化社会的
发展,日新月异的信息技术革命,特别是ICT(Information Communication Technology,信
息和通讯技术的融合领域)技术的发展,带给城市规划海量的、多源的、甚至可能是杂乱的
大数据,如,视频数据、互联网数据、社交网络数据、电商数据、物业水电煤数据、手机数
据等。大数据理念在IT领域得到了最初的响应,并迅速在金融、商业智能、医疗、交通等
各个领域得到重视。
当前,我国城市规划领域发展,也赋予很多时代的特征和新的发展命题。工业化、信息
化、城镇化同步发展;城镇化发展规划、城乡一体化发展;城市群等区域空间组织;适应不
同社会群体需求的公共设施、基础设施规划、满足多元需求的城市综合交通体系规划;都成
为当今热门话题和研讨重点。城镇化、信息化快速发展的时代背景下,如何在海量、多源的
大数据环境中,有效支撑现有城市规划焦点问题的量化分析,成为当前重要的发展方向。
随着当今个人手机终端的普及,出行群体中手机拥有率和使用率已达到相当高的比例,
手机移动网络也基本实现了城乡空间区域的全覆盖。手机作为一种较为理想的探测器,用于研究人的行为特征,提供了一种很好的技术选择方向。移动通信网络中海量的手机大数据,其中蕴藏着丰富的人员行为特征信息。以上海市为例,仅上海移动一家运营商,日均数据量
达15亿条,用户数量约2000万,占总人口比例超过80%。
本文将介绍大数据环境下基于手机定位数据的分析技术在城乡规划领域内的应用思路、
应用方向,以及在国内部分城市的有益探索和实践。
1.2 实践意义
城市规划编制需要综合运用大量的数据资料,如基础地图数据、遥感影像数据、资源与
环境数据、社会经济数据、土地利用数据、市政与公共设施数据等[1][2]。随着计算机技术的
引入,其中相对静态的基础性数据,获取便利性、获取效率和数据质量都已达到较高水平。
但是,相对动态的数据,尤其是人口分布、人口活动及其衍生的区域联系强度等数据,目前
并没有比较好的、直接的、自动化采集方式。人口空间分布数据,目前主要是依据多年一次
的人口普查,数据时效性有限,或是通过遥感影像的方式[3],进行间接推断,数据可靠性、
可信度一直未得到有效检验;而人口活动与区域间客流交换情况,主要依据人工的综合交通
抽样问卷调查,数据采集效率、采样率、准确性等都有所欠缺。
近年来,大数据处理技术与理论正蓬勃发展,冲击着我们的思维理念与规划思路,尤其
是数据处理理念上的三大转变:“不要随机样本,而是全体数据”、“不是精确性,而是混杂
性”、“不是因果关系,而是相关关系”[6],契合了城市规划领域的数据应用需求。首先,抽
样分析是信息收集手段不完善时代的产物[6],传统方式获取规划数据,如居民出行问卷调查
等,采用小样本抽样方式,统计结果易具偏向性,“以偏概全”而导致不能反映出总体的真
实情况。而目前我国共有11.46亿移动通信服务用户,占总人口约84%,为大比例的抽样提
供了技术可能,保证了其与总体统计学特征保持一致。其次,要效率而非绝对准确,要允许
一点点的错误和不完美[6],需要发挥不同数据各自的优势。如视频、红外等技术,能够较好
地识别设备范围内的单个个体,但较难持续跟踪分析人口的连续活动特征。而利用手机定位
数据能够在中观、宏观层面上得到相对可靠的人口空间分布与活动特征,但当空间识别单元
特别微观时,会存在无法分辩的问题。第三,注重对大量不同类型数据进行统计性分析归纳,
进行关联性及相关性分析[6],挖掘事物相互间的耦合关系;手机定位数据能够持续追踪,从
而直接检测人口的各种活动特征指标,弱化了基于因果关系和各种假设条件的模型推算过
程,减少了模型、参数带来误差的同时,与其他数据一起,能够更好掌握现状或指导未来的
工作。
综上所述,手机数据从采集频率、采样率与采样持续性上,都是一种技术突破,提供了
一种长期、动态、持续更新数据的可能,成为现有人口调查、客流调查手段的一项重要组成,
具备有效监测分析城镇群间人口流动规律、城市内不同区域间人流交换情况[4]的能力,以适
应当今城市化进程发展需要,有助于研究土地开发、产业转移与人口迁徙之间的内在机理。 2.研究技术与研究思路
2.1研究基础
本文所指手机定位数据,由移动通信运营商提供,从移动通信网络的特定接口上解析、
处理、并滤除用户属性之后的加密手机信号数据,不会涉及手机用户的个人信息。
移动通信网络的信号覆盖从逻辑上被设计成由若干六边形的基站小区相互邻接而构成
的蜂窝网络面状服务区,手机终端总是与其中某一个基站小区保持联系[5],移动通信网络的
控制中心会定期或不定期地主动或被动地记录每个手机终端时间序列的基站小区编号信息。
经过多年来移动通信运营商持续的建设与优化调整,城乡范围内人能够活动到的空间基本上
都有移动信号覆盖,很少还有信号盲区存在。
将手机用户时间序列的移动信号数据,映射至现实的地理空间位置,即可完整、客观地
还原出手机用户的空间活动轨迹,从而挖掘得到人口空间分布与活动特征信息。
大数据时代,MapReduce、Hadoop、NoSQL相关技术的成熟,为海量手机用户的海量定
位数据的分析、挖掘奠定了技术基础,海量数据计算、处理、存储与查询越来越成为相对简
单的问题。而大数据环境下数据处理理念的转变,则带给我们更多地思考,如何在城市数据
化、智慧化的快速发展下,推动城市规划学科的良性发展。
2.2研究思路
图1 人口空间分布与活动特征研究思路 研究思路如图1,包括以下几步:
步骤1:利用手机定位数据,分析各个手机用户在移动通信网络中的活动情况;
步骤2:建立移动网络信号覆盖与GIS基础地图及空间地理数据的相互映射关系,分析
各个手机用户在真实地理空间上的活动情况;
步骤3:利用手机用户活动模型与出行分析模型、交通流模型、时空聚类算法、模式识
别算法等,分析挖掘得到手机用户群体的活动特征指标;
步骤4:从手机用户群体扩样至总体人口(包括持手机的人群与无手机人群)的相关特
征指标,如人口居住地与工作地分布、居住人口的工作地与工作人口的居住地分布、流动人
口活动范围特征、区域客流产生与客流吸引、区域间客流交换与城市发展轴分布、区内与区
间出行、查核线或关键通道客流及与周边城市客流联系等。
以上技术分析方法,先后在上海、重庆、天津等城市得以具体探索与实践,过程中将手
机定位数据分析得到的相关数据成果与各地的人口普查、综合交通调查等其他方式获取的数
据进行了对比验证,宏观统计偏差在±2%以内,研究成果的数据趋势和分布规律与城市现
状保持一致,基于手机定位数据的采集技术可作为现有人口调查、客流调查的一项重要组成。 3.应用方向与应用案例
应用的具体方向可以概括如表1。
表1 手机定位数据在城市规划中的应用方向 规划任务 手机数据分析内容 城镇体系规划 城市总体规划 城市分区规划 控制性详细规划与修建性详细规划 城市交通规划 近期建设规划 居住人口与工作人口 空间分布 √ √ √ √ √ √ 居住人口的工作地分布与工作人口的居住地分布 √ √ √ √ √ √
流动人口的活动范围特征 √ √ √ √ √ 区域客流产生与客流吸引 √ √ √ √ 区域间OD客流分布 与城市发展轴分布 √ √ √ √ √
区内出行量与区间出行量 √ √ √ √ 轨道交通客流特征调查 √ √ 查核线或关键通道客流及其来源/去向空间分布 √ √ √ √
与周边城市客流联系情况 √ √ √ 以下将对其中的部分具体应用与实践案例进行介绍。 3.1居住人口与工作人口空间分布
人口空间分布数据是科学开展城市规划的基础与前提,是影响公共资源配置、基础设施
建设、城市社会经济、生态环境发展等方面最根本的要素。
通过一段时期内手机用户的出现天数频率,挑选出常住手机用户群体,分别识别其夜间、
白天活动频繁区域,近似作为其居住地、工作地,从而采集到各个区域对应的居住人口与工
作人口规模。
以上海市中心城为例[7],2012年7月居住人口与工作人口(单位:人/平方公里)空间
分布如图2。工作人口高度集中在上海市中心城的中心区以内,居住人口虽然也集中在中心
城区以内,但空间上呈现分散趋势。
a 居住人口
b 工作人口 图2 上海市中心城居住人口和工作人口空间分布 3.2居住人口的工作地分布与工作人口的居住地分布
具有典型上班、下班的通勤出行群体,是城市日常出行活动的主体人群,是判断城市内
部区域间常规联系紧密程度的主要数据依据。对某些特定区域,利用手机定位数据可以识别
在该区域居住的人口,其工作地的空间分布情况,以及在该区域工作的人口,其居住地的空
间分布情况。
以上海市小陆家嘴CBD区域为例[7],2012年7月区域内居住人口的工作地空间分布与
工作人口的居住地空间分布如图3。