地名地址数据采集与建库应用研究
摘要:地名地址数据是对地名、地址信息的结构化描述与标识,是公共地理框架数据的重要组成部分。
建设地名地址数据库有助于满足城市管理及公众的需求。
关键词:数字城市;地名地址;数据采集;
1 引言
城市是经济社会发展最活跃、信息最丰富、资本最集中的区域,也是对地理信息需求最旺盛、更新要求最快、分辨率要求最高的区域。
地名地址数据作为公共地理框架数据的重要组成部分,是对地名、地址信息的结构化描述与标识。
其以坐标点位的方式描述某一特定空间位置上自然或人文地理实体的专有名称和属性,是专业或社会经济信息与地理空间信息通过地理编码或地址匹配进行挂接的媒介与桥梁。
本文将以上虞市地名地址数据采集处理建库项目为背景,探讨地名地址数据采集与建库的方法和流程。
2 地名地址数据相关内容
2.1地名地址数据分类
地名地址数据从逻辑上分为地名和地址两部分。
地名包括自然地名和人文地名。
自然地名包括水系、山峰、海岛等地名,人文地名包括行政区域、交通、水利附属设施、单位名称等地名。
为满足上虞市公共平台建设需要,本项目将相关兴趣点要素从这两类中分离出进行单独分类,主要内容包括一般地标、党政机关、餐饮住宿、观光旅游、文体休闲、购物指南、公共服务、交通服务等八大类。
地址是由主管部门确定的使用规范的语言文字描述的地理实体的位置,主要为规范化的门(楼)址信息。
2.2 地址元素描述规则
为满足实际需要,地址数据的描述分为四级层次的描述,即政区、开发区/街巷/小区/片区、一级门牌楼址、二级门牌楼址。
政区表示为:××市××区××街道(乡、镇)××社区(村委会);开发区表示为:××开发区(工业区);街巷表示为:××路(街、巷、弄);小区表示为:××小区(村、苑);片区表示为:××市场(园区);门址表示为:××号;楼号表示为:××幢(栋)。
描述规则主要包括以下方式:(1)政区+开发区/街巷/小区/片区+一级门楼址,如绍兴市上虞市百官街道恒利社区凤鸣路207号,绍兴市上虞市百官街道西横河社区赵家市场6号营业房;(2)政区+开发区/街巷/小区/片区+一级门楼址+二级门楼址,如绍兴市上虞市百官街道阳光社区城东新村20幢110号,绍兴市上虞市百官街道绿城社区江扬路161幢95-1号。
3 地名地址数据采集处理建库技术设计
3.1 工艺流程图
3.2 地名地址数据采集方法
本次地名地址数据采集首先利用ArcGIS软件叠加高分辨率卫星影像对作业范围进行区块划分,然后将叠加已有资料的1:500地形图作为外业工作底图打印输出。
外业采集时直接将兴趣点与地址点标绘在纸质图上并标注点号,将兴趣点和地址点信息记录在表格中,内业处理时通过WalkISurvey软件在电子底图上展点并通过程序关联属性记录表,实现图属一体化。
3.2.1兴趣点数据采集
兴趣点大致分为沿街商铺类兴趣点、大厦写字楼类兴趣点和住宅区类兴趣点。
对于商铺类的兴趣点只采集街道两边挂有正式店铺门牌的固定商铺,未挂有正式店铺门牌的商铺不采集,此类兴趣点的空间位置与地址点偏差不超过5米;写字楼、大厦内兴趣点如果能找到其入驻单位分布图的将图上所有兴趣点采集,其他不采集;对住宅区兴趣点,如果采集区块内完全包含该住宅区,住宅区兴趣点定位于该住宅区几何中心附近建筑物的几何中心点,如果住宅区范围超过一个区块,则在数据汇总的时候得出该住宅区范围,住宅区兴趣点定位于该住宅区几何中心附近建筑物的几何中心点。
兴趣点采集内容包括兴趣点名称、简称、工商营业执照名称、地址、电话、历史名称、别名、网址等信息,同时需要拍摄兴趣点照片。
电话、网址等信息可借助照片、名片等在内业过程中完成。
3.2.2 地址点数据采集
对于沿街的地址点,沿着房屋临街的边线均匀刺点,尽可能控制地址点的空间位置与实际位置较相符。
地址点的空间位置与实际的位置偏差不超过5米。
非沿街地址的空间位置应根据实际情况进行分析。
门址原则上应为地址标牌所对应的位置,如**学校的地址标牌挂在大门上,门址就在学校所在大门的对应位置;(新)农村个人住房的门址则标注在其所属主体房上。
楼址则应为楼宇的相对几何中心。
地址数据应是连续的。
出现地址点跳号漏号时,如果是大型企事业单位如学
校、医院等造成漏号,在备注中写“前漏**号”;如果跳号或漏号的个数很多可以采用“前漏**至**号(奇/偶/全)”的方式进行记录。
如果是多家商铺未挂牌造成的漏号跳号,可根据首尾号及未漏号的店面估算漏号跳号店面的门牌号,在备注中写“未核实”。
3.3 地名地址数据建库
根据要求建立数据表属性字段、字段别名、字段类型、字段长度等,如地址点属性表包括采集编号、汇总采集编号、地址信息、市级行政区、区县行政区、乡镇街道行政区、村委会社区行政区、开发区、街巷名、小区名、片区名、一级门楼址、二级门楼址、采集人、采集区块、采集时间、提交批次等字段,字段类型设计有文本型、日期型,文本型字段大小20至1000不等。
兴趣点所挂接的地址进行标准化处理后进行入库,从1:500DLG数据中提取的地名库数据需要与合并后的兴趣点数据做一致性处理,处理原则为当名称相同时以兴趣点数据为准,名称相似且距离小于500米时进行人工判断后作一致性处理。
地址数据进行标准化处理后,通过地名地址库构建工具构建入库。
入库时兴趣点和地址点的编码NEWID必须唯一,编码规则如下:
(1)地址编码规则:行政编码(12位)+地名地址标识码(1位)+流水号(7位)。
(2)兴趣点编码规则:行政编码(12位)+地名地址标识码(1位)+兴趣点分类代码(6位)+流水号(7位)。
其中,地名地址标识码:地址-0;兴趣点-1。
4 存在问题和建议
(1)老城区和经济开发区门牌分别由不同部门管理,比较杂乱,部分区域门牌虽然重新登记过,但是实地并未更换;较多店铺并未挂上门牌;部分道路门牌址无规律可循且地址不连续,等等,这些都给门址记录、门牌号推算工作带来很大难度和不确定性,一定程度上影响了本次数据的利用价值。
因此,建议门牌由指定部门统一制作和管理,固定在户外明显位置,且不应随意拆卸。
门牌管理部门可以地名地址数据库为基础,根据库中核实和未核实地址情况制定一个合理的门址管理方案,确保之后再制作的门牌与周边的路牌门牌协调一致,及时纠正错误的门牌,使得门牌管理工作能满足城市管理及公众的需求。
(2)本次地名地址数据采集与建库项目的内外业工作量都比较大,需要投入大量的人力物力,且存在部分重复劳动,比如展点和数据记录内外业各做一次。
因此,建议在以后类似的工作中利用IPAD或其它工具开发地名地址数据采集系统,从而可以携带轻便设备户外直接在电子底图上展点并记录属性,提高工作效率。
5 结束语
随着数字城市地理空间框架建设日渐完善,地名地址数据采集与建库工作的开展也越来越广泛。
总的来说,笔者认为在开展此类工作中不仅需要及时分析和传达生产中发现的问题,同时应对作业方式方法不断改进和完善,以达到提高质量水平和工作效率的目的。
参考文献
[1] 李永维.“数字柳州”地理空间框架地名地址数据采集与建库技术研究, 《广西测绘与遥感》,2013
[2] 林峰,曹玉香.杭州市地名数据采集及转换入库技术方案研究[J].山西建筑,2007。