地理实体编码技术与方法
映射,也可以是地理对象与坐标系统的映射。
二、地理编码技术与方法 地理编码技术:编码、解析、地址匹配 (1)编码的基本规则和编码方式; (2) 智能语义解析算法,智能化中文地址模糊匹配算法 实现自然语言的地址和标准地址编码数据库的智能 匹配,获得最精确的地理编码和地理坐标;
(3) 编码器、解析器和匹配器
******
测绘基础分类码 特征码
*
图形码
**
特征码:点、线、面、有向点、有向线、面、注记 图形码:点 (坐标、高程、符号定位点)
三、地理实体编码存在的问题
2、地理实体标识码
第一类是根据要素等级划分。 采用此类划分的有:行政区划、水系、境界、居民地、地址 以行政区划为例:
1 CHN 33 01 06 004 006
五、地理实体编码生成与实现
1、编码生成方法
①分类编码编译 测绘行业:按照行业标准,从来源数据要素分类编码中提取所需要素分
类编码字段,依照行业分类对照关系,转换生成行业基础分类码。 行业编码:参照《政务信息资源目录体系》行业编码生成。
五、地理实体编码生成与实现
指建立地理位置坐标与给定地名地址一致性的过程,这里的地址已较 为明确的指代为街道地址、行政区域等,其地理对象也明确为地理实 体。
地理对象:地理实体、地理要素类、地理区域和范围等。 地理对象在确定的参考系中按一定的规则赋予唯一的、可 识别的代码,唯一地确定地理对象的空间位置,建立地理
对象与代码之间的映射关系,它可以是地理对象与地址的
二、地理编码技术与方法
2、基于地理实体的地理编码
采用地理实体与地址建立直接关联的方法,建立地理实体的地址
属性。将地址、门牌、建筑物名、企事业单位名称等空间位置的自然 语言描述转化为地址编码,实质就是建立地理实体与地址( 空间位置) 的一一对应关系, 也是对地理对象的二维地理位置编码 ( 实体→地址) 和解码( 地址→实体)。它一般建立在基于坐标的空间参考系中。 如 “市政监管信息化 地理编码”。 优点:易于被大家接受,符合人们惯用的思维方式
三、地理实体编码存在的问题
3、图元标识码(Element ID,ElemID) 唯一标识构成实体的点、线、面图元
《地理实体数据规范》中图元标识码共23 位,结构如下:
<县及以上行政区划代码> <数据比例尺代码> <随机码>
6
1
16
四、地理实体编码方案设计
实体编码解决的问题
1、不同比例下的地理实体关联 2、多行业的地理实体共享 不同行业对同一实体的位置、固有属性的描述一般相同,主要区别在于对 地理实体的类别划分。 3、重大地理实体的描述方式:
内容提纲
1 2 3 4 5 6
地理编码技术的概念
地理编码技术与方法 地理实体编码存在的问题 地理实体编码方案设计 地理实体编码的生成与实现 关键点的解决方法
一、地理编码技术的概念——名词解释
图元 Geometry Element 现实世界现象的抽象,在空间数据库中通常表达为点、 线、面图元。 地理实体 Geo-Entity 现实世界中独立存在、可以唯一性标识的自然或人工地
三、地理实体编码存在的问题
国家《地理实体数据规范》中指出: 地理实体数据使用地理实体标识码、图元的标识码、 信息分类码三类编码。 编码时,尽量采用已有国家标准或行业标准,必要时 可以进行组合与扩充。
三、地理实体编码存在的问题
1、信息分类编码 《地理实体数据规范》中分类代码采用已颁布的6 位基础测绘分类编码体系。 《浙江省基础地理信息要素分类与代码》在6位编 码基础上增加1位特征码和2位图形码。
五、地理实体编码生成与实现
五、地理实体编码生成与实现
实体编码原型系统可以为要素实体提供自动批量化的编码提取与赋值,左图为 实体赋值后示意图,图为oracle中要素实体存储记录。
六、关键点的解决方法
1、原始数据中的图元合并为自然界地理实体
根据实体的固有属性(名称、要素类别、等级和隶属关系、空间坐落位置、行政区域位 置)和图元之间的连通性来综合指导图元合并为实体。
a、自然要素(河流、山脉):需要顾及自然界的流域体系和隶属关系
b、人工要素(道路、居民地):需要顾及行政区域、道路等级等人文因素 4、地理实体与图元的界定
实体一般由多个具有相同名称的邻接图元组成,故名称和图元拓扑关系是
界定实体的重要标识。
四、地理实体编码方案设计
地理要素
水系
交通
行政区划、 境界
地名、地址
ElemID:0003 ClasID:420100 DataVersion: LifeCycle:
ElemID:0004 ClasID: DataVersion: LifeCycle:
图元层
实体层
图元层
实体层
一、地理编码技术的概念——为什么? 标识:如身份证;更新、关联、共享、交换等 识别:定量信息可以被计算机直接识别,而定性信息通
理对象的地址属性。实质是对地理对象的二维地理位置编码( 实体 →地理位置、格网坐标) 和解码( 地理位置、格网坐标→实体)。其
实就是表示地理实体在地理格网中位置定位信息( 直接指明或者给
定一个大小视地理编码精度而定的范围), 当建立格网之后, 地理对 象与编码( 格网标识) 之间的对应关系被唯一的确定了。 优点:定位精确,精度可控制。 缺点:难以建立地理对象之间的空间拓扑关系,需要建立一整套严密的 从大地基准、参考椭球、投影方式、格网的规定、格网原点、格网 划分规则、格网标识编码以及格网精度等各个方面去描述的格网系 统,需要考虑包括确定编码的最小地理对象或单元在内的多种因素。
公路实体编码
行列号、级别
000070000707
G
XXXXXXXXXX 名称编号 道路等级
街道实体编码
行列号、级别
四、地理实体编码方案设计
3)地名地址类标识码
000050000505 000 456
名称编号 地名地址类别 行列号、级别
4)行政区划类标识码
X XXX XX XX XX XXX
四级行政区域地名(区公所、镇、乡、苏木、街道) 三级行政区域地名代码(市辖区、县级市、县、旗、特区、林区) 二级行政区域地名代码(地级市、地区、自治州、盟) 一级行政区域地名代码(省、直辖市、自治区、特别行政区) 国家(地区)名称代码(国家) 大洲或国际公有领域代码
②标识码编译: 设定网格原点坐标 设定网格起始和终止边长 系统根据实体外包矩形,和以下运算公式 行号= 列号=
(中心点坐标X - 原点坐标X )/级别对应边长
(中心点坐标Y - 原点坐标Y )/级别对应边长
最终计算出行号、列号、级别 根据实体几何信息计算出代表点坐标
和长度\面积信息。
e) 利用现有软件方法计算方位信息。 f) 层次、名称编码按照数据库中已采集的属性信息直接批量赋值。 ③图元编码编译 图元编译方法同标识编码a~e步骤
河流
河流 水库
水库
湖泊
湖泊
公路
公路
街道
街道
地名地址
目前我们的实体划分层次
街道名、小区名
一级流域
一级流域
一级流域
所属类别
所属类别
关系到“层次编码”,
二级流域 二级流域 化学性质 门(楼)址、 标志物名、兴趣点名
河流类别
所在河流
兴趣点按行业 分为13子类
四、地理实体编码方案设计
1)水系类标识码
000050000505 GA 2100 036 名称编号:036 隶属河流 层级
四、地理实体编码方案设计
3、图元编码设计
A、图元编码结构(后26位编码均采用16进制):
***** 行号
***** 列号
**
****
****
****** 方位编码
***
级别 代表点相对X 代表点相对Y 面积/长度
1、选取27°N 、118°E为坐标原点,最大格网南北纬差5°、经差5°,此网格为 覆盖浙江全省最大网格(边长556596米)。 2、然后将经纬度转换为以米为单位,可知原点坐标为(-278298,-278298), 最大网格边长为556598 米,最小网格边长1米,行列号最大值为87E35,网格划分 为20等级。
ElemID:0001 ClasID:420100 DataVersion: LifeCycle:
EntiID:230101 Name:**县
ElemID:0002 ClasID:420100 DataVersion: LifeCycle:
EntiID:G102000000 Name:京哈线
ElemID:0003 ClasID: DataVersion: LifeCycle:
的一个重要环节, 成为基础地理信息数据作为空间基础框架整合信息
资源的重要手段。
二、地理编码技术与方法——注意的问题
1、一种地理对象 在地理编码的三个要素中, 地理对象决定着参考系统的采用和编码规 则的确定, 也决定着地理编码采用的方法。地理对象应尽可能只是一 种, 或者是地理实体, 或是地理区域, 多种地理对象同时进行地址编码 时, 会因为地理概念、地理区域与实体在空间的关系中的相关性等产 生问题, 影响地址编码规则的实现。 2、明确最小地理对象 明确最小地理对象( 或称最小地理单元)的划分, 对于地理编码的实现 也具有不可忽视的作用, 试想以城市管理的每一个部件( 一个信箱、 信号灯等) 作为最小地理对象和以街道、单位为最小地理对象的地理 编码将会存在很大的不同。最小地理对象尽可能不可再分、相互不重 叠、或在一个工作平面上可以连续分割空间且不交叉应该是最小地理 对象划分的基本原则。
五级行政区域地名代码:白荡海社区 四级行政区域地名代码:西溪街道 三级行政区域地名代码:西湖区 二级行政区域地名代码:杭州市 一级行政区域地名代码:浙江省 国家(地区)名称代码(国家):中国 大洲或国际公有领域代码 :亚洲