DB 北京市地方标准DB11/T XXX—XXXX地址数据库建设技术规范Specification for address database construction(报批稿)北京市质量技术监督局发布目录前言 (2)引 言 (3)1 范围 (4)2 规范性引用文件 (4)3 术语、 约定 (4)3.1 术语 (4)3.2 约定 (6)4 地址数据库设计 (6)4.1 地址数据的设计 (6)4.2 数据字段定义的描述符 (8)5 地址数据库核心字段 (9)5.1 标准地址数据表核心字段 (9)5.2 地址别名核心字段 (13)6 地址数据的质量要求 (14)6.1 逻辑一致性要求 (14)6.2 数据完整性 (15)6.3 资料完整性 (15)6.4 时间属性要求 (15)6.5 地理位置要求 (15)7 地址数据库的建设与更新维护 (15)7.1 地址数据获取 (15)7.2 地址数据入库 (17)7.3 地址数据库更新与维护 (17)附录A(规范性附录)地址元素的分类 (19)附录B(资料性附录)标准地址的组成结构 (22)附 录C(资料性附录)地址元素的层次关系 (23)前言本标准的附录A为规范性附录,附录B、附录C为资料性附录。
本标准由北京市信息化工作办公室提出并归口。
本标准起草单位:北京市信息资源管理中心、建设综合勘察研究设计院、国家测绘局测绘标准化研究所。
本标准主要起草人:张宁、李军、毛东军、王丹、黄坚、刘振萍、陈桂红、刘彦、汪民主、田飞、付哲、肖学年、张坤。
引 言为满足北京市电子政务建设和信息资源整合需求,在充分调查研究,认真总结实践经验,参考有关现行国家、行业和地方标准和国外先进标准,并在广泛征求意见的基础上,为规范全市及各区县地址数据库的建设,特制定本标准。
1 范围本标准规定了地址数据库设计,地址数据库核心字段定义,地址数据质量要求,以及地址数据库的建设与更新维护技术要求。
本标准适用于地址数据库的建设与更新。
2 规范性引用文件下列文件的条款中通过本标准的引用而成为本标准的规范。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准;凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 5271.5 数据处理汇总05部分数据的表示法GB/T 7408 数据元交换格式信息交换日期和时间表示法GB 17733.1 地名标牌城乡GB 18030 信息技术信息交换用汉字编码字符集基本集的扩充GB/T 18521 地名分类与类别代码编制规则GB/T 18316 数字测绘产品检查验收规定和质量评定3 术语、 约定3.1 术语下列术语适用于本标准。
3.1.1地名geographical name人们对各个地理实体赋予的专有名称。
3.1.2标准地名standard geographical name使用规范的语言文字书写,并经过主管部门认可的地名全称。
3.1.3地址address使用规范的语言文字书写,并由主管部门确定的地理实体的位置。
3.1.4地址信息address information反映地址及其属性的文字、数字、图像、声音等的总称。
3.1.5历史地址former address过去曾经使用,现在不再使用的地址。
3.1.6现今地址under using address目前正在使用的地址。
3.1.7地址别名address alias对地址的简称或约定俗成的其他名称。
3.1.8地址元素address element构成地址的最小语义单元,地址元素通常是某个地理实体的名称。
如“幸福大街1号”由“幸福大街”和“1号”两个地址元素组成。
3.1.9地址层次关系address hierarchical relationship地址中各地址元素之间,存在的包含或隶属的逻辑组合关系与模式。
3.1.10标准地址全称standard address符合标准命名规则包含完整层次关系的地址完整名称。
3.1.11地址元素类型address element type地址元素对于的地名类型。
3.1.12地址数据库address database存储和管理历史地址和现今地址及相关信息的数据库。
3.2 约定3.2.1 表示法本标准内所使用的语法表示法是巴科斯范式(BNF):在双引号中的字(“word”)代表着这些字符本身。
而double_ quote用来代表双引号。
在双引号外的字(有可能是下划线)代表着语法部分。
尖括号(< >)内包含的为必选项。
方括号([ ])内包含的为可选项。
花括号({ })内包含的为可重复0至无数次的项。
竖线(|)表示在其左右两边任选一项,相当于“OR”的意思。
::=是“被定义为”的意思。
3.2.2 <字符串><字符串> ::= {字符}<字符> ::= <字母>|<数字>|<汉字><字母> ::= <大写字母>|<小写字母><大写字母> ::= A| B| C| D| E| F| G| H| I| J| K| L| M| N| O| P| Q| R| S| T| U| V| W| X| Y| Z<小写字母> ::= |a| b| c| d| e| f| g| h| i| j| k| l| m| n| o| p| q| r| s| t| u| v| w| x| y| z<数字> ::= 0 | 1| 2| 3| 4| 5| 6| 7| 8| 9<汉字> ::= GB 18030 8.2 双字节区中定义的任意单个字符4 地址数据库设计4.1 地址数据的设计4.1.1 总体要求地址数据库的设计应包括逻辑模型设计,物理结构设计,数据库安全设计等方面。
4.1.2 地址数据库实例地址数据库实例应设计独立的存储模式和访问策略。
4.1.3 数据库字段设计4.1.3.1 核心数据字段核心数据字段是完整保存地址的文字名称,时间特征,地理空间位置和层次关系的必备的最小字段集合。
4.1.3.2 数据字段的扩展地址数据库数据表必须包括本标准5.1和5.2规定的核心字段。
数据库开发、管理和应用过程中如果需要扩展地址数据库存储和管理内容,可根据需要自行扩展。
4.1.4 数据库结构逻辑设计地址数据库结构逻辑设计模型见图1:图1 地址数据库结构逻辑模型4.1.4.1 标准地址数据表满足现今地理和历史地址数据的统一存储和管理要求。
4.1.4.2 别名数据表作为标准地址数据集的补充,建立别名与标准地址关联,实现从别名到标准地址的快速检索。
4.1.5 地址数据库物理结构设计1)地址数据库物理结构设计对象包括数据文件、日志文件设计;2)设计内容包括各类文件的数量、存储位置、容量和限制目标;3)根据数据库服务器操作系统对文件系统的限制和要求进行物理结构设计;4)根据逻辑数据库划分、存储器容量限制、数据安全、数据访问速度和索引机制等因素进行设计。
4.1.6 数据库安全设计4.1.6.1 安全设计内容应包括用户管理安全和数据库备份与恢复设计,其他数据库安全设计遵循相关规定。
4.1.6.2 用户管理与数据访问安全设计1)用户名称和口令;2)用户授权机制;3)用户对数据库实体,包括表、表空间、过程的存取执行权;4)数据库实体存取审计机制;5)地址数据的分类与分级。
6)数据备份必须包括地址数据库所有在线数据;7)设计备份种类,备份周期,备份保留时间,备份管理制度;8)可采用双机热备或备份文件拷贝等方式;9)可采用完全备份和差别备份方式;10)规定数据恢复响应时间,设计恢复操作方法和恢复管理制度,11)设计离线备份和离线数据恢复制度。
4.2 数据字段定义的描述符本标准中地址数据字段通过一下描述符进行定义,在进行地址数据库设计或相关系统开发时,可采用数据库管理系统(DBMS)中最接近的数据类型进行数据库结构的设计。
4.2.1 字段名称字段的标记。
字段名称应当唯一,并且应当以字母、数字或汉字的字符串形式表示。
必选4.2.2 字段含义字段所代表的意义。
、必选。
4.2.3 数据类型字段值的类型,包括数值,字符型,字符串,日期等。
必选。
4.2.4 字段长度字段占据的存储空间大小,以字节为单位。
必选。
4.2.5 小数位数十进制位小数点后的有效位数。
可选。
4.2.6 约束字段的填写要求,分必填、条件选填和选填三种情况。
必选。
4.2.7 值域范围给定数据类型的值的汇集,给定数据类型的值域范围空间可以下列方式之一进行定义:1)枚举;2)由基本概念定义;3)定义为某些已定义的具有给定性质的值空间的子集;4)定义为某些由构造过程所规定的已定义的值空间的任意值的组合。
可选。
4.2.8 备注字段定义其他需要说明的内容。
可选。
4.2.9 格式字段值必须满足的表现形式。
可选。
5 地址数据库核心字段5.1 标准地址数据表核心字段5.1.1 ID字段名称:ID字段含义:标志符,用来唯一标识一条地址记录的数据序号。
数据类型:数值字段长度:4小数位数:0约束:必填值域范围:大于0的整数,任意两条标准地址记录的ID字段值不可重复备注:本字段可作为地址数据库主索引5.1.2 U码字段名称:U码字段含义:用于唯一标识一条地址记录的无意义字符串。
数据类型:字符串字段长度:36约束:必填值域范围:由数字,大写字母和连接符“-”组成的无意义字符串;在一个地址数据库中不能有两条地址记录具有相同的U码格式:********-****-****-****-********(备注:<“*”> ::= <大写字母> | <数字>)备注:U码是在输入地址数据时由计算机自动生成的GUID ,在一条地址记录的整个存续周期内不得修改。
5.1.3 标准地址名称字段名称:标准地址名称字段含义:标准地址的完整文字信息数据类型:字符串字段长度:200约束:必填值域范围:具有地名意义的汉字、字母和数字的组合,汉字字符集遵循GB 18030规定。
5.1.4 最低一级地址元素字段名称:最后的地址元素字段含义:标准地址的最低一级地址元素的完整名称。
数据类型:字符串字段长度:200约束:必填值域范围:具有地名意义的汉字、字母和数字的组合,汉字字符集遵循GB 18030规定。
5.1.5 地址元素类型字段名称:地址元素类型字段含义:最低一级地址元素的类型,地址元素类型的划分见附录B。
数据类型:字符串字段长度:8约束:必填值域范围:枚举,附录A规定的30个地址元素之一。
5.1.6 几何类型字段名称:地理空间几何类型字段含义:最低一级地址元素的对应地理实体的空间几何类型,分面状、线状和点状三种。