当前位置:文档之家› 基于知识图谱的电网模型本体智能问答系统研究

基于知识图谱的电网模型本体智能问答系统研究

本文针对其电力本体对象的划分结构和构成关系、通 过一套完整的电网本体实例抽取方案实现对电网调控云中的 实体数据的全量抽取,并存储于图数据库,在进行完实体数 据的抽取后,进行实体数据间关系的自动抽取和图数据中已 有节点的关系编排,其中关系获取是指实体间关系识别,需 要依靠句法结构来帮助确定两个实体间的关系,从而将整个 调控云中的数据以关联节点的方式存储于图数据,其中,本 文将对一些普适关系进行关系梳理及定义,以约束知识图谱 中节点的关系构成,例如,针对类似电网组织结构这类调 控云中的实体表,其针对上下级关系的构建是通过本表中 PARENT_ID 字段与本表中 ID 字段形成自关联的,在此前 提下需要将该表中的实例数据根据父子关系重新定义其在图 数据库中的连接关系,如湖南电网指向华中电网,且其关系 是所属上级电网。
随着智能电网建设的持续推进,调度自动化及相关业务 应用数量及规模激增,其底层需求对调度模型数据具有强依 赖关系,因此,电网调度新一代建设目标将调控云建设推向 首要位置,但是,基于调控云的模型数据的体量及其庞大, 自动化相关人员,甚至各业务系统厂家都很难梳理清楚其相 关模型数据间的潜在关系,因此,在实际业务系统建设过程 中,对于调度模型数据的查询检索都会衍生出一套额外的耦 合功能或是具体模块来针对各类系统的实际模型查询需求, 但是该类做法导致了大量的重复工作,且对于电网调度自动 化专责很难进行统一的模型数据管控。
本文中涉及的知识图谱构建框图如图 2 - 1 所示。 (1)表名、列名、主外键抽取:根据调控云中的元数 据格式,将各实体表的构造描述进行结构化抽取,并将其以 批量处理方式保存于系统内存中,等待系统对其统一处置。 (2)词元处置:根据(1)中的抽取命名抽取结果,将 所有表名、列名进行自然语言实体识别以及新词发现,在该 过程中将电力术语词元提取自调度术语库中,该方式简化了 人工进行词库构建的过程。 (3)实体、关系创建:根据(1)中的抽取实例数据结果, 首先将实例数据以分批处理方式存储于图数据库中,再次将 实例间的关系以规则定义方式解析至图数据库中存储。
(3)调度模型间关系错综复杂,且本体数据质量有待 提高,大大加剧了知识本体获取的难度。
(4)调度自动化或其他相关专业人员关系的模型数据的 问题维度相差甚远,需要针对各专业的业务需求梳理相关问题 分类,其业务壁垒导致了调度模型问答的适用范围的局限性。
调度模型知识图谱构建
构建知识图谱的关键技术主要包括信息获取和数据融合, 目前调控云提供了一套完备的电力调度通用数据对象结构化 标准,基于该标准,将所有电力本体对象划分为:组织机构、 电力设备容器、抽象容器、一次能源、公共环境、发电设备、 输电设备、变电设备、补偿设备、直流设备、设备大类、产品 信息大类、直流大类、设备关联大类、保护大类、自动化容器、 厂站公共二次设备、配电自动化终端设备、厂站自动化设备、 计算机设备、网络设备、安全防护设备、自动化辅助设备、连 接关系大类、软件大类、构成大类、自动化缺陷、稳控系统、
CHINA SCIENCE AND TECHNOLOGY INFORMATION Aug.2019·中国科技信息 2019 年第 16 期
31 万~ 60 万◎
DOI:10.3969/j.issn.1001- 8972.2019.16.033
可实现度
可替代度
行业曲线
link
appraisement
industry
针对上述情况,电网调度自动化专业亟需启用一套具备 快速、便捷、精准、智能、全面的调度模型智能问答系统, 以解决其日常生产工作过程中遇到的各类模型参数、模型 管理、模型治理、模型管辖等相关业务的问题解答,本文在 此背景下提出结合知识图谱建模、推理及自然语言理解技术 实现基于调度云的电网模型知识图谱建模及电网模型术语构 建,并依托于 NLP 及句拼接,以实现电网调度模型的智能问答。
-85-
◎ 31 万~ 60 万
中国科技信息 2019 年第 16 期·CHINA SCIENCE AND TECHNOLOGY INFORMATION Aug.2019
系统表大类、统计表大类共 30 个对象一级分类。 在该 30 类一级分类下,每一级大类下仍会下分多个子
级分类,其关联方式通过实体表间的主外键关联方式,例如 电力设备容器大类下拥有电网这个二级电力对象,其下拥有 跟该电力对象相关的所有属性描述的实体表,如电网这个对 象拥有的拓扑节点、直流输电统计信息、换流统计信息、变 电统计信息等。
目前,国内已有一些基于电网业务的知识图谱构建,李 新鹏等人针对调度自动化业务系统关系复杂,业务种类繁多 等特点,提出了一种自底向上和自顶向下相结合的调度自动 化系统知识图谱构建方法,通过知识获取、存储、展示与应 用三个步骤,解析结构化和半结构化的数据源,获得调度自
动化系统基础平台以及各业务之间的关系,形成系统结构和 详细业务知识等信息。俞阳针对电网知识库的主动更新场景, 提出了基于概率图模型,抽取概念对集合及主体的模式进行 实体对生产技术,其目标在于生产具备更优准确率及召回率 的实体对模型。
周 帆 3 叶健辉 3 肖林朋 12 刘慧勇 12 娄天月 12
1. 南瑞集团(国网电力科学研究院)有限公司;2. 北京科东电力控制系统有限责 任公司;3. 国网湖南省电力有限公司
影响力
真实度 行业关联度
基于知识图谱的电网模型本体智能问答系统研究
依托电网新一代建设目标及电力泛在物联网构建思路,研发基于调控 云并具备针对调度模型领域知识智能问答能力的搜索系统,是提高电网决 策智能化和使用便捷化的有效途径,其将成为代替各繁琐查询展示类系统 的门面入口,为后期电网微服务架构建设提供服务统一消费,本文在此背 景下介绍了一种基于电网调度模型知识图谱的智能问答系统构建技术,其 利用多源电力调度模型知识构建了电力调度模型领域知识图谱,并采用自 然语言处理技术实现了自然语言语义理解及查询语句拼接问题,并基于智 能推理实现了问题答案的生成和组织,实现了基于调控云的电力调度模型 本体的问题的精准回答。
调度模型问答特点
与现有常见的开放式、常识性问答搜索系统不同,调度 模型领域的问答系统具有更加显著的领域特点,该特质也造 成了具备生产实用化系统研发落地难度的明显提高,其显著 特质表现如下。
(1)调度模型领域具有极强的专业性,其电力术语不 同于开放领域或常识性范围,没有现成的语料可供训练及测 试。
(2)调度领域由于本身处于涉密阶层,与具备大量开 发知识源的常识性问答领域相比,缺乏可供复用的知识源。
相关主题