图片简介:本技术介绍了一种实时信息抽取方法,包括:将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理;将当前意图和当前实体的名称和属性值同时输入至表格填充服务中;输出当前的目标实体。可以为口语对话场景的信息抽取任务特殊定制,迎合了提问者和回答者一问一答的文本输入模式,能将前一轮提问者的问题意图保存至数据库,用户回答时可以取出数据库里的问题意图,再将问题意图和候选实体进行匹配和消歧,并将每一轮用户回答的实体信息实时的输出,使得提问者可以实时的查看目标实体的结果,且无需手动录入干预,省时省力。
技术要求1.一种实时信息抽取方法,包括:
将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理,其中,所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图,所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值;
将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中,其中,所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体,其中,所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格;
输出当前的目标实体。2.根据权利要求1所述的方法,其中,所述将所述当前意图和所述当前实体的名称和属性值同时输入
至表格填充服务中还包括:判断是否存在多个与所述当前意图相关的所述预定义的目标实体;若不存在多个与所述当前意图相关的所述预定义的目标实体,则将所述当前意图直接与所述当前实体的名称和属性值进行关联处理得到最终的目标实体;
若存在多个与所述当前意图相关的所述预定义的目标实体,则将所述当前意图转换成具体化意图;将所述具体化意图与所述当前实体的名称和属性值进行关联处理得到最终的目标实体。3.根据权利要求2所述的方法,其中,所述若存在多个与所述当前意图相关的所述预定义的目标实
体,则将所述当前意图转换成具体化意图包括:
获取上一轮的提问者的口语文本对应的意图;将所述当前意图基于上一轮的提问者的口语文本对应的意图转换成具体化意图。4.根据权利要求1所述的方法,其中,在所述将实时接收的提问者的口语文本和回答者的口语文本同
时输入至意图理解服务和实体解析服务进行处理之前,所述方法还包括:
判断所述实时接收的提问者的口语文本和回答者的口语文本中是否存在结束信号;若所述实时接收的提问者的口语文本和回答者的口语文本中不存在结束信号,将所述实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理;
若所述实时接收的提问者的口语文本和回答者的口语文本中存在结束信号,直接输出最终的目标实体。
5.根据权利要求1所述的方法,其中,在将所述当前意图和所述当前实体的名称和属性值同时输入至
表格填充服务中之后,还包括:
对所述提问者的口语文本对应的当前意图以及所述当前实体的名称和属性值进行存储。6.根据权利要求5所述的方法,其中,所述对所述提问者的口语文本对应的当前意图以及所述当前实
体的名称和属性值进行存储包括:
获取所述当前意图和/或所述当前实体的名称和属性值;对上一轮的所述当前意图和/或所述当前实体的名称和属性值进行替换更新。7.一种实时信息抽取装置,包括:意图理解模块以及实体解析模块,配置为将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理,其中,所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图,所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值;
表格填充模块,配置为将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中,其中,所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体,其中,所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格;
输出模块,配置为输出当前的目标实体。8.根据权利要求1所述的方法,其中,所述表格填充模块进一步配置为:
判断是否存在多个与所述当前意图相关的所述预定义的目标实体;若不存在多个与所述当前意图相关的所述预定义的目标实体,则将所述当前意图直接与所述当前实体的名称和属性值进行关联处理得到最终的目标实体;
若存在多个与所述当前意图相关的所述预定义的目标实体,则将所述当前意图转换成具体化意图;将所述具体化意图与所述当前实体的名称和属性值进行关联处理得到最终的目标实体。9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至
6任一项所述方法的步骤。
技术说明书一种实时信息抽取方法及装置技术领域本技术属于信息抽取技术领域,尤其涉及一种实时信息抽取方法及装置。背景技术在口语对话场景下,如,在用户信息录入时,客服人员需针对所要录入的信息对用户进行提问,用户回答后,客服人员再将信息录入到系统。
传统的基于段落、篇章文本的实体信息抽取系统,必须等到客服人员与用户问答交互完成后,一次性将段落文本或篇章文本作为系统的输入,系统从中抽取用户所需的目标实体信息,最后以格式化的形式输出出来。
此时,若中间某个实体抽取错误或某个实体信息缺失,客服人员是无法及时修改和填补实体结果的。技术内容本技术实施例提供一种实时信息抽取方法及装置,用于至少解决上述技术问题之一。第一方面,本技术实施例提供一种实时信息抽取方法,包括:将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理,其中,所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图,所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值;将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中,其中,所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体,其中,所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格;输出当前的目标实体。
第二方面,本技术实施例提供一种实时信息抽取装置,包括:意图理解模块以及实体解析模块,配置为将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理,其中,所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图,所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值;表格填充模块,配置为将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中,其中,所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体,其中,所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格;输出模块,配置为输出当前的目标实体。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本技术任一实施例的多意图识别训练或使用方法的步骤。
第四方面,本技术实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本技术任一实施例的多意图识别训练或使用方法的步骤。本申请的方法和装置可以为口语对话场景的信息抽取任务特殊定制,迎合了提问者和回答者一问一答的文本输入模式,能将前一轮提问者的问题意图保存至数据库,用户回答时可以取出数据库里的问题意图,再将问题意图和候选实体进行匹配和消歧,并将每一轮用户回答的实体信息实时的输出,使得提问者可以实时的查看目标实体的结果,且无需手动录入干预,省时省力,在中间有实体缺失或错误时,提问者可以实时对用户重新提问来修改结果,解决了需要在交互完成后,才能将所有文本一次性作为输入,做不到实时处理的问题。
附图说明为了更清楚地说明本技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本技术一实施例提供的一种识别实时信息抽取方法的流程图;图2为本技术一实施例提供的另一种识别实时信息抽取方法的流程图;图3为本技术一实施例提供的再一种识别实时信息抽取方法的流程图;图4为本技术一实施例提供的一个具体实施例的实时信息抽取方法的流程图;图5为本技术一实施例提供的另一个具体实施例的实时信息抽取方法的流程图;图6为本技术一实施例提供的一种识别实时信息抽取方法的工作流程框图;图7为本技术一实施例提供的一种识别实时信息抽取装置的框图;图8是本技术一实施例提供的电子设备的结构示意图;具体实施方式为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
请参考图1,其示出了本申请的识别实时信息抽取方法一实施例的流程图,本实施例的识别实时信息抽取方法可以适用于具备通讯或者实时语音对话功能的终端、如智能手机、平板、电脑等。
如图1所示,在步骤101中,将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理;