当前位置:文档之家› 知识结构化驱动智能客服升级

知识结构化驱动智能客服升级

智能服务事业部
相似问-上海有多少人口
• 上海有多少人口 • 上海目前常住人口有多少 • 上海市现在有多少人口 • 上海大约有多少万人口 • 上海常住人口有多少 • 上海人口人数是多少? • 上海有多少人口 • 上海人口有2500万吗 • 上海市总人口是多少? • ……
智能服务事业部
相似问-北京呢
• 北京有多少人口 • 北京目前常住人口有多少 • 北京市现在有多少人口 • 北京大约有多少万人口 • 北京常住人口有多少 • 北京人口人数是多少? • 北京有多少人口 • 北京人口有2500万吗 • 北京市总人口是多少? • ……
700->70
智能服务事业部
知识结构化-知识图谱-从FAQ到属性
4000->400
智能服务事业部
知识结构化-语义剖析-语义表达式
非结构化的用户query
结构化语义表达式
智能服务事业部
知识结构化-语义剖析-语义表达式
智能服务事业部
知识结构化-结构化答案展示
非结构化的文本型答案
结构化答案
智能服务事业部
知识结构化-知识图谱-基本概念
• 知识图谱 • 本质上是实体与实体间关系 以及实体属性组成的语义网 络,其基本组成单位是“实体关系-实体”或“实体-属性-属性 值”三元组。
• 实体与关系是知识图谱中的最基 本元素
智能服务事业部
知识结构化-知识图谱-阿里小蜜知识云平台
智能服务事业部
知识结构化-知识图谱-商品知识图谱
智能服务事业部
解决方案-知识驱动的抽象语义表达(KAMR)
KAMR着力解决四个方面的问题: 歧义性 复杂性 复用性 模糊性
智能服务事业部
解决方案-KAMR Ontology
智能服务事业部
解决方案-KAMR Language
智能服务事业部
解决方案-MultiCG Semantic Parser
• BERT F1值:91.94%
32
智能服务事业部
解决方案-KAMR Parser-基于多因子的意图分类
• 每一个意图由三维因子组成[domain, predicate, target] • 每一个query由四维因子组成[domain, predicate, target, query type]
设置1个知识点,管理任务轻,但答案过粗
智能服务事业部
语言理解难点
多样性 歧义性 复杂性 复用性 模糊性
• 组合贷款 • 公积金和银行都有
• 2G、4G、5G
• 我要关闭国际漫游并开通流量通套餐 • 话费充值如何索取发票供报销
• 公积金、社保、医保
• 公积金、社保、医保
智能服务事业部
从传统智能问答到知识图谱问答
KAM R TO
M ultC G
31
智能服务事业部
挑战点
解决方案-KAMR Parser-实体识别
1.无实体问句 • 推荐便宜点的套餐 2.有歧义的实体 • 如何取消订购套餐 vs 我本月套餐送话费吗 3.不连续的实体 • 大流量58元套餐
解决方案
• 序列标注模型,并改进Tag Schema
效果
• BiLSTM-CRF的F1 值:91.20%
查询
同场景复用、 跨场景复用、 跨客户复用
语言理解精 度高,可稳 定迭代提升
精细管理
业务知识精 细化管理
训练数据精 细化管理
推理计算
上下位、比 较、计算
智能服务事业部
总结
需求 思路 方案 收益
知识管理 语言理解
知识图谱构 建
语义剖析
答案展示
KAMR语义表 示体系
KAMR Parser
知识图谱问 答平台
SELECT ?x WHERE { 快餐包:档位介绍 ?y0 . ?y0 :有效期 ?x . ?y0 :资费 ?y1 . ?y0 :流量 ?y2 . } FILTER BY (?y1 = 5 &&
30 ?y2
智能服务事业部
MultCG不足
解决方案-KAMR Parser—流程图
• 处理复杂问题能力不足 -- 我要买大流量套餐和月末流量包 • 基于规则的依存分析不够灵活 -- 有没有大于5元小于10元的套餐 • 消歧能力不足 -- 办理4G流量日包
AMRL(Alexa Meaning Representation Language ) is a compositional graph-based semantic representation that includes finegrained types, properties, actions, and roles and can represent a wide variety of spoken language. (Domain-specific)
智能服务事业部
相似问-天津呢?面积呢
人工智能
人肉智能
智能服务事业部
知识管理痛点
成千上万的知识点,缺乏关联,给知识运营和管理带来困扰
设置多个知识点,答案细致,管理任务重
办理58元2G大流量套餐 -- N * M * L 办理10元加油包 据流量套餐30元 开通数据流量套餐30元 办理20元加油包 开通数据流量套餐50元 开通数据流量套餐50元 开通15元流量日套餐 开通15元流量日套餐 开通数据流量套餐10元 开通数据流量套餐10元
concatenation D P T QT D P T QT
Sentence-level score

Intent classification
Attention Factor-level score
智能服务事业部
多因子意图分类:支持上下文相关的多轮问答
针对语义不清 • 模糊意图:公积金抵扣
的关联推荐
上海有多少人口
语言
智能
2017年上海的常住人口 是:2419.70万
(上海,常住人口, (2017年,2419.70 万))
知识
深度 学习
智能服务事业部
知识结构化的主要思路
非结构化业务文档 半结构化数据
结构化知识图谱
非结构化的用户query
结构化语义表达式
非结构化的文本型答案
结构化答案
智能服务事业部
公积金 提取 租房
租房提取公积金
公积金 方式 提取 租房
同一意图 公积金 数值 不同的QT 提取 租房
我想问一下住房公积金怎么 租房提取,公积金一年可以提多少 提取的呀,租房
公积金 提取 购房
粗细粒度 意图共存
公积金 提取 none
智能服务事业部
多因子组合式意图分类模型
智能服务事业部
解决方案-KAMR Parser-基于多因子的意图分类
query
domain predicate target Query type
label
CNN& BiGRU
Average Embeddings
3-actor Attention
Dense & Softmax
Factor classification
Factor Effect
37
智能服务事业部
面向知识运营人员的结构化问答平台
启发式问答
关联推荐
反问与澄清
指代消解
增强学习
智 能
算 法
KAMR Parsing 通用实体与领域实体识别
意图分类

语义依存分 环




基础NLU
中文分词和词性标注 句法依存分析

篇章分析


流、
KG编辑平台 可视化编辑
存储与查询 知识卡片 健康检测 在
本体:以商品为核心,以人、货、场为主要 框架,共涉及9类一级本体和27类二级本体
实体识别与链指:支持品牌、 规格、类目、型号等多种实体
智能服务事业部
知识结构化-知识图谱-客服场景
非结构化业务文档 半结构化数据
结构化知识图谱
智能服务事业部
知识结构化-知识图谱-客服场景
智能服务事业部
知识结构化-知识图谱-从FAQ到属性

线 训

本体与语料
通用Ontology与语料库

行业Ontology与语料库 练、
智 能
KG挖掘平台
实体与同义词挖掘
意图挖掘
训练语料挖掘 诊

智能服务事业部
知识结构化收益
高效复用 精准理解
举一反千:新 增实体,毋须
新增相似问
4000FAQ->60 属性+300知
识点
理解更深入、 回答更细致
模糊、范围、 多约束条件
• 关联意图:组合贷款抵扣、商业贷款 抵扣……
上下文继承
• 医保 • 待遇
智能服务事业部
解决方案-KAMR Parser-Semantic Dependency Parser
解决方案 • Biaffine Parser模型, 预测节点间关系,分析各类复杂query:多实体、多约束条
件、多谓词多意图
高效复用 精准理解 精细管理
知识结构化-结构化答案展示
智能服务事业部
知识结构化-结构化答案展示
智能服务事业部
知识图谱问答解决方案
AMR、AMRL
KAMR
MulCG Parser
KAMR Parser
FAQ问答+知识图谱问答
结构化问答平台
智能服务事业部
解决方案-相关工作-AMR和AMRL
AMRs(Abstract Meaning Representation) are rooted, labeled graphs that are easy for people to read, and easy for programs to traverse. AMR aims to abstract away from syntactic idiosyncrasies. (General)
相关主题