第4章知识获取和知识库管理
知识的计算机表示:产生式表示、谓词逻辑表示、语义网 络表示、框架表示等。
知识工程师是知识获取的主体,必须通过各种努力来 抽取并表示所需要的知识。其基本方法是: 交谈 试验 数据采集 分析、归纳
第4章 不确定性推理
Uncertainty Reasoning
2
4.1 知识获取概述
通常,知识源的知识并不以一种现成的表示形式而存 在。所以,知识工程师通常采用的知识获取方法是:
第4章 不确定性推理
Uncertainty Reasoning
6
4.1 知识获取获取
4.1.3 知识获取的困难
对于知识工程师而言,建造一个新的专家系统,相当于 学习一门新的专业。尽管知识工程师具备宽广的知识源, 但为了建立一个特定领域的ES,他们必须在领域专家的 指导下,翻阅、检索大量文献、资料,从中抽取与问题 有关的领域共性知识。
有可能发现形式化阶段所确定的推理模式、知识表 示和数据结构相互间不匹配。因此需要知识工程师 与专家配合,消除整体上的不一致性。
注:原型系统开发是非常重要的步骤。
第4章 不确定性推理 Uncertainty Reasoning 20
4.2 知识获取的基本过程
4.2.5 测试阶段 原型系统生成后,为了估计系统的性能以及系统 赖以实现的表示方法,应通过不同的实例来测试ES的 知识库和推理机的弱点。有经验的知识工程师将会从 专家引出一些问题。这些问题可能是向系统性能的挑 战(对系统性能的改进意见)。将彻底暴露系统的严 重缺点和错误。 通常,导致系统性能方面问题的主要因素有: 输入输出特征 推理规则 控制策略 测试实例
第4章 不确定性推理
Uncertainty Reasoning
13
4.2 知识获取的基本过程
知识工程师与领域专家密切合作,通过反复交谈和 讨论,确定要解决的问题及相关事宜。需要确定的具体 问题是:
哪类问题希望由ES求解? 这些问题如何定义和说明? 为解决这些问题,重要的子问题和子任务是什么?
第4章 不确定性推理 Uncertainty Reasoning 3
4.1 知识获取概述
对于知识获取,可用下图做直观说明。
知识源1
知识源2 …… 知识源n 知识源
第4章 不确定性推理
R1 知 R2 识 表 Rn 示 ……
抽取 转换
知 R1 识 R2 表 示 Rm …...
知识库1
知识库2 …… 知识库m 知识库
此外,知识工程师还要花费大量时间与精力,同领域专 家密切合作,获取属于专家个人的启发性知识。
第4章 不确定性推理
Uncertainty Reasoning
7
4.1 知识获取获取
实践表明,获取专家的启发性知识是十分困难的任 务,主要原因有: 知识表现失配。 具体地说,人类专家通常陈述知识的方法与ES采用 的知识表示方法不一致。 专家的启发性知识是不精确的。 专家的启发性知识往往隐含着近似、不确定、不充 分、不完全,甚至产生矛盾。目前,ES中表示不精确知 识的能力是十分有限的。 有些启发性知识表示的不可能性。 领域专家凭借多年总结和积累的实践经验,采用独 特的方法和有效的手段,去解决困难问题,但难以把这 些经验和策略方法显式的表达出来。“知其然,不知其 所以然”是知识工程师在知识获取中经常遇到的问题。
知识的正确性需要经过反复测试与调试,为了孤立 出形成问题解答的错误,可能需要跟踪包含着数百个事 实的几十种推理。
第4章 不确定性推理
Uncertainty Reasoning
9
4.1 知识获取概述
为了能观察到错误与其真实原因联系起来,必须 弄清知识与推理机控制策略之间的相互作用。而且, 除非知识各部分之间相互依赖关系是非常明了的,否 则,在修正一个观察到的错误时,在知识库中的修改 都可能引起新的错误,这些错误有可能降低ES的性能。
第4章 不确定性推理
Uncertainty Reasoning
17
4.2 知识获取的基本过程
ES的信息流是什么? 能否把解答问题所需要的知识与验证问题解答的知识区 别和分离开来? 在概念化阶段,需要知识工程师与专家进行密切配 合、反复磋商,因此,需要消耗大量时间,是知识获取 的重要阶段。在此阶段,要经过多次、反复的验证与修 改,需要把领域专家所研究的对象、概念及其相互关系 说明、表示清楚,并将信息流向表达清楚,这相当于知 识从知识源中抽取出来了。 在概念化阶段,应该建立一个用文字描述的ES,包 括知识库和推理机等。
第4章 不确定性推理
Uncertainty ReasoningLeabharlann 104.2 知识获取的基本过程
4.2.1 确定阶段 4.2.2 概念化阶段 4.2.3 形式化阶段 4.2.4 实现阶段 4.2.5 测试阶段 4.2.6 修改完善阶段 4.2.7 知识获取的简单实例
第4章 不确定性推理
Uncertainty Reasoning
ES解决问题所达到的目标是什么? 解决问题需要那些资源?包括知识源、时间、设备、 经费等。
第4章 不确定性推理
Uncertainty Reasoning
15
4.2 知识获取的基本过程
4.2.2概念化阶段 在确定阶段已经提出了有关ES问题的关键概念和 关系。 在概念化阶段,要以更直接、明显的方式对上述 概念和关系进行描述和说明。通常知识工程师可以利 用框图的形式,更形象、更准确地阐述这些概念和相 互间的关系。
随着专家系统开发工具的使用,知识表示与推理机的研制 周期大大缩短,使得知识获取问题更为突出。 因此,知识 获取是专家系统乃至其他知识系统的一个“瓶颈”。
第4章 不确定性推理 Uncertainty Reasoning 1
4.1 知识获取概述
4.1.1 什么是知识获取
知识获取,是把用于求解专门领域问题的知识从拥有这些 知识的知识源中抽取出来,转换为特定的计算机表示。 知识源包括:人类专家的经验、教科书的知识、数据库的 内容,人的直觉,人对问题的认识等。
确定ES数据结构。
第4章 不确定性推理 Uncertainty Reasoning 19
4.2 知识获取的基本过程
4.2.4 实现阶段 实现阶段的主要任务有:
把形式化表示的知识,用系统可直接理解的表示形 式或语言形式具体描述出来,并用这种描述定义具 体的信息流和控制流,使之达到一种可执行的程度, 从而产生原型系统。
第4章 不确定性推理
Uncertainty Reasoning
18
4.2 知识获取的基本过程
4.2.3 形式化阶段 形式化阶段的任务有:
选择合适的知识表示模式,把概念化阶段分离出来的重 要概念、子问题及信息流特征等图形形式,更加正式的 表示出来; 明确问题求解过程的基本推理策略与推理方式;
理解ES问题领域的数据性质,包括数据获取方式、数据 的精确程度、数据的一致性程度和数据的完备程度;
第4章 不确定性推理
Uncertainty Reasoning
16
4.2 知识获取的基本过程
在概念化阶段,主要解决以下问题: 什么类型的数据可以利用。 哪些数据可以直接给出,哪些数据需要推导得出。 子任务及子任务的采用策略(如,是否有名字)。 是否具有可识别的假设?这些假设是否常用的?是否 为不完全假设?这些假设包括什么? 在研究领域中,对象是如何损失的? 能否画出ES的层次结构图,并标出因果关系、集合包 含的内容、部分与整体等关系?它们具有何种形式? 在问题求解中涉及那些过程?它们的约束条件是什么?
第4章 不确定性推理 Uncertainty Reasoning 22
4.2 知识获取的基本过程
若性能由于表示的选择,产生某些故障,则这种选择 需要重新考虑,做出改变。这就是“重新设计”。需要用 新的表示,返回到形式化阶段,重新循环。 若问题根源在于概念化阶段或确定阶段的错误,则知 识工程师需要从知识获取的第一阶段,矫正在概念、关系 和过程的抽取和描述方面所产生的错误,重新进行循环。
第4章 不确定性推理 Uncertainty Reasoning 21
4.2 知识获取的基本过程
4.2.6 修改完善阶段 在建造ES过程中,修改和完善几乎是不断的过程, 包括: 概念的重新陈述; 表示的重新设计; 原型系统的精练。 对于原型系统的精练,常常循环反复地贯穿于实现 和测试阶段,以协调或校正规则及其控制结构,直至达 到期望的运行结果。 一旦ES的推理作用域稳定了,修改的结果应该在性 能上收敛。否则,就需要知识工程师对知识库进行比较 重大的修改了。
第4章 不确定性推理
Uncertainty Reasoning
5
4.1 知识获取概述
4.1.2 知识获取方法的分类 按照基于知识的数据本身在知识获取中的作用分类。 分为主动型知识获取和被动型知识获取两类。 按照基于知识的系统获取知识的工作方式分类。 分为非自动型知识获取和自动型知识获取两类。 按照知识获取的策略分类。 分为会谈式、案例分析式、机械照搬式、教学式(示教 式)、演绎式、归纳式、猜想验证式、反馈修正式、联 想式和条件反射式知识获取方法。
交谈:知识工程师直接与领域专家会话。把专家的专门知 识和经验抽象出来; 试验:知识系统对一定数量的问题进行试探性解答; 数据采集:对问题的基本特征、求解问题所采用的方法或 策略的记录,以及求解结果的收集与整理; 分析归纳:在交谈、试验、 数据采集的基础上,去粗取精, 去伪存真,归纳总结出用于问题求解的事实、过程和判定 规则。
概念化
概念
确认组织 知识的规则
测试
实现
第4章 不确定性推理
Uncertainty Reasoning