第一章专家系统概述1、专家系统(ES):是一个智能程序系统,有大量的、高水平领域专家的知识;有领域专家解决问题的思维方法。
ES所处理的问题是依据已积累的知识来求得问题解答,一般没有准确的数学公式来表达,这就是ES与“一般问题求解”方法的不同之处,数据+算法=传统程序,知识+推理=专家系统。
ES的关键是知识获取、知识表达与推理的过程。
2、专家系统的组成:知识库、推理机、数据基、人机界面、知识获取、解释机构。
3、专家系统的分类:(1)诊断类专家系统(2)预测类专家系统(3)解释类专家系统(4)数学专家系统(5)设计与规划专家系统(6)咨询与决策专家系统(7)教学类专家系统(8)知识自动获取系统4、专家系统的特征:(1)专家系统具有显示表达的大量领域专门知识(2)能进行呼号处理(3)具有智能(4)对推理过程的理解5、与多媒体技术结合(了解)6、图灵奖:专门奖励那些对计算机事业作出重要贡献的个人,是计算机界最负盛名、最崇高的一个奖项,有“计算机界的诺贝尔奖”之称。
明基斯第一个图灵奖获得者。
7、麦卡锡则提出表处理语言Lisp:卡普提出分支界限法;费根鲍姆提出知识蕴藏着力量:第一个专家系统是MYCIN;第二章专家系统知识1、产生式规则表示法:格式:if (前提1)&(前提2)&……then(结论1)&(结论2)&……2、框架表示法:框架:是用于描述具有固定的静态对象的通用数据结构;该对象用:“对象——属性——属性值“表示,框架由若干个槽组成,槽用于描述属性。
槽有两种形式 a.槽名+槽值;b.槽名+侧面策略3、语义网络表示法:语义网络是基于网络结构表示人类知识结构的一种形式,语义主要是指语言结构及其意义上的联系。
一个简单的语义网是如下三元组:(节点1,狐,节点2)例:4、知识获取的方式(1)非自动知识获取:分为两步首先由知识工程师从领域专家和有关技术文献获取知识,然后有知识工程师用某种知识编辑软件输入到知识库中。
(2)自动知识获取:是指系统自身具有获取知识的能力,它不仅可以以直接与领域专家对话,从专家提供的原始信息中“学习”到专家系统所需要的知识,而且还能从系统自身的运行实践中总结、归纳出新的知识,发现知识中可能存在的错误,不断自我完善,建立起性能优良,知识完善的知识库。
5、只是诱导,就是一种谈话技术,目的是为了顺利地解决遇到的相关难题,保障知识获取顺利进行。
6、基于模型的知识获取,有6中常见的模型分别是:(1)说明模型(2)领域模型(3)专题模型(4)描述模型(5)操作模型(6)表示模型(7)系统模型7、基于领域模型的知识获取有6中常见的领域模型分别是:(1)有穷无结构目标搜索型(3)无穷无结构目标搜索型(3)有结构目标搜索型(4)有空间结构的目标构造型(5)有时间结构的目标构造型(6)含时空结构的目标构造型8、知识检测的方法:知识检测分为静态检测和动态监测,静态检测是指在知识输入之前由领域专家及知识工程师所做的检查工作。
动态监测是指在知识输入过程中以及对知识库进行增、删、改时由系统所进行的检查。
检测的方法有:(1)逻辑表达式等价性德检测(2)冗余的检测(3)矛盾规则及矛盾规则链的检测(4)从属规则的检测(5)环路的检测9、知识求精:为了找出导致错误的原因,就需要找出产生这些错误的知识,予以改进,以提高知识库的可靠性,称之为知识求精。
实现知识求精的一般方法是:用一批已知结论的实例考核知识库,看有多少实例被系统错判和漏判,然后对知识进行适当的修正,以提高知识库的可靠性。
第三章产生式与产生式系统1、把一组产生式放在一起,让它们互相配合,协同作用,一个产生式生成的结论可以供另一个产生式作为前提使用,进而求得问题的解决,这就叫产生式系统2、产生式的特点主要是比较蕴含式与产生式:(1)蕴含式只能表示精确知识,其真值或者为真、或者为假;而产生式不仅可以表示精确知识,也可以表示不精确知识(2)在用产生式表示知识的系统中,决定一条知识是否可用的方法是检查当前是否有已知事实可与前提中规定的条件匹配。
这种匹配可是精确的,也可以是不精确的,只要按某种算法求出的相似度在某个预先指定的范围内就认为是可匹配的。
3、产生式系统的构成:一个产生式系统由以下3个基本部分组成:规则库(Set of Rules)、综合数据库(GOLBLE DA TABASE)和控制系统(Controls System)。
如图所示(这是一个简易图答出来给60%的分)下面是完整的产生系统构成图4、例3.1建立一个动物识别系统的规则库,用以识别虎、豹、斑马、长颈鹿、企鹅、鸵鸟、海燕等7种动物。
解:为了识别这些动物,可以根据动物识别的特征,建立包含下述规则的规则库:RULE1:IF 动物有毛发THEN 动物是哺乳动物RULE2:IF 动物有奶THEN 动物是哺乳动物RULE3:IF 动物有羽毛THEN 动物是鸟类动物RULE4:IF 动物会飞AND 会生蛋THEN 动物是鸟类动物还可以对哺乳动物、鸟类动物进一步分类,这里就不细说了(课本72页,课件有详细说明)5、控制系统(了解):控制系统又称为推理系统或推理机,由一组程序组成,实现对问题的推理和求解。
它负责整个产生式系统的运行,包括:规则左部与DB匹配;从匹配成功的规则中,选出一条将在下一步执行的规则甲,执行甲右部规定的动作;掌握时间结束产生式系统的运行。
6、产生式系统有两种最基本的推理方式:正向(向前)推理和反向(向后)推理。
正向推理是指从已知事实出发,逐步推导出最后结论,其推理过程大致是:(1)用工作存储器中的事实与产生式规则的前提条件进行批配;(2)按冲突消解策略从匹配的规则实例中选择一条规则;(3)执行选中规则的动作,依次修改工作存储器;(4)用更新后的工作存储器,重复上述几步工作,直到得出结论或工作存储器不再发生变化为止。
反向推理则是首先提出假设,然后验证这些假设的真假性,找到假设成立的所有证据或事实。
其推理过程大致是:(1)看假设是否在工作存储器中,若在,则假设成立,推理结束;(2)找出结论与此假设匹配的规则;(3)按冲突消解策略从匹配的规则实例中选择一条规则;(4)将选中规则的前提条件作为新的假设,重复上述几步工作,直到假设的真假性被验证或不存在激活的规则。
7、按规则库及综合数据库的性质与结构特征进行的分类,可分为可交换的产生式系统、可分解的产生式系统和可恢复的产生式系统8、产生式系统表示法的特点优点:(1)自然性(2)知识的模块化(3)相互影响的间接性(4)有效性(5)清晰性(6)机器可读性缺点:(1)效率不高(2)不能表达具有结构性的知识9、匹配:在这一步,把当前数据库与规则的条件部分相匹配。
如果两者完全匹配,则把这条规则称为触发规则。
当按规则的操作不分区执行时,称这条规则为启用规则。
被触发的规则不一定总是启用规则,因为可能同时有几条规则的条件部分被满足,这就要在解决冲突步骤中来解决这个问题。
在复杂的情况下,在数据库和规则的条件部分之间可能要进行近似匹配。
10、匹配冲突:在产生式系统进行推理的过程中,可能会在选择产生式和数据、子目标等方面产生二义性,这就是所谓的匹配冲突。
11、非确定性匹配(部分匹配)例:北京市中医院中医妇科钱伯煊大夫的经验(腰背冷痛∇畏寒∇肢冷/1)∧(腹胀∇便溏∇泻泄∇倦怠乏力∇浮肿∇嗜睡∇白带稀薄∇舌质淡胖边有齿痕/2)∧(腰酸痛∇尿频∇五更泻泄/1)→脾肾阳虚例1说明了:只要左边诸项中有部分项为真,规则便可被激活,右边项即为真。
变上例为标准产生式产生式左部:第3对括号中有7种可能,故总的组合数为12103种,即例1要变成标准产生式,则需变成12103个产生式,这样做既不直观,也不经济,部分匹配的意义之一于此可见。
12、匹配冲突消解策略:(1)按事先排好的固定顺序(2)按数据的新鲜性排序(3)按子目标的新鲜性排序(4)按匹配程度排序第四章搜索策略1、推理程序称为控制策略。
2、根据问题的实际情况不断寻找可利用的知识,从而构造一条代价较少的推理路线,使问题得到圆满的解决的过程称为搜索。
3、搜索分为盲目搜索和启发式搜索盲目搜索:是按预定的搜索方向进行搜索,由于盲目搜索总是按预先规定的路线进行,没有考虑到问题本身的特性,所以这种搜索效率不高。
启发搜索:是在搜索中加入了与问题有关的启发性信息,用以指导搜索朝着最有希望的推理方向前进,加速问题的求解过程并找到最优解。
4、搜索方法,归纳起来有以下几种(1)求任一路径的搜索策略(2)求最优路径的搜索策略(3)与或图搜索法5、状态空间:由问题的全部状态及一切可用算符所构成的集合称为问题的状态空间,一般用哪个一个三元组表示:(S,F,G)6、例:二阶梵塔问题。
设有三根柱子,在1号柱子上穿有A、B两个盘片,盘A小于盘B,盘A位于盘B的上面。
要求把这两个盘片全部移到另一根柱子上,而且规定每次只能移动一片,任何时刻都不能使盘B位于盘A的上面。
7、我们把使用算符最少的解称为最优解8、分解:把一个复杂问题分解为若干个较为简单的子问题,每个子问题又可继续分解为若干个更为简单的子问题。
重复此过程,直到不需要再分解或者不能再分解为止。
然后对每个子问题分别进行求解,最后把各个子问题的解复合起来就得到了原问题的解。
9、等价变换:对于一个复杂问题,除了可用“分解”方法进行求解外,还可利用同构或同态的等价变换,把它变换成若干个较容易求解的新问题。
若新问题中有一个可求解,则就得到了原问题的解10、本原问题不能在分解或变换,而且直接可解的子问题称为本原问题。
11、端节点与终止节点在与/或树中,没有子节点的节点称为端节点;本原问题所对应的节点称为终止节点。
显然,终止节点一定是端节点,但端节点不一定是终止节点。
12、可解节点在与/或树中,满足下列条件之一者,称为可解节点。
(1)它是一个终止节点。
(2)它是一个“或”节点,且其子节点至少有一个是可解节点。
(3)它是一个“与”节点,且其子节点全部是可解节点。
13、不可解节点关于可解节点的三个条件全部满足的节点称为不可解节点。
14、解树由可解节点所构成的,并且由这些可解节点可推出初始节点(它对应于原始问题)为可解节点的子树称为解树。
在解树中一定包含初始节点。
15、广度优先搜索的基本思想是:从初始节点S0开始,逐层地对节点进行扩展并考察它是否为目标节点,在第n层的节点没有全部扩展并考察之前,不对第n+1层的节点进行扩展。
OPEN表中的节点总是按进入的先后顺序排列,先进入的节点排在前面,后进入的节点排在后面。
16、广度优先搜索过程如下:(1)把初始节点S0放入OPEN表。
(2)如果OPEN表为空,则问题无解,退出(3)把OPEN表的第一个节点(记为节点n)取出放入CLOSE表。