探究知识图谱
我思故我在。
人的思维活动主要有感觉、认知、记忆、学习、联想、计算、推理、判断、决策、抽象、概括等10大类。
没有了这些思维活动,人自然就是死人了。
模仿人的思维活动,用计算机解决现实问题,就是人工智能的目标。
人工智能其实就是对现实问题的求解,其方法主要是应用逻辑推理,而面向现实的逻辑推理能否实现的关键,在于知识表示方法。
确实,知识是很难用逻辑和数学表示清楚的。
人们为此探索出了各种各样的知识表示方法。
现在比较常用的知识表示方法主要有:状态空间法、问题规约法、谓词逻辑法、产生式法、语义网络法、框架法、脚本法等。
没错,在浏览器中经常看到的脚本一词,就是一种知识表示方法。
但是目前看来,语义网络法风头强劲。
知识,究其本质,就是信息的联接。
在网络空间,通过链接很容易实现知识的联接。
互联网搜索领域的老大,谷歌公司使用了一种能够提供智能搜索服务的技术,这个技术就是知识图谱。
知识图谱其实就是一个知识库,这个知识库从从语义角度组织网络数据。
计算机领域的库这个概念,借用了现实生活中仓库这个概念。
计算机的库,首先是描述信息,组织信息,存储信息,有点象是图书馆给书分类,贴标签,按标签上架。
这些工作的目的,是为了方便检索,查找。
知识库,
就是把知识贴上标签,放在一个计算机的库里。
那么,问题来了,知识在这个库里,怎么表示呢?
显然,这个问题已经超越了计算机应用,进入了哲学领域,需要回答什么知识?或者说知识的本质是什么?好在哲学上有一关于本体论的研究,给我们解决这个问题带来了曙光。
本体论探究的是客观事物的本质及其组成,本体就是事物的本质和它的组织。
本体论主要探究两个问题,一个问题是“事物的本质是什么?”,另一个问题是“事物的一般特征是什么?”。
由这些探究逐步可以构建一个分类体系,比如植物学,其实就是一个门、纲、目、科、属、种的分类体系。
由一个一般特征,可以再往下找到几个一般特征予以分类。
分类是很不容易的,可以说,迄今为止,人类的知识体系,就是一个分类体系。
归根到底,知识就是分类加关联。
有了对知识本质的理解,就有了知识表示的方法。
其中的一种方法就是语义网络。
语义网络其实就是一种网络图,先有一个节点,让后通过节点的关系,指向另一个节点。
比如,老王是个节点,然后通过儿子关系指向小王,小王通过儿子关系指向小小王等,老王通过媳妇关系指向麻子,麻子通过儿子关系指向小王等。
这样老王家就构成了一个网络图,这个网络图还可以成为老王家这样一个大节点,老王家通过同事关系指向老李家,老王家、老李家通过邻居关系指向小
区,小区通过街区关系指向街镇等等,这样既是指向明确,又是层层嵌套,无穷无尽,并以此形成了一个知识系统。
可以看出,语义网络这个网络图,其实是个有向图,图中的节点可以是概念、属性、动作、状态,有向弧表示两个节点之间的关系。
关系的本质是一种说明,比如有一种猫是波斯猫,那么说明波斯猫,可以是用“有一种是”关系来有向联接猫。
关系是很灵活的,比如说明一个人的关系,就可以有“生日是”、“身高是”、“职务是”、“工作单位是”、“孩子是”等等的各种有向联接。
语义网络其实就是一种有向的、复杂的图结构而已。
可以看出,所谓高大上的知识图谱,不过就是语义网络的图结构的库罢了。
但是,这个库确是能够实现无比强大的功能,这一点,容后在慢慢细说。
二〇二〇年十一月十二日星期四于上海闵行莘庄。