人工智能研究进展史忠植智能信息处理开放实验室中国科学院计算技术研究所,北京 100080shizz@摘要:本文以第十届国际3W会议和第十七届国际人工智能联合会议为背景,介绍人工智能研究取得的进展。
特别对知识表示、概率推理、本体论、智能主体、机器学习等问题进行讨论。
关键词:知识表示概率推理本体论智能主体机器学习The Progress of Research on Artificial IntelligenceZhongzhi ShiIntelligent Information Processing Open LaboratoryInstitute of Computing Technology, Chinese Academy of Sciences, Beijing 100080shizz@Abstract:Based on the Tenth International Word Wide Web Conference and the Seventeenth International Joint Conference on Artificial Intelligence, paper will introduce the progress of research on Artificial Intelligence. Particularly, Knowledge Representation, Probabilistic Reasoning,Ontology, Intelligent Agent, Machine Learning etc. will be discussed in the paperKey Words: Knowledge Representation Probabilistic Reasoning Ontology Intelligent Agent Machine Learning1 概述由国际人工智能联合会(IJCAII)和美国人工智能学会(AAAI)主办的第17届国际人工智能联合会议(17th International Joint Conference on Artificial Intelligence)于2001年8月4至10日在美国华盛顿州西雅图召开。
这是两年一度的国际人工智能界最高学术会议,共有约1500人参加了此次会议。
中国大陆有三位学者参加,他们是中国科学院计算技术研究所的史忠植研究员,中国科学院软件技术研究所的程虎教授,以及南京大学计算机软件新技术国家重点实验室的周志华博士。
会议共收到796篇高水平的投稿,一共录取论文197篇,录用率约为24.7%。
录用文章分类如表1所示。
表1 IJCAI-01论文分布情况主题论文数Case-based reasoning 5Cognitive modeling 6Diagnosis 6Games 3Knowledge representation and reasoning 31Logic programming and theorem proving 10Machine learning and data mining 23Multi-agent systems 27Natural language processing and information retrieval 14Neural networks and genetic algorithms 8Planning 15Robotics and perception 14Search, Satisfiability, and constraint satisfaction problems 19Uncertainty and probabilistic reasoning 12Web applications 4总计197可以看出,知识表示和推理以及搜索和约束满足问题作为传统人工智能研究的核心部分,仍然占有相当大的比重。
另外,虽然ICML和KDD分流了很多机器学习和数据挖掘领域的优秀论文,但这两个领域在IJCAI-01录用的论文中仍有很大的比例,这充分说明这两个领域正处于蓬勃发展之中。
尤其值得注意的是,多agent系统的论文已经超过了机器学习与数据挖掘,占据第二位。
事实上,IJCAI-01录用的论文中,约有40%与这个领域有关。
这可能有两个原因。
一方面,如Manuela Veloso 在特邀报告中所指出的,近年来RoboCup的发展对多agent系统的研究有很大的促进作用。
另一方面,agent作为一种抽象概念,已经深入人心。
正如同面向对象的概念,虽然真正致力于研究面向对象机制的工作并不是很多,但很多领域的工作都涉及到这个概念。
实际上,agent的概念已经广泛出现在知识表示、推理、学习等领域。
可以预见,在未来的几年内,多agent系统仍然会是一个热门的话题。
在会上,英国爱丁堡大学Donald Michie教授因他在机器学习、机器人和基于知识的系统等领域的卓越成就,获得了IJCAI终身成就奖(IJCAI Award for Research Excellence),这是国际人工智能界的最高荣誉,成为继John McCarthy、Allen Newell、Marvin Minsky、Herbert Simon等人之后的第7位获奖者。
美国斯坦福大学Daphne Koller教授获得了IJCAI计算机与思维奖(IJCAI Computers and Thought Award),这一国际人工智能界35岁以下青年学者的最高奖项。
奥地利维也纳理工大学的Thomas Eiter和Thomas Lukasiewicz的论文“Complexity results for structure-based causality”最后获得最佳论文奖。
在会议技术程序(technical program)正式开始之前,举行了主题为“基于agent的系统”、“约束”、“知识表示与推理”、“机器学习与数据挖掘”、“本体论”、“规划与机器人”等的31个研讨会(workshop)。
此外还由一些国际著名学者主讲了20场讲座(tutorial)。
在技术程序开始的第一天,微软公司总裁比尔 盖茨做了一小时的题为“AI in the computing experience: Challenges and opportunities”的大会报告。
盖茨在报告中强调了人工智能技术在微软公司的目标——研制更聪明、更易于使用的软件——中的重要性。
在他报告时,微软雷德蒙研究院的研究人员简要介绍了他们在智能多模态用户界面、数据挖掘、智能浏览和检索等领域对人工智能技术的探索,并做了精彩的演示。
此外,2001年机器人世界杯足球赛RoboCup-01与IJCAI-01同时同地举行。
比赛分中型组、小型组、Sony四腿机器人组和仿真组。
清华大学参加了仿真组的比赛,在决赛中,清华大学代表队在加时赛以一粒金球战胜德国Karlsruhe Brainstormers队荣获冠军。
中国科技大学参加了Sony四腿机器人组和仿真组的比赛。
这是来自中国的代表队第一次参加Sony四腿机器人组的比赛,中国科技大学代表队在四分之一决赛中惜败给美国宾州大学代表队,最后获得第8名。
中国科技大学另一支参加仿真组比赛的代表队获得第6名。
2 知识表示知识表示这门技术,其现状可与当年web出现之前的超文本(hypertext)的情况相比,知识表示代表了一种很好的思路,目前已存在着一些有说服力的Demo,但知识表示这门技术,尚未改变我们的世界。
知识表示蕴藏着重要的应用前景,但要全面挖掘这门技术的潜力,它必须被链入到一个全球性的单一系统中。
传统的知识表示系统,是典型的集中式的,而且要求共同遵守一些公共概念(如“父母“,“交通工具“)完全一致的定义。
然而,集中式的控制机制具有抑制作用,随着系统规模的扩大,系统将变得难以管理。
更重要的是,为做到可靠地回答提问,这些系统通常对系统能够作答的问题作了仔细地限定。
若不作限制,则可靠性将受到影响。
任一足够复杂的系统,都存在它回答不了的问题,这个问题从一个侧面反映了Goldel数学定理。
为避开此问题,传统的知识表示系统一般都有它们各自狭义的,特有的用于信息推理的规则集合。
例如,在一家谱系统中,根据数据库中数据进行推理时,可能用到如下规则,“叔叔的妻子是阿姨”。
尽管数据能从一个系统转换到另一系统,但由于系统间的推理规则以通常以完全不同的形式存在,而致使一个系统的规则不能用于其他系统。
相反,语义网研究者们为了追求系统丰富的功能,允许一些系统回答不了的或似是而非问题存在,这是代价。
我们让推理语言具有一定的表达能力,以进行广泛地Web推理。
这一道理类似于传统的web:在web发展早期,有批评者指出,没有集中的数据库和树型结构,web永远不会成为一个组织良好的”信息图书馆”。
然而,事实上,系统强大的表达能力,使大量信息成为可得的,而且搜索引擎-------这一10年前被认为是很不现实的东西,如今已显著地给人们提供了大量信息材料完整的索引。
由此看来,语义网所面临的挑战是,能否提供一种既能表达数据又能表示推理规则的语言,并且该语言能让现有知识表示系统中的推理规则应用于系统外的web.将逻辑加入web中,意味着用规则进行推理,选择动作路线,最终回答与任务相关的提问。
数学和工程上的综合考虑复杂化了这一任务。
足够强大的逻辑能够描述对象的复杂属性,但它还是不能让agent成功地回答一些似是而非的问题。
所幸,大部分我们想要表达的信息类似于“十六个头的螺钉是一种机械螺钉”这一难度级别,它们可以比较容易地用现有的语言,加上一点额外的词汇表达出来。
XML(可扩展标记语言)和RDF(资源描述框架)是两种可用于开发语义网的重要技术。
利用XML 可以自己定义标记(tag),例如<zip code>,<alma mater>,对网页中文本段进行注释。
如果程序员知道这些标记的用意,那么就可以编写脚本(script)或程序来分析网页的内容。
简言之,XML使用户能将任意的结构添加到文档中,而无需说明结构的具体含义。
RDF通过一些包含对象,属性,值的三元组来表达意思。
这些三元组可以用XML标记表示。
在RDF中,文档用一系列属性(姐妹, 作者)以及相应的值来描述特定的事物(如人,网页等任何其他事物).事实证明,这是种描述大量数据的自然的方法. 主题和对象均由统一资源标识符URI来标识,URI 也被用于表示网页中的链接(统一资源定位符URL是最普通的URI)。
动词也可用URI标识,这样能让每个人都可以定义新的概念和新的动词以指向web的某个网页。