主持人:接下来有请华为诺亚方舟实验室主任李航上台演讲。
李航:大家上午好!非常高兴今天有机会跟大家一起交流。
首先感谢新智元以及大会组委会提供这样的机会。
今天跟大家分享一下我对人工智能未来发展的一些想法。
现在人工智能很热,大家有很多期待、也有一些不安;有一些正确的认识也有一些误解;有一些合理的宣传,也有一些误导。
对我们做AI的,用AI 的,一个很重要的问题,就是我们应该期待什么?在可预见的未来,在更遥远的未来,我们对AI应该抱着什么样的期待,进行什么样的努力。
我的报告分两部分,第一部分关于我们对人工智能AI应该有什么样的期待,我将从三个角度来谈这个问题。
第二部分介绍一下诺亚方舟实验室在人工智能及通信领域做的一些工作。
大家知道人工智能分强人工智能和弱人工智能。
首先看一下人的大脑和计算机到底有什么相同的地方,什么不同的地方。
这个资料是从MOOC得到的。
我们可以看到,现在的计算机和人的大脑在规模上已经相当了,人的大脑有10的11次方个神经元,10的15次方个突触,大概一千亿个神经元,一千万亿个连接。
一个典型的计算机有10的10次方个晶体管和稀疏连接。
人脑和计算机达到同等的规模,但是在架构上是非常不同的,人脑拥有紧密联系,计算机是稀疏连接的。
处理的速度上,计算机有很大的优势,基本上计算机的计算速度是人脑的处理速度的100万倍。
但是人脑进行的是并行处理,计算机进行的是顺序处理,这方面有很大的不同。
人脑能够做并行处理,在处理某些问题上效率比计算机更高。
从能力的角度来看,计算机往往擅长能够用数学模型很好刻画的任务。
但是计算机不擅长做什么事?我们不知道怎么样用数学去刻画的任务,这个恰恰是我们人脑擅长做的事情,我们人脑平时做的感知、认知的处理很多都是很难用数学模型,至少现在很难用数学模型去刻画的。
我的第一个观点,强人工智能是否能够实现还是不太清楚的,强人工智能希望计算机能够跟人做同等以上智能性的事情。
至少从几个方面来看,从情感、创造力和自由意志这几个角度来看,强人工智能是非常困难的。
这些都是人的智能的一些非常重要的特点,但是我们不清楚这些重要的人的智能特点是否能在现代的计算机上去实现。
情感,喜怒哀乐是人最基本的情感。
现代科学知道,这个情感基本是在人的大脑边缘系统产生,也就是说在人的下意识产生情感。
比如我们最典型的代表的情感,恐惧。
当你处在一个非常危险的状况的时候,你会瞬间感触到危险,这时候大脑边缘系统杏仁核产生大量的化学物质,你的心跳会加快,血压上升,能够促使你全身采用必要的行动,之后这些信息传到大脑,你意识到发生了什么。
下意识的情感在很快的时间里就做出了这样的反应。
这样的情感在智能体的智能活动里面其实起着非常重要的作用。
大家会说,如果一个人没有情感的话,他是不是做事情变得非常理智,它的判断是不是都是理性的?结论不是这样的。
有一些病人非常不幸大脑因为受伤,情感部分的功能丧失,后来观察这些人时发现,离开了情感,他们很难做出理性的判断。
创造力。
人很重要的特点是拥有创造力。
创造力的主要特点是把看似不相关联的东西关联在一起。
认知学者,比如George Lakoff做了很多研究。
人的创造力可以从语言中发现出来,人在语言中使用的比喻就是创造力的体现,比如我们说在微信里面潜水就是一个比喻,就是一个暗喻,这个比喻实际把两个看似不相
关联的东西,一个是潜水,一个是在微信里面沉默不语联系起来。
有人第一次发明这个说法,很多人第一次听到这个说法,都会做思考把这两个不相关的概念联系到一起。
在现代的计算机上实现这种联想应该是非常困难的。
另外一个重要的人的特点,是我们拥有自由意志。
明斯基在《心智社会》一书里提出了人脑是有许多智能体构成的心智社会的想法。
我们人的下意识可以认为是很多智能性的系统组成的社会,它们综合起来的作用才能够构成我们的下意识。
最新的研究发现,人在做判断的时候,下意识有时候超前于上意识提前做出判断,比如你说我把手举起来,有大量的实验结果显示,这个判断基本在500毫秒之前下意识其实已经做出了。
你看到我这个瞬间把手举起来,其实500毫秒之前下意识已经做出了决定,这好像一个组织里面表面上决策是领导做的,其实在那之前部下已经做出决定,领导受到影响最后做出判断。
大脑整个结构好像是这样的一个情况,那么大家可以自然想到用现代的计算机去实现这样的功能其实是很难的。
弱人工智能,是希望人工智能帮我们做很多智能性的事。
刚才前面报告的几位老师介绍了很多当前人工智能的最新技术,这些都可以认为是围绕着弱人工智能的一些技术。
现在弱人工智能主要的特点是什么?主要依赖机器学习。
假设有一个比较智能性的系统,可以是软件也可以是机器人,那么它要是从环境里面得到一些输入,做一些判断,最后做一些操作的话,基本上要进行感知认知的操作,对应人的识别、推理、理解、决策。
现在主要的人工智能技术是机器学习,机器学习最常用的是监督学习,这里面典型的方法是分类、回归,这些方法可以基于数据,帮助智能系统做各种各样的判断,比如识别一个照片里面是不是有人脸,也可以判断在下围棋的时候该走哪一步,这些判断其实都可以用机器学习来实现,
只要有大量的数据、就可以构建模型,做出各种判断,可以对应识别也可以对应推理、理解、决策。
机器学习是人工智能的核心技术。
现在的机器学习技术结合推理,会使弱人工智能系统做得更好,推理和机器学习的结合是未来人工智能发展的大方向,或者说符号处理和神经处理技术的结合,是未来人工智能发展的大方向。
机器学习主要是依赖于监督学习,这里面有什么优势和局限性?优势只有一个,大家在自动驾驶,在AlphaGO里面已经看到,就是在特定场景下通过机器学习得到的模型做出的判断,可以逼近甚至超过人。
在AlphaGO这样的系统里面,有两个模型,能够循环被使用。
在不同的棋局里,循环使用这两个模型,帮助AlphaGO系统做出正确判断。
这样一个简单的组成就能够完成非常智能性的或者看上去非常智能性的任务。
机器学习也有几个局限。
第一个局限是机器学习严重依赖于数据,我们训练数据提供的不充分,就可能会误导这个系统。
刚才Thomas Dietterich教授也介绍到这样的例子,比如人脸检测的工作,如果给出的训练数据不充分,系统很难在所有情况下检测出照片中的人脸。
人躲在墙后面或者人把脸捂上的时候,系统就检测不出人脸。
要让系统做得非常好的话,实际上要给这个系统提供大量的不同情况下的数据,数据驱动是机器学习的重要特点,换句话说也是它的局限性。
构建机器学习系统的时候,一定要事先想好这个模型的类型是什么。
比如要做分类,把红的点和绿的点分开,正例负例分开,我们可以考虑用一个线性模型,就是用直线把红点绿点分开,也可以考虑用一个非线性模型,就是用曲线把红点绿点分开。
这个决定就左右了我们设计的机器学习系统到底能不能很好完成这个任务。
如果让系统选择最好的直线把正例和负例分开,结果一定非常不好,因为。