当前位置:文档之家› 人工智能第三次浪潮以及若干认知

人工智能第三次浪潮以及若干认知

人工智能第三次浪潮以及若干认知(来源:科学杂志,2017-06-02)长期以来,智能一直用来表示大脑思维的能力。

智能究竟是什么?这个问题至今没有公认的答案,不断有人试图从本质上给出一个简短而精确的定义。

其实,早在60年前,就有一个接受度较高的提法——智能的本质是大脑的信息处理或计算能力。

这比思维能力具体了一些,有信息理论和人造的计算机做参照,但仍太笼统,除了思辨没有多大用途。

追求智能的简要精确定义可能是个迷思,因为大脑是一个非常复杂的系统,智能是该系统多种属性、功能和外在表现的综合。

大脑智能的外在描述和内在探索对大脑智能的了解,可以通过对大脑智能外在描述的观察,及对其内在的进一步探索。

大脑智能的外在描述可以从广义和狭义两个角度来讨论。

广义上,所有需要经过大脑的信息处理或计算都可以视作智能活动,主要包括心智方面的感知、注意、识别、反应、情绪、推理、理解、觉悟、发现、动机、意图、规划、搜索、评估、决策,以及更为一般的控制和通信活动等。

狭义上,常用“智、慧、聪、能”等字描述大脑智能,多指人类大脑独有的、而非人类大脑所不具有的能力。

随着时代发展,人们开始发现,过去被认为是“智、慧、聪、能”的能力,人造计算机以及某些动物的大脑也具备。

换言之,这种狭义的智能概念是随着人们认识的扩展而不断发展的。

大脑智能的内在探索至少应该包含信息处理和神经科学两个方面。

信息处理方面,率先探索的是大脑的最基本元件。

回顾历史,对这方面存在一系列疑问,比如大脑系统究竟存在几个基本单元?每个单元担任什么样角色?这些基本元件将形成几种不同的基本通路并发挥什么作用?这些通路以怎样的结构形成不同功能的模块,并如何构成系统?更进一步,还想了解在这个系统里信息是如何流动的,有几种机制协调管理这些流动实现各种智能活动等。

与由电阻、电容、电感、互补金属氧化物半导体(complementary metal oxide semiconductor,CMOS)等基本元件构成的电路系统相类似,脑信息系统也应该不止有一种元件。

从1943年麦卡洛克(W. S. McCulloch)和皮茨(W. Pitts)提出的神经元模型,1959年罗森布拉特(F. Rosenblatt)的感知机,1985年美国加州大学圣迭戈分校的并行分布处理(parallel distributel processing, PDP)团队的多层神经网络,到2006年多伦多大学欣顿(G. Hinton)团队展示深度学习用的受限玻尔兹曼机,他们考虑的都是一种元件,数学上用逻辑斯谛(Logistic)线性模型来近似其多输入单输出的关系。

另外,从1960年代初维塞尔(T. Wiesel)和休伯尔(D. H. Hubel)的特征检测理论,到现今深度学习中广为使用的卷积神经网络,采用的是称为S 元(simple cell,简单细胞)和C元(complex cell,复杂细胞)的两种基本单元。

神经科学方面,也有许多问题引起众人关注。

例如神经元主要由哪些关键性物质构成?哪些物质调制神经元功能(神经科学称其为调质)?哪些物质作为信息流载体(神经科学称其为递质)?近年来,已被发现的递质和调质有近百种,有待鉴定的可能性更多,可分为胆碱类、单胺类、氨基酸和神经肽。

随着时间的推移,还会发现更多种这样的物质。

然而智能的内在探索在上述两个方面的发展存在很大的不平衡,投入的力量相差悬殊。

尽管在关于神经元的结构和物质组成上,已有不少研究发现,但这些成果对弄清智能行为少有帮助。

笔者认为应该将两方面的进展联系起来,并思考哪些生化物质对应哪种基本单元,哪些物质支撑信息流动,哪些物质可能影响神经元的生存和能耗,但并不直接起信息处理作用,找到这些问题的答案或许能加深对智能的理解。

近二三十年脑科学的研究进展与人工智能第三次浪潮关系不大,不过,1960年代的特征检测理论和1980年代的多层神经网络对第三次浪潮颇有影响。

智能研究历史回溯冯·诺依曼结构的计算机诞生后,人们产生了种种期待,觉得计算机像人一样有智能,机器替代人完成各种工作的时代来临了。

著名的图灵测试让机器模拟人类智能行为,以此来判别机器是否拥有人工智能。

当时的研究兵分两路,一路是人按照特别设计的语言编程,机器通过乔姆斯基(N. Chomsky)形式语法系统和相应的树搜索技术读懂并完成可编程求解的问题或活动;另一路针对那些难以编程的问题,主要是语言理解、机器视觉、知识表示、推理规划等。

智能研究的多个分支纷纷出现,并在1950年代掀起第一次研究浪潮。

巴洛(H. B. Barlow)、莱特温(J. Y. Lettvin)、维塞尔和休伯尔关于特征检测器及其理论的研究,开创了计算神经科学。

基于麦卡洛克和皮茨神经元模型的罗森布拉特的感知机,既是人工神经网络研究的起始标志,也与统计决策理论、霍夫变换(Hough transform)一起成为模式识别和机器视觉的源头。

乔姆斯基形式语法系统影响巨大,不仅是计算机程序编译和符号人工智能的源头,而且还推动心理学派生出计算心理学,令物理符号主义取代了起源于20世纪初的行为主义。

在其后一二十年里,这些分支分别自立门户。

符号人工智能的发展规模最大,形成了知识表示、规则推理、启发搜索的基本体系。

但是符号人工智能的知识和规则的获取需要通过人工,然后才是机器进行演绎,整个流程其实是编程求解的“同宗兄弟”,因而有类似的局限。

这一期间,人工神经网络的研究则受到符号人工智能中某些大师的错误排挤,发展停滞。

经历了那一段艰苦时期,曙光终于出现。

1980年代中期,计算心理学逐步发展为认知科学,在加州大学圣迭戈分校PDP团队的倡导下,建立在人工神经网络模拟大脑神经元及其联结基础上的联结主义活跃起来,其部分主要旗手转而扛起人工神经网络的旗帜,推动神经网络学习在其后十余年间掀起高潮。

同时,停滞了20余年的行为主义在萨顿(R. Sutton)等人的推动下,以强化学习(reinforcement learning)为主题,再现活力。

另外,模式识别和机器视觉研究也开始沿着多条线发展。

一时间,人工智能研究蓬勃发展,春色满园。

这一时期可以认为是智能研究的第二次浪潮。

我国相应地进行了各种跟踪研究,迎来了第一次浪潮[1]。

1990年代中末期开始,人工神经网络的一些主要研究力量转向推动人工智能发展。

先以贝叶斯网络推理为主流,后又将神经网络学习研究进一步推广为研究各种机器学习方法,智能研究的第三波浪潮掀起。

此次浪潮带动模式识别与机器视觉方向的研究再度趋热。

而集成电路、无线通信、互联网、信息采集、传感控制、物联网等多种技术的积累,尤其海量数据和超级计算能力的提升,为辛顿团队在2006年重新审视深度神经网络创造了条件,他们很快在认识上有了新突破,由此推动人工神经网络急速升温,促进了神经科学、认知科学的繁荣和相互融入。

经过60年,智能研究相关各分支再度大整合。

AlphaGo 系统进一步成功整合深度学习和强化学习,并让人们再次关注到一甲子以前曾风靡了一甲子的行为主义。

第三次浪潮与前两次浪潮最为不同的是IBM、谷歌等科技巨头的加入,它们以雄厚资源和大兵团作战能力,雄踞龙头,通过推出沃森(Watson)系统、AlphaGo系统等智能产品,持续推高第三次浪潮。

这意味着针对超级复杂大系统的智能研究已从学者们个人的沙盘推演转变为大规模团体作战,这个转变是必然的。

对于我国人工智能的发展境遇,笔者有三点管见[2]:首先,研究的龙头应是大科技公司或综合体系,而非高校或事业单位的研究院所。

龙头企业的兴起才是评判国家人工智能发展水平的重要因素。

第二,国家规划有助于扶持这类综合体系的产生,但关键是领导整合能力。

第三,事业型研究单位和小的高科技公司应专注薄弱及重要环节的新方法、新技术,这样会有效加快我国人工智能前进的步伐。

有关智能研究若干提法之梳理智能研究各分支的这番大整合,产生了不少新术语,并出现了若干可能会引起误解的新提法。

为避免混淆,需要对它们进行系统梳理。

类脑计算(brain-inspired computing)最早在美国流行,是指受大脑神经元结构和机制启发而研制的计算芯片,以及由这种计算芯片组建的计算系统。

类脑计算主要包括神经形态芯片和脉冲神经元芯片,它的功耗远低于CMOS芯片。

2017年年初,《自然材料》(Nature Materials)报道了一种更接近大脑神经元机制的新型忆阻器芯片,或许由它组建的计算系统会更接近人类大脑智能。

类脑智能(brain-like intelligence)在20多年前就经常出现在亚太神经网络学会的会议上。

日本理化学研究所(RIKEN)前脑科学研究院院长甘利俊一(S. Amari)教授在建议用信息几何理论对脑的学习建模时,也常使用这个词。

其实,它与大脑内在没有直接关系,只是人工智能的同义词。

它还有另外一层意思,指模拟智能的系统至少有一些与大脑内在类似的东西(brain-like system)[3]。

现今该词的用法多为后者,卷积神经网络和深度学习嵌入了维塞尔和休伯尔特征检测结构,也算一例。

由此可见,可以认为类脑计算是类脑智能研究的一部分。

但是,从神经科学得到的关于大脑内在的已有知识甚少,制约了类脑智能研究的发展,算得上是类脑智能的事例至今不多。

增强智能(augmented intelligence)又称脑机智能或脑机合一,源于拓展大脑对外信息输出的通道(语言、动作、表情、文字等)。

先由机器如可穿戴设备直接获取大脑的信息(目前主要是脑电信号),接着对其进行不同程度的处理。

增强智能可以用于控制各种伺服机构,如假肢、轮椅、各种装置、人造器官等,也可以实现机器的高水平智能活动,形成人脑—机器接续合一,甚至完成机器的信息输出,通过人的自然感官或人工通道(如附加电极)反馈,从而影响大脑的智能。

增强智能不同于模拟大脑能力的人工智能,也非耸动视听的“对抗人工智能”,而是指“大脑智能+新的信息通道+人工智能”以增强或延拓大脑的智能。

群体智能(crowd intelligence)又称群智计算,是指大量个体通过交流合作实现超越个体的智能。

这个名词源于30多年前对蚁群、蜂群等行为的研究,该研究主要是观察没有中心控制的分布式初级个体如何发生自组织。

如今,群体智能关注的是高级智能个体,严格地说,大脑智能就是人类群体智能在每一个体大脑上的不同体现,现实中很难看到一个孤立大脑的智能。

人类智能实质就是以大量个体大脑通过通信交流和储存积累两个基本要素,再由第三个要素——某些核心人物或团体进一步归纳提炼,逐步形成的;反之,它又会影响、教育、提升每一个体的大脑智能。

当今超级互联网和强大的服务器大大提升了前两个要素,而第三个要素也有人工智能、类脑智能和增强智能为帮手,人类智能的后续发展非常令人期待。

相关主题