当前位置:
文档之家› 张钹院士:基于大数据的人工智能
张钹院士:基于大数据的人工智能
比如在图像识别(微软)和语音识别()领 域机器都超过了或略低于人类深度学习成功的三大法宝 数据 计算资源 算法
AlphaGo用了两个多星期的时间,学了7千万局 棋局。最好的棋手一生中所下的棋局是百万级, 而AlphaGo下过的棋局是几十亿级的。 除了数据和计算资源之外,AlphaGo能够在两三 周里学到几千万个棋局,靠的是学习算法,它自 己能自己下棋,靠的是强化学习算法,
和国际先进水平相比,中国的人工智能处于什么位置?
看起来
这几年,中国在学术研究方面取得很多进展,在重要 的国际会议、重要的期刊杂志上,中国论文也占了相 当的比重。中国有数量庞大的网民,在网络数据上占 有相当优势的地位,中国市场需求巨大
实际上
在基础、算法的研究上,中国和世界顶尖水平还相差 甚远。人工智自1956年诞生至今,一直是美国在引领 人工智能领域的发展。 美国和加拿大等国的科学家还在不断的创新,如果我 们不重视基础/算法理论研究,要赶上或超过世界的先 进水平是有困难的。
基于大数据的人工智能
---张钹院士| 首届世界智能大会 2017
张钹 1935年3月26日出生于福建福清,计算机科学与技术专
家,俄罗斯自然科学院外籍院士、中国科学院院士,清华 大学教授、博士生导师。现任清华大学人工智能研究院院 长。 主要从事人工智能理论、人工神经网络、遗传算法、分 形和小波等理论研究;以及把上述理论应用于模式识别、 知识工程、智能机器人与智能控制等领域的应用技术研究
• 鲁棒性差
今后的方向----人机合作
• 人机合作的关键
– 机器如何理解人。
• 自然语言理解:机器可以听懂人类用自然语言发的 命令
– 人如何理解机器
• 深度学习导致的机器的不可理解性:深度学习建立 的系统,实际上跟人的思路很不一样。 • 为什么机器的思路跟人不一样:因为机器要用专业 的语言处理任务。 • 比如机器怎么识别猫:它只是从一些局部的特征, 局部的纹理来识别,而不是从猫的整体。机器要取 得整体的特性是非常困难的,所以它都是在利用局 部特性,在一个特征空间里去认识猫,和人认识猫 的角度完全不同,
满足四个条件机器才能超过人类
• • • •
人工智能在解决以下类型问题时,不管问 题多么复杂,都可能做到甚至超过人类的 水平。 (1)有充足的数据(或知识) (2)完全信息 (3)确定性 (4)单领域。 只要符合这四个条件,并且依靠深度学习 的三大法宝基本都可以达到或者超过人类 的水平。
下一步怎么办 • Google《一个模型可以学所有的任务》:在一个 网络里,一个模型里同时学习了八项任务,包括 机器翻译,图像识别,图像解释等。并得出结论: 这些任务之间不仅不会互相干扰,在一定程度上 还略微有帮助。 • 目前北美还在引领这些发展,如果中国只低头用 深度学习去解决应用问题,要达到引领是不可能 的。 • 人工智能现在做不到举一反三,人工智能现在学 习的是举一百反一。我们要解决小样本甚至零样 本学习的问题
深度学习并非万能 • 需要大量的样本。有些问题很难获取很多样本 • 推广能力差。不能举一反三 • 不可理解性。深度学习建立的系统,实际上跟人的思路
很不一样
为什么机器学习的效率这么低
• 不理解性
– 要让计算机认识一只猫,就要用各式各样的样本在不 同背景下的猫去训练它,而且只有跟它相近的背景、 相近的角度拍下的猫它才认识,如果背景变了,猫拍 摄的角度变了它也不认识了,所以这是它的一个根本 性的问题,它不理解。
基于大数据的深度学习 深度学习的提出,在人工智能领域中是一个重大 突破。
以往,人工智能只能用来解决人们对它非常了解,而 且能够清楚的将它表达出来的问题,深度学习拓展了 人工智能所能解决问题的边界。
深度学习具有一定的通用性
深度学习是一种大众化的工具,它大大延展了每个人 解决问题的领域,只要拥有这个领域充分的数据就能 够做研究。
如何利用深度学习
深度学习时代依靠的是数据,计算机在向量空间 处理数据。缺点是做出来的东西是不可理解的, 跟人的做法完全不同。 • 研究方向
– 寻找中间量,即“语意的向量空间”
• 两大任务
– 如何把文本符号的东西变成向量 – 如何将数据向量空间提升到语意中
总结 • 深度学习不是我们的突破,深度学习只是 展示了突破的希望,因为深度学习并没有 构造真正的智能。 • 重点是如何突破将来人工智能要解决的基 础和关键性问题,而不仅只是低头跟随性 的应用深度学习。 • 只有从这点上着手,我们才有可能实现在 人工智能领域追赶、超过甚至引领的目标。