当前位置：文档之家› 张钹院士：基于大数据的人工智能

张钹院士：基于大数据的人工智能

比如在图像识别（微软）和语音识别（）领域机器都超过了或略低于人类深度学习成功的三大法宝数据计算资源算法
AlphaGo用了两个多星期的时间，学了7千万局棋局。最好的棋手一生中所下的棋局是百万级，而AlphaGo下过的棋局是几十亿级的。除了数据和计算资源之外，AlphaGo能够在两三周里学到几千万个棋局，靠的是学习算法，它自己能自己下棋，靠的是强化学习算法，
和国际先进水平相比，中国的人工智能处于什么位置?
看起来
这几年，中国在学术研究方面取得很多进展，在重要的国际会议、重要的期刊杂志上，中国论文也占了相当的比重。中国有数量庞大的网民，在网络数据上占有相当优势的地位，中国市场需求巨大
实际上
在基础、算法的研究上，中国和世界顶尖水平还相差甚远。人工智自1956年诞生至今，一直是美国在引领人工智能领域的发展。美国和加拿大等国的科学家还在不断的创新，如果我们不重视基础/算法理论研究，要赶上或超过世界的先进水平是有困难的。
基于大数据的人工智能
---张钹院士| 首届世界智能大会 2017
张钹 1935年3月26日出生于福建福清，计算机科学与技术专
家，俄罗斯自然科学院外籍院士、中国科学院院士，清华大学教授、博士生导师。现任清华大学人工智能研究院院长。主要从事人工智能理论、人工神经网络、遗传算法、分形和小波等理论研究；以及把上述理论应用于模式识别、知识工程、智能机器人与智能控制等领域的应用技术研究
• 鲁棒性差
今后的方向----人机合作
• 人机合作的关键
– 机器如何理解人。
• 自然语言理解：机器可以听懂人类用自然语言发的命令
– 人如何理解机器
• 深度学习导致的机器的不可理解性：深度学习建立的系统，实际上跟人的思路很不一样。 • 为什么机器的思路跟人不一样：因为机器要用专业的语言处理任务。 • 比如机器怎么识别猫：它只是从一些局部的特征，局部的纹理来识别，而不是从猫的整体。机器要取得整体的特性是非常困难的，所以它都是在利用局部特性，在一个特征空间里去认识猫，和人认识猫的角度完全不同，
满足四个条件机器才能超过人类

• • • •
人工智能在解决以下类型问题时，不管问题多么复杂，都可能做到甚至超过人类的水平。（1）有充足的数据（或知识）（2）完全信息（3）确定性（4）单领域。只要符合这四个条件，并且依靠深度学习的三大法宝基本都可以达到或者超过人类的水平。
下一步怎么办 • Google《一个模型可以学所有的任务》：在一个网络里，一个模型里同时学习了八项任务，包括机器翻译，图像识别，图像解释等。并得出结论：这些任务之间不仅不会互相干扰，在一定程度上还略微有帮助。 • 目前北美还在引领这些发展，如果中国只低头用深度学习去解决应用问题，要达到引领是不可能的。 • 人工智能现在做不到举一反三，人工智能现在学习的是举一百反一。我们要解决小样本甚至零样本学习的问题
深度学习并非万能 • 需要大量的样本。有些问题很难获取很多样本 • 推广能力差。不能举一反三 • 不可理解性。深度学习建立的系统，实际上跟人的思路
很不一样
为什么机器学习的效率这么低
• 不理解性
– 要让计算机认识一只猫，就要用各式各样的样本在不同背景下的猫去训练它，而且只有跟它相近的背景、相近的角度拍下的猫它才认识，如果背景变了，猫拍摄的角度变了它也不认识了，所以这是它的一个根本性的问题，它不理解。
基于大数据的深度学习深度学习的提出，在人工智能领域中是一个重大突破。
以往，人工智能只能用来解决人们对它非常了解，而且能够清楚的将它表达出来的问题，深度学习拓展了人工智能所能解决问题的边界。
深度学习具有一定的通用性
深度学习是一种大众化的工具，它大大延展了每个人解决问题的领域，只要拥有这个领域充分的数据就能够做研究。
如何利用深度学习
深度学习时代依靠的是数据，计算机在向量空间处理数据。缺点是做出来的东西是不可理解的，跟人的做法完全不同。 • 研究方向
– 寻找中间量，即“语意的向量空间”
• 两大任务
– 如何把文本符号的东西变成向量 – 如何将数据向量空间提升到语意中
总结 • 深度学习不是我们的突破，深度学习只是展示了突破的希望，因为深度学习并没有构造真正的智能。 • 重点是如何突破将来人工智能要解决的基础和关键性问题，而不仅只是低头跟随性的应用深度学习。 • 只有从这点上着手，我们才有可能实现在人工智能领域追赶、超过甚至引领的目标。

e商务文档

张钹院士：基于大数据的人工智能

相关文档推荐：