深度学习与传统计算机视觉到底是怎么样的关系
如今,深度学习在众多领域都有一席之地,尤其是在计算机视觉领域。
尽管许多人都为之深深着迷,然而,深网就相当于一个黑盒子,我们大多数人,甚至是该领域接受过培训的科学家,都不知道它们究竟是如何运作的。
某种程度上,深度学习最大的优势就是自动创建没有人会想到的特性能力。
大量有关深度学习的成功或失败事例给我们上了宝贵的一课,教会我们正确处理数据。
在这篇文章中,我们将深入剖析深度学习的潜力,深度学习与经典计算机视觉的关系,以及深度学习用于关键应用程序的潜在危险。
视觉问题的简单与复杂
首先,我们需要就视觉/计算机视觉问题提出一些看法。
原则上它可以这样理解,人们给定一幅由摄像机拍摄的图像,并允许计算机回答关于与该图像内容的相关问题。
问题的范围可以从“图像中是否存在三角形”,“图像中是否有人脸”等简单问题到更为复杂的问题,例如“图像中是否有狗在追逐猫”。
尽管这类的问题看起来很相似,对于人类来说甚至有点微不足道,但事实证明,这些问题所隐藏的复杂性存在巨大差异。
虽然回答诸如“图像中是否有红圈”或“图像中有多少亮点”之类的问题相对容易,但其他看似简单的问题如“图像中是否有一只猫”,则要复杂得多。
“简单”视觉问题和“复杂”视觉问题之间的区别难以界限。
这一点值得注意,因为对于人类这种高度视觉化的动物来说,上述所有问题都是不足以成为难题,即便是对孩子们来说,回答上述视觉问题也并不困难。
然而,处在变革时期的深度学习却无法回答这些问题。
传统计算机视觉V.S.深度学习
传统计算机视觉是广泛算法的集合,允许计算机从图像中提取信息(通常表示为像素值数组)。
目前,传统计算机视觉已有多种用途,例如对不同的对象进行去噪,增强和检测。
一些用途旨在寻找简单的几何原语,如边缘检测,形态分析,霍夫变换,斑点检测,角点。