人机交互中的计算机视觉技术
基于视觉的接口概念
计算机视觉是一门试图通过图像处理或视频处理而使计算机具备“ 看” 的能力的计算学科。
通过理解图像形成的几何和辐射线测定, 接受器(相机的属性和物理世界的属性, 就有可能 (至少在某些情况下从图像中推断出关于事物的有用信息, 例如一块织物的颜色、一圈染了色的痕迹的宽度、火星上一个移动机器人面前的障碍物的大小、监防系统中一张人脸的身份、海底植物的类型或者是 MRI 扫描图中的肿瘤位置。
计算机视觉研究的就是如何能健壮、有效地完成这类的任务。
最初计算机视觉被看作是人工智能的一个子方向, 现在已成为一个活跃的研究领域并长达 40年了。
基于视觉的接口任务
至今,计算机视觉技术应用到人机交互中已取得了显著的成功,并在其它领域中也显示其前景。
人脸检测和人脸识别获得了最多的关注, 也取得了最多的进展。
第一批用于人脸识别的计算机程序出现在 60年代末和 70年代初,但直到 90年代初,计算机运算才足够快,以支持这些实时任务。
人脸识别的问题产生了许多基于特征位置、人脸形状、人脸纹理以及它们间组合的计算模型, 包括主成分分析、线性判别式分析、 Gabor 小波网络和 .Active Appearance Model(AAM . 许多公司,例如Identix,Viisage Technology和 Cognitec System,正在为出入、安全和监防等应用开发和出售人脸识别技术。
这些系统已经被部署到公共场所, 例如机场、城市广场以及私人的出入受限的环境。
要想对人脸识别研究有一个全面的认识,见。
基于视觉的接口技术进展
尽管在一些个别应用中取得了成功,但纵使在几十年的研究之后,计算机视觉还没有在商业上被广泛使用。
几种趋势似乎表明了这种情形即将会发生改变。
硬件界的摩尔定律的发展, 相机技术的进步, 数码视频安装的快速增长以及软件工具的可获取性(例如 intel 的 OpenCV libraray使视觉系统能够变得小巧、灵
活和可支付。
近年来, 美国政府已经投资了一些人脸识别评估项目:最初为1993年到 1997年的人脸识别技术 (FERET 项目, 最近为 2000年到 2002年的人脸识别 vendor 测试(FRVT 。
这些项目提供了对用于研究和商业的人脸识别系统的性能评估。
FRVT 2002全面地测试了 10个商业系统,收集了一个非常大的数据集的性能统计:37437个人的 121589张人脸图像, 通过多维 (在室内或室外, 男性或女性, 年轻的或年长的表示其性能特征。
图 3显示了最佳系统对正面人脸图像的 5项分类的人脸检验结果。
结论
计算机视觉是一个非常困难的问题, 在经过几十年的研究及几个主要应用的推动后依然不能解决通用情形。
但是, 在过去的十几年里, 人们对于相机的回转使用以及用计算机视觉来“ 看人” 的兴趣提升,即检测和识别人脸,跟踪头部、脸部、手部和身体,分析脸部表情和身体动作,识别手势。
在构造实时、健壮的视觉技术上取得了重要的进展,部分是因为摩尔定律驱动的硬件性能的极大提高。
但是计算机视觉技术 HCI 依旧处于“ 石器时代” 。
然而, 大量的研究、技术和商业应用将帮助计算机视觉技术走到多模态人机交互的前端。