以下是computer vision:algorithm and application计算机视觉算法与应用这本书中附录里的关于计算机视觉的一些测试数据集和源码站点,我整理了下,加了点中文注解。
Computer Vision:Algorithms and ApplicationsRichard Szeliski在本书的最好附录中,我总结了一些对学生,教授和研究者有用的附加材料。
这本书的网址/Book包含了更新的数据集和软件,请同样访问他。
C.1 数据集一个关键就是用富有挑战和典型的数据集来测试你算法的可靠性。
当有背景或者他人的结果是可行的,这种测试可能甚至包含更多的信息(和质量更好)。
经过这些年,大量的数据集已经被提出来用于测试和评估计算机视觉算法。
许多这些数据集和软件被编入了计算机视觉的主页。
一些更新的网址,像CV online(/rbf/CV online), (/), and Computer Vision online (/ ), 有更多最新的数据集和软件。
下面,我列出了一些用的最多的数据集,我将它们让章节排列以便它们联系更紧密。
第二章:图像信息CUReT: Columbia-Utrecht 反射率和纹理数据库Reflectance and Texture Database, /CA VE/software/curet/(Dana, van Ginneken, Nayar et al. 1999).Middlebury Color Datasets:不同摄像机拍摄的图像,注册后用于研究不同的摄像机怎么改变色域和彩色registered color images taken by different cameras to study how they transform gamuts and colors, /color/data/Chakrabarti, Scharstein, and Zickler 2009).第三章:图像处理Middlebury test datasets for evaluating MRF minimization/inference algorithms评估隐马尔科夫随机场最小化和推断算法,/MRF/results/ (Szeliski, Zabih, Scharstein et al. 2008).第四章:特征检测和匹配Affine Covariant Features database(反射协变的特征数据集)for evaluating feature detector and descriptor matching quality and repeatability(评估特征检测和描述匹配的质量和定位精度), /~vgg/research/affine/(Miko-lajczyk and Schmid 2005; Mikolajczyk, Tuytelaars, Schmid et al. 2005).Database of matched image patches for learning (图像斑块匹配学习数据库)and feature descriptor evaluation(特征描述评估数据库),http://cvlab.epfl.ch/~brown/patchdata/patchdata.html(Winder and Brown 2007; Hua,Brown, and Winder 2007).第五章;分割Berkeley Segmentation Dataset(分割数据库)and Benchmark of 1000 images labeled by 30 humans,(30个人标记的1000副基准图像)along with an evaluation,/Research/Projects/CS/vision/grouping/segbench/(Martin, Fowlkes, Tal et al. 2001).Weizmann segmentation evaluation database of 100 grayscale images with ground truth segmentations,http://www.wisdom.weizmann.ac.il/~vision/Seg Evaluation DB/index.html(Alpert, Galun, Basri et al. 2007).第八章:稠密运动估计The Middlebury optic flow evaluation(光流评估)Web site,/flow/data/(Baker, Scharstein, Lewis et al. 2009).The Human-Assisted Motion Annotation database,(人类辅助运动数据库)/celiu/motionAnnotation/(Liu, Freeman, Adelson et al. 2008)第十章:计算机摄像学High Dynamic Range radiance(辐射)maps, /Research/HDR/(De-bevec and Malik 1997).Alpha matting evaluation Web site, / (Rhemann, Rother, Wanget al. 2009).第十一章:Stereo correspondence立体对应Middlebury Stereo Datasets and Evaluation, /stereo/(Scharstein and Szeliski 2002).Stereo Classification(立体分类)and Performance Evaluation(性能评估)of different aggregation(聚类)costs for stereo matching(立体匹配),http://www.vision.deis.unibo.it/spe/SPEHome.aspx(Tombari, Mat-toccia, Di Stefano et al. 2008).Middlebury Multi-View Stereo Datasets,/mview/data/(Seitz,Curless, Diebel et al. 2006).Multi-view and Oxford Colleges building reconstructions,/~vgg/data/data-mview.html .Multi-View Stereo Datasets, http://cvlab.epfl.ch/data/strechamvs/(Strecha, Fransens,and Van Gool 2006).Multi-View Evaluation, http://cvlab.epfl.ch/~strecha/multiview/ (Strecha, von Hansen,Van Gool et al. 2008).第十二章:3D重建HumanEva: synchronized video(同步视频)and motion capture (动作捕捉)dataset for evaluation of articulated human motion, /humaneva/Sigal, Balan, and Black 2010).第十三章:图像渲染The (New) Stanford Light Field Archive, /(Wilburn, Joshi,Vaish et al. 2005).Virtual Viewpoint Video: multi-viewpoint video with per-frame depth maps,/en-us/um/redmond/groups/ivm/vvv/(Zitnick, Kang, Uytten- daele et al. 2004).第十四章:识别查找一系列的视觉识别数据库,在表14.1–14.2.除了那些,这里还有:Buffy pose classes, /~vgg/data/buffy pose classes/ and Buffy stickmen V2.1, /~vgg/data/stickmen/index.html(Ferrari,Marin- Jimenez, and Zisserman 2009; Eichner and Ferrari 2009).H3D database of pose/joint annotated photographs of humans,/~lbourdev/h3d/(Bourdev and Malik 2009).Action Recognition Datasets, /projects/vision/action, has point-ers to several datasets for action and activity recognition, as well as some papers.(有一些关于人活动和运动的数据库和论文)The human action database athttp://www.nada.kth.se/cvap/actions/包含更多的行动序列。
C.2 软件资源一个对于计算机视觉算法最好的资源就是开源视觉图像库(opencv)(/wiki/),他有在intel的Gary Bradski和他的同事开发,现在由Willow Garage (Bradsky and Kaehler 2008)维护和扩展。
一部分可利用的函数在/documentation/cpp/中:图像处理和变换(滤波,形态学,金字塔);图像几何学的变换(旋转,改变大小);混合图像变换(傅里叶变换,距离变换);直方图;分割(分水岭, mean shift);特征检测(Canny, Harris, Hough, MSER, SURF);运动分析和物体分析(Lucas–Kanade, mean shift);相机矫正和3D重建机器学习(k nearest neighbors, 支持向量机, 决策树, boost-ing, 随机树, expectation-maximization, 和神经网络).Intel的Performance Primitives (IPP) library, /en-us/intel-ipp/,包含各种各样的图像处理任务的最佳优化代码,许多opencv中的例子利用了这个库,加入他安装了,程序运行得更快。