当前位置:文档之家› JDL标准人脸数据库协议

JDL标准人脸数据库协议

JDL标准人脸数据库协议介绍:本数据库主要用于对开发的人脸识别算法进行标准测试和评估,对现有的人脸识别技术进行全面综合的评价,以推动国内对自动人脸识别技术的研究和开发。

该库的建立由面像识别联合实验室和银晨公司合作完成,面像识别联合实验室提供详细的建库协议和技术指导,银晨公司负责提供设备和组织人员完成后续的人脸图像摄入和相关文档的建立等工作。

本数据库大体上可分为两部分,一部分人脸图像将公开发布,以供相关科研机构和企业对系统进行标准训练和测试;另一部分人脸图像则不公开发布以作为人脸识别(或确认)算法的标准测试所用。

进行测试时则可以将其按照不同的实验目的进行子库的划分。

一.数据库中图像文件的命名规则该数据库中图像文件的命名方法为:xx_xxxxxx_Ixxx_Pxx_Ex_Ax_Dx_Tx_Bx_Mx_Rx_Sx.ext1 2 3 4 5 6 7 8 9 10 11 12 13(1)性别与年龄(两位),第一位表示性别:男性用M表示,女性用F表示;第二位表示年龄,用L、Y、M、O分别表示少年、青年、中年、老年。

(2)识别号(六位),表示第几个人,用数字表示,不足部分前面补零。

JDL采集的人脸数据标号从000001开始,YCNC采集的人脸数据标号从100000开始。

(3)光照(四位),I为光照标记,第二位表示各种光源(分为环境光E、荧光灯F、白炽灯L),第三位表示光源位置(上U、中M、下D)、第四位表示光源方向(0、1、2、3、4、5)分别表示(0度、45度、90度、135度、180度、270度)。

(4)姿态(三位),P为姿态标记,第二位表示各种不同姿态(仰视U、平视M、俯视D),第三位表示不同方向(0、1、2、3、4、5、6、7、8)。

(5)表情(二位),E为表情标记,第二位表示各种不同表情,可分6种情况,中性N、笑L、皱眉F、惊讶S、闭眼C、张嘴O。

(6)饰物(两位),A为饰物标记,后一位表示是否有脸部饰物如眼镜、帽子等。

0表示无饰物,有饰物时1、2、3表示三种眼镜饰物,4、5、6表示三种帽子饰物。

(7)距离(两位),D为距离标记,后一位表示人物与摄像头之间的各种距离,分为3种情况并分别用0、1、2表示,具体定义参见参数定义。

(8)时间(两位),T为时间标记,后一位表示不同时期摄取的同一人的图像,分为五种情况:现在、三个月以后、六个月以后、九个月以后和一年以后,这四种情况分别用0、1、2、3、4来表示。

(9)背景(两位),B为背景标记,后一位表示背景变化,分5种情况(蓝色B、白色W、红色R、黑色D、黄色Y)。

(10)修改(两位),M为修改标志,后一位表示该图像是否已做数字化修改,0表示未修改,1表示已修改。

(11)公开情况(两位),R表示公开标记,后一位表示该图像是否可以对外界公开,0表示不可以公开,1表示可以公开。

(12) 图片大小(两位),S 表示图片大小标记,后一位表示该图片大小,0表示图片大小为640*480,1表示图片大小为320*240。

(13) 扩展名(三位),表示存贮该图像的类型,推荐使用bmp 格式存贮。

注:采集过程中,文件名根据实际情况稍有调整,文件名指代的图片情况前后并不完全一致,具体调整情况参见人脸库使用说明书。

二. 人脸数据库中相关参数的定义<1> 姿态:共11个, 姿态角用),(θϕ表示,其中ϕ表示方位角,规定以被摄者脸往左转(从上往下看为逆时针方向)为正,反之则为负;θ表示俯仰角,规定以被摄者脸往上扬为正,反之则为负。

(1) uqr ——上左四分之一侧面 (22.5, 30)(2) umf ——上正面 (0, 30)(3) uqr ——上右四分之一侧面 (-22.5, 30)(4) mpl ——正常左侧面 (90, 0)(5) mql ——正常左四分之一侧面 (22.5, 0)(6) mmf ——正常正面 (0, 0)(7) mqr ——正常右四分之一侧面 (-22.5, 0)(8) mpr ——正常右侧面 (-90, 0)(9) dql ——下左四分之一侧面 (22.5, -30)(10) dmf ——下正面 (22.5, -30)(11) dqr ——下右四分之一侧面 (-22.5, -30)<2>光照:分为17种光源位置,具体见下图:其中:不可见半球上的光源点可见半球上的光源点采集用户位置可见半球上的摄像机位置在上述采集环境下采集21幅光照变化图像:(1)环境光,要求各个方向均匀映照,光亮度低,欠曝光(1,5,6);(2)环境光,要求各个方向均匀映照,光亮度中;(1,5,6,7,12)(3)环境光,要求各个方向均匀映照,光亮度高,过曝光;(1,5,6,7,8, 10, 12, 13, 15)(4)环境光,要求各个方向均匀映照,强背光(强17号点光源);(5)环境光,要求各个方向均匀映照,弱背光(弱17号点光源);(6)除背后光源以外的1号点光源单独照射(其他全暗)(7)除背后光源以外的2号点光源单独照射(其他全暗)(8)…(9)(21) 除背后光源以外的16号点光源单独照射(其他全暗)<3>尺寸:本数据库的人脸图像大小定义为:640x480或320x240。

<4>两眼距离:基本保持在40~60像素之间(摄像机镜头与人物间的距离为标准距离时)。

<5>距离:定义为摄像机镜头与人物间的距离。

本数据库根据5种距离进行摄取。

标准距离定义为摄取的图像为规定的大小而人脸的两眼之间的距离为规定的距离时摄像机镜头与人物间的距离;其它几种距离为在标准距离的基础上分别增加和减少1/3、2/3。

标准距离用2表示,减少1/3的距离用1表示,增加1/3的距离用3表示,增加2/3的距离用4表示, 增加一倍距离用5表示。

<6>人脸图像内容:主要有人物的头部、脖子、有时包括肩膀的上部。

<7>饰物:所谓饰物即为待摄入的人物所带眼镜和帽子和假发等物。

<8>库的大小:本数据库中共为10000个人预留了唯一的识别号,可以考虑逐步建立,但人数至少应规划在1000人以上,这样有利于以后各种训练和测试子库的建立。

三.建库时的注意事项为了保持数据库的通用和权威性,录入人脸图像时请注意以下一些事项:(1)摄像机及照明设备等物理条件基本保持一致。

(2)数据库中男女性别比例应基本保持平衡。

(3)人脸数据库中尽量多摄取各年龄段的人脸样本,避免采集的样本太集中于某个年龄段。

(4)如果原来带眼镜的饰物,除要求带饰物的图像外,其它所有图像在摄取前应除下饰物,所用饰物如眼镜等应尽量根据个人情况随机选取,即不规定只采用何种眼镜等。

(5)在摄取过程中,命名采集对象的文件名时应注意以下两点:(a)同名同姓的不同采集对象不应归类为同一个识别号;(b)在不同时期摄取的同一采集对象应归类为同一个识别号。

(6)应建立专门的完成图像摄入任务的程序,对每个采集对象的输入只应包括姓名、性别、出生日期以及命名规则中的相关项,摄入数据库中图像文件名应由输入程序产生以减少人工输入所造成的错误。

(7)合理安排对采集对象的摄取顺序,以减少输入时间。

四.各种训练与测试标准人脸数据库的建立为了扩大本数据库的影响和针对以后进行的各种标准测试,需建立一个公开发行的比较典型的基本代表了本数据库特性的发布子库和不同的测试子库,即建立如下的子库:(1)发布子库——100人左右,每人10幅图像。

(2)标准正面中性表情单人脸子库(3)标准正面人脸子库(中性表情)(4)表情变化子库(5)姿态实验子库(6)光照实验子库(7)距离变化实验子库(8)时间变化实验子库(9)背景变化实验子库(10)分辨率试验子库(11)多种因素组合试验子库(12)其它实际需要的子库五.具体摄取的人脸图像数目(1)光照变化情况下、纯正面、中性表情条件下摄取每人21幅图像。

(2)姿态变化、中性表情、环境光条件下摄取每人11幅图像。

(3)不同表情、纯正面、环境光条件下摄取每人3~7幅图像。

(4)不同饰物、纯正面、中性表情、环境光条件下摄取每人3~5幅图像。

(5)不同距离、纯正面、中性表情、环境光条件下摄取每人5幅图像。

(6)不同背景、纯正面、中性表情、环境光条件下摄取每人3幅图像。

(7)不同时间、姿态变化、中性表情、环境光条件下摄取每人11幅图像。

六.相应文件和数据库说明文档的建立(1)制定公司与采集对象的协议文件:由于大规模采集标准人脸图像可能会在以后使用或散发时带来一些法律纠纷和风险,因此在采集过程中应与每个采集对象签订相关允许使用其人脸图像的协议。

(2)本数据库建立文档:主要说明本库的建立条件(如所用摄像机、照明设备等)、目的,摄取对象的一些特性、图像格式、大小等。

(3)采集对象文本文件:具体内容应包括姓名、性别、出生日期、人脸库中对应的该采集对象的文件名(无扩展名)等。

该文件主要用于管理人脸数据库,在摄取时可以用于避免同名同姓的不同采集对象归类为同一个识别号。

注意在不同时期摄取的同一采集对象应归类为同一个识别号。

(4)各子库的说明文档:主要说明该子库大小、摄取方法、测试目的等。

(5)发布子库说明文档:详细说明发布该库的目的、摄取条件、采集对象的属性、摄取时的变换条件、采集到的人脸图像尺寸、采集样本的大小等。

(6)。

相关主题