JDL标准人脸数据库协议
介绍:
本数据库主要用于对开发的人脸识别算法进行标准测试和评估,对现有的人脸识别技术进行全面综合的评价,以推动国内对自动人脸识别技术的研究和开发。该库的建立由面像识别联合实验室和银晨公司合作完成,面像识别联合实验室提供详细的建库协议和技术指导,银晨公司负责提供设备和组织人员完成后续的人脸图像摄入和相关文档的建立等工作。
本数据库大体上可分为两部分,一部分人脸图像将公开发布,以供相关科研机构和企业对系统进行标准训练和测试;另一部分人脸图像则不公开发布以作为人脸识别(或确认)算法的标准测试所用。进行测试时则可以将其按照不同的实验目的进行子库的划分。
一.数据库中图像文件的命名规则
该数据库中图像文件的命名方法为:
xx_xxxxxx_Ixxx_Pxx_Ex_Ax_Dx_Tx_Bx_Mx_Rx_Sx.ext
1 2 3 4 5 6 7 8 9 10 11 12 13
(1)性别与年龄(两位),第一位表示性别:男性用M表示,女性用F表示;第二位表示年龄,用L、Y、M、O分别表示少年、青年、中年、老年。
(2)识别号(六位),表示第几个人,用数字表示,不足部分前面补零。JDL采集的人脸数据标号从000001开始,YCNC采集的人脸数据标号从100000开始。
(3)光照(四位),I为光照标记,第二位表示各种光源(分为环境光E、荧光灯F、白炽灯L),第三位表示光源位置(上U、中M、下D)、第四位表示光源方向
(0、1、2、3、4、5)分别表示(0度、45度、90度、135度、180度、270
度)。
(4)姿态(三位),P为姿态标记,第二位表示各种不同姿态(仰视U、平视M、俯视D),第三位表示不同方向(0、1、2、3、4、5、6、7、8)。
(5)表情(二位),E为表情标记,第二位表示各种不同表情,可分6种情况,中性N、笑L、皱眉F、惊讶S、闭眼C、张嘴O。
(6)饰物(两位),A为饰物标记,后一位表示是否有脸部饰物如眼镜、帽子等。0表示无饰物,有饰物时1、2、3表示三种眼镜饰物,4、5、6表示三种帽子饰
物。
(7)距离(两位),D为距离标记,后一位表示人物与摄像头之间的各种距离,分为3种情况并分别用0、1、2表示,具体定义参见参数定义。
(8)时间(两位),T为时间标记,后一位表示不同时期摄取的同一人的图像,分为五种情况:现在、三个月以后、六个月以后、九个月以后和一年以后,这四种
情况分别用0、1、2、3、4来表示。
(9)背景(两位),B为背景标记,后一位表示背景变化,分5种情况(蓝色B、白色W、红色R、黑色D、黄色Y)。
(10)修改(两位),M为修改标志,后一位表示该图像是否已做数字化修改,0表示未修改,1表示已修改。
(11)公开情况(两位),R表示公开标记,后一位表示该图像是否可以对外界公开,
0表示不可以公开,1表示可以公开。
(12) 图片大小(两位),S 表示图片大小标记,后一位表示该图片大小,0表示图片
大小为640*480,1表示图片大小为320*240。
(13) 扩展名(三位),表示存贮该图像的类型,推荐使用bmp 格式存贮。
注:采集过程中,文件名根据实际情况稍有调整,文件名指代的图片情况前后并不完全一致,具体调整情况参见人脸库使用说明书。
二. 人脸数据库中相关参数的定义
<1> 姿态:
共11个, 姿态角用),(θϕ表示,其中ϕ表示方位角,规定以被摄者脸往左转(从上往下看为逆时针方向)为正,反之则为负;θ表示俯仰角,规定以被摄者脸往上扬为正,反之则为负。
(1) uqr ——上左四分之一侧面 (22.5, 30)
(2) umf ——上正面 (0, 30)
(3) uqr ——上右四分之一侧面 (-22.5, 30)
(4) mpl ——正常左侧面 (90, 0)
(5) mql ——正常左四分之一侧面 (22.5, 0)
(6) mmf ——正常正面 (0, 0)
(7) mqr ——正常右四分之一侧面 (-22.5, 0)
(8) mpr ——正常右侧面 (-90, 0)
(9) dql ——下左四分之一侧面 (22.5, -30)
(10) dmf ——下正面 (22.5, -30)
(11) dqr ——下右四分之一侧面 (-22.5, -30)
<2>
光照:分为17种光源位置,具体见下图:
其中:不可见半球上的光源点
可见半球上的光源点
采集用户位置
可见半球上的摄像机位置
在上述采集环境下采集21幅光照变化图像:
(1)环境光,要求各个方向均匀映照,光亮度低,欠曝光(1,5,6);
(2)环境光,要求各个方向均匀映照,光亮度中;(1,5,6,7,12)
(3)环境光,要求各个方向均匀映照,光亮度高,过曝光;(1,5,6,7,8, 10, 12, 13, 15)
(4)环境光,要求各个方向均匀映照,强背光(强17号点光源);
(5)环境光,要求各个方向均匀映照,弱背光(弱17号点光源);
(6)除背后光源以外的1号点光源单独照射(其他全暗)
(7)除背后光源以外的2号点光源单独照射(其他全暗)
(8)…
(9)(21) 除背后光源以外的16号点光源单独照射(其他全暗)
<3>尺寸:本数据库的人脸图像大小定义为:640x480或320x240。
<4>两眼距离:基本保持在40~60像素之间(摄像机镜头与人物间的距离为标准距
离时)。
<5>距离:定义为摄像机镜头与人物间的距离。本数据库根据5种距离进行摄取。
标准距离定义为摄取的图像为规定的大小而人脸的两眼之间的距离为规定的距
离时摄像机镜头与人物间的距离;其它几种距离为在标准距离的基础上分别增
加和减少1/3、2/3。标准距离用2表示,减少1/3的距离用1表示,增加1/3的
距离用3表示,增加2/3的距离用4表示, 增加一倍距离用5表示。
<6>人脸图像内容:主要有人物的头部、脖子、有时包括肩膀的上部。
<7>饰物:所谓饰物即为待摄入的人物所带眼镜和帽子和假发等物。
<8>库的大小:本数据库中共为10000个人预留了唯一的识别号,可以考虑逐步建
立,但人数至少应规划在1000人以上,这样有利于以后各种训练和测试子库的
建立。
三.建库时的注意事项
为了保持数据库的通用和权威性,录入人脸图像时请注意以下一些事项:
(1)摄像机及照明设备等物理条件基本保持一致。
(2)数据库中男女性别比例应基本保持平衡。
(3)人脸数据库中尽量多摄取各年龄段的人脸样本,避免采集的样本太集中于某个年龄段。
(4)如果原来带眼镜的饰物,除要求带饰物的图像外,其它所有图像在摄取前应除下饰物,所用饰物如眼镜等应尽量根据个人情况随机选取,即不规定只采用何
种眼镜等。
(5)在摄取过程中,命名采集对象的文件名时应注意以下两点:(a)同名同姓的不同采集对象不应归类为同一个识别号;(b)在不同时期摄取的同一采集对象应归
类为同一个识别号。
(6)应建立专门的完成图像摄入任务的程序,对每个采集对象的输入只应包括姓名、性别、出生日期以及命名规则中的相关项,摄入数据库中图像文件名应由输入
程序产生以减少人工输入所造成的错误。
(7)合理安排对采集对象的摄取顺序,以减少输入时间。
四.各种训练与测试标准人脸数据库的建立
为了扩大本数据库的影响和针对以后进行的各种标准测试,需建立一个公开发行的比较典型的基本代表了本数据库特性的发布子库和不同的测试子库,即建立如下的子库:(1)发布子库——100人左右,每人10幅图像。
(2)标准正面中性表情单人脸子库
(3)标准正面人脸子库(中性表情)
(4)表情变化子库
(5)姿态实验子库
(6)光照实验子库