列举如下,欢迎补充说明~
CASIA-WebFace 数据集 CASIA-WebFace 数据集是一个网络公开数据集,由来自大约一万个人的 50 万张人脸图像组成。CASIA-WebFace 是目前公开的最大人脸数据集之一,但是和 FaceNet 使用的2亿规模的数据集或 DeepFace 使用的3百万规模的数据集相比,CASIA-WebFace 属于相对较小的训练数据集。
VGGFace2 train VGGFace2 train是由 VGGFace2 数据集中随机选出的 8131 个人组成的训练集,包含了大约 2970000 张人脸图像,平均每人拥有 366 张图像,远大于 CASIA-WebFace 数据集。VGGFace2 train 数据集中的人脸图像具有复杂的姿态、年龄、种族、职业和光照的变化。
YTF YTF由来自 1595 个人的 3425 段视频组成,平均每个人有 2.15 段视频。视频都被截取成图片,最短截取 48 帧图像,最长截取 6070 帧图像,平均截取 181.3 帧图像,也就是说每个人平均有 181.3 张图片。YTF 中的人脸图像具有复杂的遮挡、光照、姿态和表情变化。
Extended Yale B 数据集 Extended Yale B 数据集由来自 28 个人的灰度图组成,每个人的 64 张正脸图按照光照变化情况从轻微到复杂被分成了子集 1-5,分别由每个人的 7,12,12,14 和 19 张图片组成。
CMU PIE CMU PIE人脸数据集包含了来自 68 个人的彩色图,CMU PIE光照子集人脸图像具有轻微、中度和复杂光照变化。
LFW LFW数据集包含了从网上获取的来自 5749 个人的 13233 张彩色图像,是目前使用最广泛的人脸测试集。LFW 数据集中的人脸图像有表情、姿态、遮挡和光照等复杂变化。
MegaFace Challenge1 MegaFace Challenge1数据集是一个国际知名人脸识别数据集,由来自 530 个人的彩色图像组成,具有复杂的姿态、表情、光照和曝光变化。
AR 人脸数据集 AR 人脸数据集由 Aleix Martinez 等人在计算机视觉中心(CVC)中进行整理和发布的,该人脸数据库是由 126 类不同的人组成,其中男性占有绝大部分,共 70 人,而女性稍少一点,共 56 人,所有类人脸数量共 4000 多张。每类人脸图像采集用户较为配合,为正脸图像,但受不同面部表情,光照和真实遮挡等干扰因素影响,其中真实遮挡包括太阳镜、围脖遮挡。
PubFig(Public Figures Face Database)人脸集 PubFig与 LFW 人脸集类似,由非控环境中58797张人脸图像组成。PubFig 库中也几乎包含了非控环境中所有可能的干扰因素,如光照、遮挡、配饰、姿态、种族、年龄等因素。
JAFFE 数据库 JAFFE 数据库由 Michael Lyons、Miyuki Kamachi 和 Jiro Gyoba 于 1998 年收集和整理。它共有 213 张面部表情图片,其中包括十位日本成年女性的 7 种表情图像(悲伤、快乐、生气、厌恶、惊讶、恐惧和中性)。该数据库发布较早,且样本量较小,因此在当前测试中正确识别率较高,非常适合于程序的初步测试和改进。
Cohn-Kanade 数据库(CK +) 该数据库是基于 Cohn-Kanade 数据库(CK)开发的,于 2010 年正式发布。它总共包含123 位受试者的 593 个表情图像。与 JAFFE 数据库类似,它也收集主要的七个表情,其中包括六个基础表情和一个中性表情。由于其合适的样本量和完美的标签,因此非常适合进一步测试和调整程序。它是表情识别中比较流行的数据库。
MMI 面部表情数据库 该数据库由静态表情图片和 75 个对象的表情视频组成。它不仅包含顺序的面部表情序列,而且还包含每个表情的详细 FACS 动作单元。该数据库具有较大的样本量和完美的标签。另外,该数据集的最大优点是它包含两个部分:诱导的面部表情和自发表情。非常适合程序的后续扩展和调试。
扩展数据库中的实际表情 该数据集是被用作国际计算机协会主办的EmotiW视频情感识别竞赛的真实使用数据集。其中包含的数据样本全部取自电影视频,因此它与其他数据库之间的最大区别是样本表情不是在实验室中获取的,而是自发的、随机选取的表情。识别数据集的另一个难题是需要从复杂的背景中拾取人脸,这增加了识别的难度,但也更接近于实际应用。因此,该数据集与实际最贴合,非常适合实际应用的开发和调试。