产品

通用多模态语音视频数据库

种族：中国人

数量（人）：500

细节：每人录制100个句子。同时使用一部手机录制视频+另外一部手机录制音频+麦克声卡录制音频。三个设备同时录制，并且做了时间同步。人的ID同87-1

查看详细

情绪多模态语音视频数据库

种族：中国人

数量（人）：500

细节：每人录制7类情绪的3个不同句子，每人录制21个不同句子。同时使用一部手机录制视频+另外一部手机录制音频+麦克声卡录制音频。三个设备同时录制，并且做了时间同步。人的ID同87-1

查看详细

通用多模态语音视频数据库

类型：多模态

数量（人）：500

细节：每人录制100个句子，约6-10分钟

查看详细

情绪多模态语音视频数据库

类型：多模态

数量（人）：500

细节：每人7类情绪，每个情绪3个不同句子。每人共21个不同句子。

查看详细

中文-普通话-儿童语音数据集

朗读

10060 人

1105.2 小时

查看详细

照片攻击数据库

种族：非洲人 2000 中亚人 2000 中国人 2000

数量（人）：6000

细节：1个人10段视频： 2段真人视频，8段照片攻击视频打印照片，分别漏出眼睛、鼻子、嘴部的区域进行录制攻击视频

查看详细

中文-普通话-直播语音数据集

自然语言

实际直播环境

5079 小时

查看详细

屏幕、布攻击数据库

3,000人

45,000视频

非洲人，中亚人，东亚人

查看详细

英语-美国-客服语音数据集

自然语言

实际客服环境

287 小时

查看详细

面具攻击数据库

1,000人

4,000段视频

不同光照

查看详细

中文普通话和英语-混说语音数据集

朗读

8477 人

4089 小时

查看详细

人脸防欺诈数据库

1,000人

243,600段视频

不同光照

查看详细

英语-北美语音数据集

朗读

1935 人

865 小时

查看详细

多人种3D多表情人脸识别数据库

8400 人

2T

覆盖20多个国家和不同民族

查看详细

中英儿童语音数据集

中英

217 小时

1,000 演讲者

查看详细

非洲人3D多姿态人脸识别数据库

3000 人

1个人1张证件图片+6段视频

左转头，右转头，上抬头，下低头，戴眼镜，头部画圈

查看详细

普通话-中国儿童语音数据集

普通话-中国

1,105 小时

10,060 演讲者

查看详细

南亚印度人3D多姿态人脸识别数据库

2000人

1个人1张证件图片+6段视频

正面，左转头，右转头，上抬头，下低头，头部转动

查看详细

人体动作识别数据库

种族：中国人

数量（人）：500

细节：使用监控摄像头和RGB-D的摄像头采集摔倒和其它20种常见动作。人的ID同87-1

查看详细

无人车点云数据库

数量（人）：1200000框

细节：数据在中国国内采集，总帧数为7万帧，为视频中截取的秒帧。所标注的3D矩形框为120万个。所标注物体的类别包括了：car、bus、trcuk、van、pedestrian、tricycle、cyclist

查看详细

头部姿态数据库

种族：中国人200 白种人200 黑种人200 南亚人200 其它地区200

数量（人）：1000

细节：每个被采集人使用FaceShift软件建立头模模型（包括10-20个表情的录制），然后录制一段视频视频分辨率是640X480，视频中被采集人进行左转、右转、抬头、低头、左歪头、右歪头、头部画圈、头部画M形等动作。视频长度4-7分钟。标注内容：导出的结果中包括了RGB视频和每帧图像中头的pose，包括了yaw、pitch、roll的角度值。

查看详细

旁观者人脸数据库

种族：中国人200 白种人200 黑种人200 南亚人200 其它地区200

数量（人）：1000

细节：1000人分成了180组，每组4-6人每组在3种光照条件下采集50-69张图片，共采集图像12000张每组在每种光照条件下拍摄一段视频，共180X3段视频，记录了拍摄照片的全过程图片分辨率：4000X3000，视频分辨率1080P 标注内容：每张图片中，标注人脸的矩形框，7个关键点，被拍摄人ID，性别，种族。

查看详细

短视频数据库

数量（人）：20000

细节：从抖音上下载的视频数据

查看详细

牛脸数据库

种族：牛

数量（人）：1000

细节：每头牛一段视频，分辨率:1080P,约30 seconds, 30FPS

查看详细