VoxCeleb是一个视听数据集,由从上传到YouTube的采访视频中提取的人类语音短片组成。
VoxCeleb2包含超过100万个6,112个名人的话语,从上传到YouTube的视频中提取,VoxCeleb2已经与VoxCeleb1或SITW数据集没有重叠的说话人身份。
| 发音人数量 | 训练集:5994,测试集:118 |
| 视频数量 | 训练集:145569,测试集:4911 |
| 音频数量 | 训练集:1092009,测试集:36237 |
| 内容时长 | 2000小时以上 |
| 发布时间 | 2018年 |