多种类自然语言推理(MultiNLI)语料库是一个众包的433k句子对的集合,带有文本蕴含信息。语料库以SNLI语料库为模型,但是不同之处在于它涵盖了多种口语和书面语体,并支持独特的跨语体泛化评估。
包含六种类型的人类活动(步行、慢跑、跑步、拳击、摆手、拍手)由25名受试者在四种不同的情况:室内、外,不同尺度变化,不同的衣服条件下所拍摄。
SNLI语料库(1.0版)是一个57万个人工书写的英语句子对的集合,这些句子对经过手动标注以实现平衡分类,并带有enume,矛盾和中性标签,支持自然语言推理(NLI)的任务。
该数据集是搜狐的读书类别的历史文章数据,大小为2.2G,可以选择性使用地来探索汽车领域的相关数据,例如文本分类,情感分析等。
这个数据集是来自网站上收集的健康类别的数据,人工简单的处理了之后,打包成jsonl格式。
来自英国各地的10,000个10秒的智能手机音频录音,音频总计持续44小时。音频将由Warblr根据知识共享许可发布。音频涵盖英国广泛的位置和环境,包括天气噪音,交通噪音,人类语音甚至人类鸟类模仿。
中华新华字典数据库和 API 。收录包括 14032 条歇后语,16142 个汉字,264434 个词语,31648 个成语。
俄语手写字母分类数据集手写的俄文小写字母照片制作数据库。
该数据库采用车载摄像机获取,分为检测和分类两个数据集。
包含 60个 动物玩偶的 5000张 不同角度图像,每个玩偶约 72个 角度连续拍摄的照片图像,可用于物体3D、图像识别等任务。
NIST 8-Bit Gray Scale Images of Fingerprint 是一个指纹图像数据,包括 2000张指纹灰度图,400组左右手五指指纹灰度图。
音乐知识图谱,包括歌曲名、歌手、原唱、语种、热门歌手、热门歌曲等属性,可用于音乐问答服务。