2806

AI2科学问答数据集(多选)

AI2 Science Questions

A12 科学问答 文本数据集

来自学生评估的 2707 个多选科学题

免积分下载
数据集市
2020年10月31日
56MB

相关数据

10种猴子图片数据集
10种猴子图片数据集
用于细粒度分类的图像数据集 免积分下载
僧伽罗语多语种TTS语料库
僧伽罗语多语种TTS语料库
该数据集包含僧伽罗语的多扬声器高质量转录音频数据,由斯里兰卡... 免积分下载
通用知识图谱数据集
通用知识图谱数据集
ownthink致力于最大的中文开放知识图谱,目前已经对两千... 免积分下载

数据介绍

Allen Institute for Artificial Intelligence (AI2)的Project Aristo专注于构建一个系统,该系统能够获取并存储大量的可计算形式的知识,然后将这些知识应用于不同年级水平的学生的标准化考试中的各种科学问题。我们邀请更广泛的人工智能研究社区,通过提供学生科学评估问题的数据集,来与我们共同应对这一重大挑战。 这些都是英语语言问题,它跨越了文件中所显示的几个年级水平。每个问题都是对应4个选择回答。其中一些问题包括一个图表,作为问题文本的一部分,作为回答选项,或者两者兼而有之。图在文本中表示,文件名对应于对应文件夹中的图文件本身。这些问题被预先划分为培训、开发和测试集。 数据集包括以下字段: questionID: a unique identifier for the question originalQuestionID: the question number on the test totalPossiblePoints: how many points the question is worth AnswerKey: the correct answer option isMultipleChoiceQuestion: 1 = multiple choice, 0 = other includesDiagram: 1 = includes diagram, 0 = other examName: the source of the exam schoolGrade: grade level year: year the source exam was published question: the question itself subject: Science category: Test, Train, or Dev (data comes pre-split into these categories)

相关论文:

1.Clark, Peter. “Elementary School Science and Math Tests as a Driver for AI: Take the Aristo Challenge!” AAAI (2015).

还没有任何文件记录.