满足不同角色需求: 领域专家 数据科学家 科研人员、高校教师及学生
bAbi 问答和文本理解的数据集
1095次浏览 dataju 于 2021-08-17 发布
该内容是由用户自发提供,聚数力平台仅提供平台,让大数据应用过程中的信息实现共享、交易与托管。如该内容涉及到您的隐私或可能侵犯版权,请告知我们及时删除。
数据集概述

https://hyper.ai/datasets/5024

The QA bAbI tasks 是 bAbI 项目中的用于问答和文本理解的训练数据集,其被用于测试文本理解和推理中第一组的 20 个任务,每项任务中均有 1000 个问题用于培训、1000 个问题用于测试。

该数据集由一组上下文组成,基于上下文可以使用多个问答对,目前有以下几个目录:

  • en / – 英文任务,人类可读;
  • hn / – 印地语任务,人类可读;
  • 改组 / – 采用随机字母执行相同的任务,人类不可读且现有解析器和标记器不能直接使用,因此学习者对给定训练数据的依赖程度有所提升。
  • en -10k /、shuffled – 10k / 和 hn – 10k / – 三种格式的相同任务,拥有 10000 个训练样例。

The QA bAbI tasks 数据集由 Google 的 Jason Weston、Facebook 的 Antoine Bordes 等人于 2015 年发布,相关论文有《Towards AI-Complete Question Answering: A Set of Prerequisite Toy Tasks》。


数据集详情
暂无
数据集元数据
暂无
概念层次
领域场景: 未指定
领域问题: 未指定
领域应用: 未指定
应用案例: 未指定