数据集 -- bAbi 问答和文本理解的数据集 | 聚数力平台

bAbi 问答和文本理解的数据集

1095次浏览 dataju 于 2021-08-17 发布

该内容是由用户自发提供，聚数力平台仅提供平台，让大数据应用过程中的信息实现共享、交易与托管。如该内容涉及到您的隐私或可能侵犯版权，请告知我们及时删除。

数据集概述

The QA bAbI tasks 是 bAbI 项目中的用于问答和文本理解的训练数据集，其被用于测试文本理解和推理中第一组的 20 个任务，每项任务中均有 1000 个问题用于培训、1000 个问题用于测试。

该数据集由一组上下文组成，基于上下文可以使用多个问答对，目前有以下几个目录：

en / – 英文任务，人类可读；
hn / – 印地语任务，人类可读；
改组 / – 采用随机字母执行相同的任务，人类不可读且现有解析器和标记器不能直接使用，因此学习者对给定训练数据的依赖程度有所提升。
en -10k /、shuffled – 10k / 和 hn – 10k / – 三种格式的相同任务，拥有 10000 个训练样例。

The QA bAbI tasks 数据集由 Google 的 Jason Weston、Facebook 的 Antoine Bordes 等人于 2015 年发布，相关论文有《Towards AI-Complete Question Answering: A Set of Prerequisite Toy Tasks》。

数据集详情

暂无

数据集元数据

暂无

概念层次

领域场景:	未指定
领域问题:	未指定
领域应用:	未指定
应用案例:	未指定