该内容是由用户自发提供,聚数力平台仅提供平台,让大数据应用过程中的信息实现共享、交易与托管。如该内容涉及到您的隐私或可能侵犯版权,请告知我们及时删除。
数据集概述
Visual Question Answering(VQA) 是一个针对图像内容进行自然语言问答数据集,其中有关图像的自然语言问题和答案需要对图像内容、自然语言和常识进行智能运用才能回答。包括 12 万张图像,44 万问题,440万答案,平均每个问题10个答案。
数据集详情
原始数据名称: | Visual Question Answering V2.0 图像数据 |
数据介绍: | Visual Question Answering (VQA) 是一个针对图像内容进行自然语言问答数据集,其中有关图像的自然语言问题和答案需要对图像内容、自然语言和常识进行智能运用才能回答。包括 25 万张图像,每张图片 3 个自然语言描述的问题,每个问题 10 个标准答案,3 个近似答案。 |
属性数: | |
记录数: | |
无缺失值记录数: | |
数据来源: | http://visualqa.org/ |
文件类型: | |
文件大小: | 30.60 Gb |
数据集元数据
暂无
概念层次
领域场景: | 未指定 |
领域问题: | 未指定 |
领域应用: | 未指定 |
应用案例: | 未指定 |