该内容是由用户自发提供,聚数力平台仅提供平台,让大数据应用过程中的信息实现共享、交易与托管。如该内容涉及到您的隐私或可能侵犯版权,请告知我们及时删除。
数据集概述
https://hyper.ai/datasets/5472
WMT 2015 French/English parallel texts 是用于训练翻译模型的法语/英语平行文本数据集,它拥有超过 2000 万条法语与英语句子。
本数据集由 Chris Callison-Burch 创建,他在抓取上百万个网页后通过一组简单的启发式 算法 将法语网址转换为英文网址,并默认这些文档之间互为译文。
该数据集由约翰·霍普金斯大学、爱丁堡大学和阿姆斯特丹大学于 2009 年联合发布。
数据集详情
暂无
数据集元数据
暂无
概念层次
领域场景: | 未指定 |
领域问题: | 未指定 |
领域应用: | 未指定 |
应用案例: | 未指定 |