满足不同角色需求: 领域专家 数据科学家 科研人员、高校教师及学生
英语语言模型单词预测竞赛数据【Kaggle竞赛】
5506次浏览 dataju 于 2017-04-20 发布
该内容是由用户自发提供,聚数力平台仅提供平台,让大数据应用过程中的信息实现共享、交易与托管。如该内容涉及到您的隐私或可能侵犯版权,请告知我们及时删除。
数据集概述

竞赛为自然语言建模任务,是一个Kaggle竞赛,来自Billion word数据集。将英文语料中的每个句子中的一个单词剔除,通过所构建的语言模型对该缺失的单词进行预测。


数据集详情
原始数据名称: 英语语言模型单词预测竞赛数据
数据介绍: 竞赛为自然语言建模任务,是一个Kaggle竞赛,来自Billion word数据集。将英文语料中的每个句子中的一个单词剔除,通过所构建的语言模型对该缺失的单词进行预测。
属性数:
记录数:
无缺失值记录数:
数据来源: https://www.kaggle.com/c/billion-word-imputation/data
文件类型: zip压缩包
文件大小: 1.58 Gb
数据集元数据
暂无
概念层次
领域场景: 未指定
领域问题: 未指定
领域应用: 未指定
应用案例: 未指定