该内容是由用户自发提供,聚数力平台仅提供平台,让大数据应用过程中的信息实现共享、交易与托管。如该内容涉及到您的隐私或可能侵犯版权,请告知我们及时删除。
数据集概述
几个Large-scale分类建模数据, 样本数由50万到5000万不等,属性数由于200到2000不等,可用来测试分类建模算法的时间和空间复杂度复杂度。
| 数据集 | 训练样本数 | 校验样本数 | 属性数量 |
| alpha | 50万 | 10万 | 500 |
| beta | 50万 | 10万 | 500 |
| gamma | 50万 | 10万 | 500 |
| delta | 50万 | 10万 | 500 |
| epsilon | 50万 | 10万 | 2000 |
| zeta | 50万 | 10万 | 2000 |
| fd | 546.98万 | 53.24万 | 900 |
| ocr | 350万 | 67万 | 1156 |
| dna | 5000万 | 100万 | 201 |
| webspam | 35万 | 5万 | 可变 |
数据集详情
| 原始数据名称: | Large-scale 分类建模数据 |
| 数据介绍: | 几个Large-scale 分类建模数据,可用来测试分类建模算法的时间复杂度。 |
| 属性数: | |
| 记录数: | |
| 无缺失值记录数: | |
| 数据来源: | |
| 文件类型: | |
| 文件大小: | 11.18 Gb |
数据集元数据
暂无
概念层次
| 领域场景: | 未指定 |
| 领域问题: | 未指定 |
| 领域应用: | 未指定 |
| 应用案例: | 未指定 |
