目前平台处于试运行阶段,如有任何问题或建议,请发送邮件至 service@dataju.cn 或加入QQ群 565136792 联系管理员。

满足不同角色需求:领域专家 数据管理者 数据科学家 科研人员、高校教师及研究生 数据分析爱好者
K近邻分类方法
1401次浏览 dataju 于 2016-07-10 发布
该内容是由用户自发提供,聚数力平台仅提供平台,让大数据应用过程中的信息实现共享、交易与托管。如该内容涉及到您的隐私或可能侵犯版权,请告知我们及时删除。
分析方法描述
k近邻居法(k Nearest Neighbor)是一种用于分类和回归的非参数据建模方法,是一种基于实例的学习,或称是局部近似和惰性学习方法。k-近邻算法是最简单的机器学习算法中之一。 在KNN分类中,输出是一个分类标签。对象的分类是由其邻居的“多数表决”确定的,k个最近邻居(k为正整数,通常较小)中最常见的分类决定了赋予该对象的类别。若k = 1,则该对象的类别直接由最近的一个节点赋予。 在KNN回归中,输出是该对象的属性值。该值是其k个最近邻居的值的平均值。 最近鄰居法採用向量空間模型來分類,概念為相同類別的案例,彼此的相似度高,而可以藉由計算與已知類別案例之相似度,來評估未知類別案例可能的分類。 无论是分类还是回归,衡量邻居的权重都非常有用,使较近邻居的权重比较远邻居的权重大。例如,一种常见的加权方案是给每个邻居权重赋值为1/ d,其中d是到邻居的距离。 邻居都取自一组已经正确分类(在回归的情况下,指属性值正确)的对象。虽然没要求明确的训练步骤,但这也可以当作是此算法的一个训练样本集。
分析方法参数
# 名称 描述
1 邻居数量 邻居数量
相关应用案例
# 应用案例名称 应用案例介绍
1 UCI Iris 数据集K近邻方法建模预测鸢花种类 UCI Iris 数据集,采用多分类 KNN 方法建模,通过鸢花外形数据预测鸢花种类。
参考资料
暂无

目前平台处于试运行阶段,如有任何问题或建议,请发送邮件至 service@dataju.cn 或加入QQ群 565136792 联系管理员。