版本: 下个版本

K最邻近

简介

邻近算法，或者说K最邻近（KNN，K-NearestNeighbor）分类算法是数据挖掘分类技术中最简单的方法之一。

所谓K最近邻，就是K个最近的邻居的意思，说的是每个样本都可以用它最接近的K个邻近值来代表。近邻算法就是将数据集合中每一个记录进行分类的方法。

算法参数及说明

参数	说明
邻居数量	Number of neighbors to use, 默认5
距离指标	metric 默认minkowski
权重	Weight function used in prediction, 默认uniform
算法	Algorithm used to compute the nearest neighbors, 默认auto

案例

案例数据下载：iris.xlsx

案例介绍：Iris数据集是常用的分类实验数据集，由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集，是一类多重变量分析的数据集。数据集包含150个数据样本，分为3类，每类50个数据，每个数据包含4个属性。可通过花萼长度，花萼宽度，花瓣长度，花瓣宽度4个属性预测鸢尾花卉属于（Setosa，Versicolour，Virginica）三个种类中的哪一类。

Sepal.Length（花萼长度），单位是cm;
Sepal.Width（花萼宽度），单位是cm;
Petal.Length（花瓣长度），单位是cm;
Petal.Width（花瓣宽度），单位是cm;
种类：Iris Setosa（山鸢尾）、Iris Versicolour（杂色鸢尾），以及Iris Virginica（维吉尼亚鸢尾）。

制作流程：

选择iris数据集；
在智能分析图表中选择KNN；
在设置中的基础配置中选择状态为成功的KNN模型，** 注意：数据集字段必须包含已选择的KNN模型所使用的训练集字段 **；

如果模型列表中没有模型，需要创建模型，创建模型的链接：机器学习模型管理
进行数据探索，结果以表的方式展示

简介​

算法参数及说明​

案例​

简介

算法参数及说明

案例