覆盖主要内容
版本: 6.1.0

K近邻

组件介绍

**“K近邻”(KNN)**控件主要用于构建K最邻近算法模型。可用于分类任务或回归任务。

KNN是一种基于实例的学习,或者是局部近似和将所有计算推迟到分类之后的惰性学习。最近邻居法采用向量空间模型来分类,概念为相同类别的案例,彼此的相似度高,而可以借由计算与已知类别案例之相似度,来评估未知类别案例可能的分类。


  • 输入:
    • data:数据集
    • pre: 预处理方法
  • 输出:
    • lrn: 在交互页面中配置参数后的KNN学习算法
    • mod: 已训练的模型(仅当输入端data存在时,才会有输出信息)

页面介绍

点击**“K近邻”(KNN)**控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
模型名称

设置模型名称,用于在其他组件中区分不同的模型

非空字符串KNN
邻节点个数邻节点个数1~1005
度量用于距离计算的度量

欧几里得(Enclidean):“直线”,两点之间的距离
曼哈顿(Manhattan):所有属性的绝对差之和
切比雪夫(Chebyshev)
马氏距离(Mahalanobis):点与分布之间的距离

欧几里得
权重预测中使用的权重函数

统一(Uniform):每个邻居的所有点都是平等的
距离(Distance):距离查询点较近的邻节点比较远的邻节点影响更大

统一

KNeighborsClassifier详细参数说明

KNeighborsRegressor详细参数说明

使用案例

在下图所示的案例中,使用**“加载文件”(File)控件加载数据集,连接“K近邻”(KNN)控件进行模型构建,之后把“加载文件”(File)控件以及“K近邻”(KNN)控件与“预测”(Predictions)**控件连接起来查看预测的结果。

案例中加载 iris 数据集,其余参数使用默认值。案例中控件的配置以及执行结果如下图所示。