覆盖主要内容
版本: 下个版本

K-Modes

组件介绍

**“K-Modes”**控件基于对分类属性型数据的采用的聚类算法来划分数据。

K-Modes聚类是标准k-means聚类过程的一个改进版本,它针对分类数据的聚类进行了优化。它通过使用匹配差异度量(也称为汉明距离)而不是欧氏距离来计算两个对象之间的距离。此外,它使用modes来表示聚类中心点。


  • 输入:
    • data:数据集
  • 输出:
    • data:处理后的数据集
    • cen:每个簇的中心点

页面介绍

点击**“K-Modes”**控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
簇数量

指定簇数

1~10003
最大迭代数

算法运行的最大迭代次数

1~1000200

参考项目地址

使用案例

在下图所示的案例中,使用**“加载文件”(File)控件加载数据集,连接“K-Modes”控件进行聚类,之后连接“查看数据”(Data Table)**控件查看聚类结果。

案例中加载 iris 数据集,案例中控件的配置以及执行结果如下图所示。