二分K均值
组件介绍
**“二分K均值(Bisecting KMeans)”**控件使用二分K均值算法对数据进行聚类。
二分K均值算法是k-means聚类算法的一个变体,主要是为了改进k-means算法随机选择初始质心的随机性造成聚类结果不确定性的问题,而Bisecting k-means算法受随机选择初始质心的影响比较小。二分K均值聚类算法的基本思想是,通过引入局部二分试验,每次试验都通过二分具有最大SSE值的一个簇,二分这个簇以后得到的2个子簇,选择2个子簇的总SSE最小的划分方法,这样能够保证每次二分得到的2个簇是比较优的(也可能是最优的),也就是这2个簇的划分可能是局部最优的,取决于试验的次数。
- 输入:
- data:数据集
- 输出:
- data:处理后的数据集
页面介绍
点击**“二分K均值(Bisecting KMeans)”**控件查看参数配置页面,如下图所示: