覆盖主要内容
版本: 下个版本

高斯混合

组件介绍

**“高斯混合(Gaussian Mixture)”**控件使用高斯混合模型对数据进行聚类。

高斯混合模型(GMM)可以看做是k-means模型的一个优化。高斯混合模型试图找到多维高斯模型概率分布的混合表示,从而拟合出任意形状的数据分布。


  • 输入:
    • data:数据集
  • 输出:
    • data:处理后的数据集

页面介绍

点击**“高斯混合(Gaussian Mixture)”**控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
簇数量

指定簇数

1~10002
协方差类型

full:每个分量有各自不同的标准协方差矩阵,完全协方差矩阵
tied:所有分量有相同的标准协方差矩阵
diag:每个分量有各自不同对角协方差矩阵
spherical:每个分量有各自不同的简单协方差矩阵,球面协方差矩阵

full
tied
diag
spherical

full
收敛阈值迭代停止阈值0.00000001~1000.001
协方差对角非负正则化保证协方差矩阵均为正0.00000001~10000.000001
最大迭代次数最大迭代次数1~10000100
初始化次数初始化次数,用于产生最佳初始参数1~1001
初始化参数类型

初始化参数实现方式
kmeans:kmeans方式
k-means++:k-means++
random:随机产生
random_from_data:从初始平均值中随机选择

kmeans
k-means++
random
random_from_data

kmeans

详细参数说明

使用案例

在下图所示的案例中,使用**“加载文件”(File)控件加载数据集,连接“高斯混合(Gaussian Mixture)”控件进行聚类,之后连接“查看数据”(Data Table)**控件查看聚类结果。

案例中加载 iris 数据集,案例中控件的配置以及执行结果如下图所示。