高斯混合
组件介绍
**“高斯混合(Gaussian Mixture)”**控件使用高斯混合模型对数据进行聚类。
高斯混合模型(GMM)可以看做是k-means模型的一个优化。高斯混合模型试图找到多维高斯模型概率分布的混合表示,从而拟合出任意形状的数据分布。
- 输入:
- data:数据集
- 输出:
- data:处理后的数据集
页面介绍
点击**“高斯混合(Gaussian Mixture)”**控件查看参数配置页面,如下图所示:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
簇数量 | 指定簇数 | 1~1000 | 2 |
协方差类型 | full:每个分量有各自不同的标准协方差矩阵,完全协方差矩阵 | full | full |
收敛阈值 | 迭代停止阈值 | 0.00000001~100 | 0.001 |
协方差对角非负正则化 | 保证协方差矩阵均为正 | 0.00000001~1000 | 0.000001 |
最大迭代次数 | 最大迭代次数 | 1~10000 | 100 |
初始化次数 | 初始化次数,用于产生最佳初始参数 | 1~100 | 1 |
初始化参数类型 | 初始化参数实现方式 | kmeans | kmeans |
使用案例
在下图所示的案例中,使用**“加载文件”(File)控件加载数据集,连接“高斯混合(Gaussian Mixture)”控件进行聚类,之后连接“查看数据”(Data Table)**控件查看聚类结果。
案例中加载 iris 数据集,案例中控件的配置以及执行结果如下图所示。