覆盖主要内容
版本: 6.1.0

主成分分析

组件介绍

**“主成分分析”(PCA)**控件将主成分分析方法应用于输入数据。

**“主成分分析”(PCA)**控件对输入数据计算其 PCA 线性转换,输出经过转换的带权重的数据或特征向量。

PCA是一种统计分析、简化数据集的方法。它利用正交变换来对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分(Principal Components)。具体地,主成分可以看做一个线性方程,其包含一系列线性系数来指示投影方向。PCA对原始数据的正则化或预处理敏感(相对缩放)。


  • 输入:
    • data:数据集
  • 输出:
    • data:经过PCA变换后的数据
    • cmp:特征向量

页面介绍

点击**“主成分分析”(PCA)**控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
主成分占比

主成分覆盖的方差范围

0.1~10.9
奇异值分解方法

奇异值分解方法选择

auto
full
arpack
randomized

数据标准化

是否对数据进行标准化操作

勾选/不勾选不勾选

使用案例

在下图所示的案例中,使用**“加载文件”(File)控件加载数据,通过“查看数据”(Data Table)控件查看加载数据的信息,同时使用“主成分分析”(PCA)控件对数据集进行主成分分析,之后通过“查看数据”(Data Table)**控件查看处理后的数据集。

案例中加载 iris 数据集,案例中控件的配置以及执行结果如下图所示。