覆盖主要内容
版本: 6.1.0

数据采样

组件介绍

数据采样”组件对输入的数据进行数据采样,数据较多的时候使用会比较有效果。


  • 输入: 数据
  • 输出: 采样数据

页面介绍

数据采样”组件的配置页面如下图所示:

参数选项

数据采样”组件主要包括如下参数:

选项说明样例值
步骤名称指定画布上步骤的唯一名称。
Sample size样本大小,从数据中抽取的样本的大小。
Random seed随机种子,可以选择不同的数值来选择不同的随机样本。

使用案例

工作流如上图所示,这个案例依然使用超市订单示例数据,将从表输入的输入的数据中进行随机采样,先预览原来的数据局表中数据的总条数,如下图所示。

可以看出原来的数据表中有10000条数据,从这10000条数据中,采样出100条数据。 打开数据采样组件,保持原来的设置,如下图所示。

在输出的数据表中选择和输入的数据表相同字段的数据表。

点击运行,出现如上图所示结果,则表示运行成功。在数据表中查看结果,如下图所示,输出的数据为100条。

以上就是数据采样组件的使用案例。