数据采样
组件介绍
“数据采样”组件对输入的数据进行数据采样,数据较多的时候使用会比较有效果。
- 输入: 数据
- 输出: 采样数据
页面介绍
“数据采样”组件的配置页面如下图所示:
参数选项
“数据采样”组件主要包括如下参数:
选项 | 说明 | 样例值 |
---|---|---|
步骤名称 | 指定画布上步骤的唯一名称。 | |
Sample size | 样本大小,从数据中抽取的样本的大小。 | |
Random seed | 随机种子,可以选择不同的数值来选择不同的随机样本。 |
使用案例
工作流如上图所示,这个案例依然使用超市订单示例数据,将从表输入的输入的数据中进行随机采样,先预览原来的数据局表中数据的总条数,如下图所示。
可以看出原来的数据表中有10000条数据,从这10000条数据中,采样出100条数据。 打开数据采样组件,保持原来的设置,如下图所示。
在输出的数据表中选择和输入的数据表相同字段的数据表。
点击运行,出现如上图所示结果,则表示运行成功。在数据表中查看结果,如下图所示,输出的数据为100条。
以上就是数据采样组件的使用案例。