覆盖主要内容
版本: 6.1.0

数据生成

组件介绍

**“数据生成”(Random Data)**控件根据用户配置生成数据集。

**“数据生成”(Random Data)**用于帮助用户生成测试数据集,数据生成可根据用户配置的生成规则生成相应的数据,生成数据后可对数据进行数据预处理、数据查看、数据挖掘模型构建等操作。

警告

生成的数据均为数值型


  • 输入:
  • 输出:
    • data:数据集

页面介绍

点击**“数据生成”(Random Data)**控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
生成方法列表

指定生成规则,并配置规则信息,方便生成相应的数据,可选定多条规则构建数据

数据规则

数据规则选项卡

支持的规则包括:
正态分布
伯努利分布
二项分布
连续型均与分布
离散型均匀分布
多项分布
超几何分布
负二项分布
泊松分布
指数分布
伽玛分布
Student-T 分布
二维正态分布

正态分布
生成实例数

需要生成的数据实例数

1~100001000

使用案例

**“数据生成”(Random Data)控件一般作为一个工作流的开端,生成并加载数据,之后进行相关处理。如下图所示的工作流中 ,使用“数据生成”(Random Data)控件生成数据集,连接“查看数据”(Data Table)**控件查看数据。

案例中使用默认配置生成数据集,案例中控件执行结果如下图所示: