覆盖主要内容
版本: 6.1.0

LightGBM

组件介绍

**“LightGBM”**控件主要用于构建LightGBM算法模型。可用于分类任务或回归任务。

LightGBM是微软开源的一个基于树的学习算法的梯度提升框架。


  • 输入:
    • data:数据集
    • pre: 预处理方法
  • 输出:
    • lrn: 在交互页面中配置参数后的LightGBM学习算法
    • mod: 已训练的模型(仅当输入端data存在时,才会有输出信息)

页面介绍

点击**“LightGBM”**控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
模型名称

设置模型名称,用于在其他组件中区分不同的模型

非空字符串LightGBM
学习器类型

算法学习器

GBDT(traditional Gradient Boosting Decision Tree)
DART(Dropouts meet Multiple Additive Regression Trees)
GOSS(Gradient-based One-Side Sampling)
RF(Random Forest)

GBDT
树的数量

值过小可能会导致欠拟合,值过大可能会导致过拟合

1~100010
学习率

每个提升迭代阶段学习的步长

0.01~10.1
抽样率

若此参数小于1.0,LightGBM将会在每次迭代中在不进行重采样的情况下随机选择部分数据(row),可以用来加速训练及处理过拟合。

0.01~10.1
最大深度

限制树模型的最大深度,默认不勾选

1~100010
最大叶子数

一棵树上的叶子节点个数

2~13107210

参数详细说明

使用案例

在下图所示的案例中,使用**“加载文件”(File)控件加载数据集,连接“LightGBM”控件构建模型,之后把“加载文件”(File)控件以及“LightGBM”控件与“预测”(Predictions)**控件连接起来查看预测的结果。

案例中加载 iris 数据集,其余参数使用默认值。案例中控件的配置以及执行结果如下图所示。