覆盖主要内容
版本: 6.1.0

梯度提升决策树

组件介绍

**“梯度提升决策树”(Gradient Boosting Decision Tree)**控件为迭代决策树模型。可用于分类任务或回归任务。

**“梯度提升决策树”(Gradient Boosting Decision Tree)**控件是一种基于决策树的集成学习方法,该方法利用所有树的结论累加起来做最终答案,常用于各种分类和预测问题。


  • 输入:
    • data:数据集
    • pre: 预处理方法
  • 输出:
    • lrn: 在交互页面中配置参数后的GBDT学习算法
    • mod: 已训练的模型(仅当输入端data存在时,才会有输出信息)

页面介绍

点击**“梯度提升决策树”(Gradient Boosting Decision Tree)**控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
模型名称

设置模型名称,用于在其他组件中区分不同的模型

非空字符串GBDT
迭代次数

迭代次数,值过小可能会导致欠拟合,值过大可能会导致过拟合

1~1000100
学习率

每个提升迭代阶段学习的步长

0.01~10.01
最大深度

控制决策树模型的复杂程度,默认不勾选,数值为3

1~100010
最小样本数

限制子树继续划分的条件

1~100010
分类损失函数

对于分类任务,提供deviance一种损失函数供用户选择
对于回归任务,提供ls、lad、huber、quantile四种损失函数供用户选择

GradientBoostingClassifier详细参数说明

GradientBoostingRegressor详细参数说明

使用案例

在下图所示的案例中,使用**“加载文件”(File)控件加载数据集,连接“梯度提升决策树”(Gradient Boosting Decision Tree)控件构建模型,之后把“加载文件”(File)控件以及“梯度提升决策树”(Gradient Boosting Decision Tree)控件与“预测”(Predictions)**控件连接起来查看预测的结果。

案例中加载 iris 数据集,**“梯度提升决策树”(Gradient Boosting Decision Tree)**控件参数使用默认值。案例中控件的配置以及执行结果如下图所示。