覆盖主要内容
版本: 6.1.0

随机森林

组件介绍

**“随机森林”(Random Forest)**控件使用决策树集合进行预测。可用于分类任务或回归任务。

随机森林是一种用于分类、回归和其他任务的集合学习方法。由 Tin Kam Ho 首先提出,并由 Leo Breiman (Breiman,2001) 和 Adele Culter 进一步发展。随机森林构建了一组决策树,每棵树都是从训练数据的 bootstrap 样本开发而来的。在开发独立的树时,绘制任意属性子集,从中选择分割的最佳属性。最终的模型是基于森林中独立的树的大多数投票。随机森林适合用于分类和回归任务。


  • 输入:
    • data:数据集
    • pre: 预处理方法
  • 输出:
    • lrn: 在交互页面中配置参数后的随机森林学习算法
    • mod: 已训练的模型(仅当输入端data存在时,才会有输出信息)

页面介绍

点击**“随机森林”(Random Forest)**控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
模型名称

设置模型名称,用于在其他组件中区分不同的模型

取值范围Random Forest
树的数量

随机森林模型中树的个数

1~100010
每次拆分时考虑的属性数

若未指定“随机发生器的固定种子”,则此数字等于数据中属性数量的平方根

2~503
使用随机种子

控制建树时的随机性

勾选/不勾选勾选
限制单颗树木的深度

单颗树的最大深度

1~505
小于子集的树目停止划分

最大叶子结点数

2~100010

RandomForestClassifier详细参数说明

RandomForestRegressor详细参数说明

使用案例

在下图所示的案例中,使用**“加载文件”(File)控件加载数据集,连接“随机森林”(Random Forest)控件构建模型,之后把“加载文件”(File)控件以及“随机森林”(Random Forest)控件与“预测”(Predictions)**控件连接起来查看预测的结果。

案例中加载 iris 数据集,**“随机森林”(Random Forest)**控件参数使用默认值。案例中控件的配置以及执行结果如下图所示。