版本: 下个版本

随机森林

组件介绍

**“随机森林”（Random Forest）**控件使用决策树集合进行预测。可用于分类任务或回归任务。

随机森林是一种用于分类、回归和其他任务的集合学习方法。由 Tin Kam Ho 首先提出，并由 Leo Breiman (Breiman，2001) 和 Adele Culter 进一步发展。随机森林构建了一组决策树，每棵树都是从训练数据的 bootstrap 样本开发而来的。在开发独立的树时，绘制任意属性子集，从中选择分割的最佳属性。最终的模型是基于森林中独立的树的大多数投票。随机森林适合用于分类和回归任务。

输入：
- data：数据集
- pre: 预处理方法
输出：
- lrn: 在交互页面中配置参数后的随机森林学习算法
- mod: 已训练的模型（仅当输入端data存在时，才会有输出信息）

页面介绍

点击**“随机森林”（Random Forest）**控件查看参数配置页面，如下图所示：

参数选项

选项	说明	取值范围	样例值
模型名称	设置模型名称，用于在其他组件中区分不同的模型	取值范围	Random Forest
树的数量	随机森林模型中树的个数	1~1000	10
每次拆分时考虑的属性数	若未指定“随机发生器的固定种子”，则此数字等于数据中属性数量的平方根	2~50	3
使用随机种子	控制建树时的随机性	勾选/不勾选	勾选
限制单颗树木的深度	单颗树的最大深度	1~50	5
小于子集的树目停止划分	最大叶子结点数	2~1000	10

RandomForestClassifier详细参数说明

RandomForestRegressor详细参数说明

使用案例

在下图所示的案例中，使用**“加载文件”（File）控件加载数据集，连接“随机森林”（Random Forest）控件构建模型，之后把“加载文件”（File）控件以及“随机森林”（Random Forest）控件与“预测”（Predictions）**控件连接起来查看预测的结果。

案例中加载 iris 数据集，**“随机森林”（Random Forest）**控件参数使用默认值。案例中控件的配置以及执行结果如下图所示。

组件介绍​

页面介绍​

参数选项​

使用案例​

组件介绍

页面介绍

参数选项

使用案例