覆盖主要内容
版本: 下个版本

Lift曲线

组件介绍

**“Lift曲线”(Lift Curve)**控件根据随机分类器来衡量所选分类器的性能。

Lift曲线展示了预测为真的实例数量与确实为真的实例数量之间的关系,从而可以确定最佳的分类器及其阈值。图中的 x 轴为累计实例占比,y 轴为累计真阳性(预测正确)实例占比。


  • 输入:
    • evr:分类器对数据的测试结果
  • 输出:

页面介绍

点击**“Lift曲线”(Lift Curve)**控件查看参数配置页面,如下图所示:

点击**“查看结果”**按钮,查看曲线:

参数选项

选项说明取值范围样例值
目标类

离散目标属性的取值

离散目标属性的取值默认选中的值是离散目标属性取值的第一个
分类器

要评估的数据挖掘模型,选择后系统会绘制对应的Lift曲线

要评估的数据挖掘模型,支持多选
显示升力凸包

为所有分类器绘制凸起曲线,曲线显示了每个期望的真阳率/阳率的最佳分类器

勾选/不勾选不勾选

使用案例

在下图所示的案例中,使用**“加载文件”(File)控件加载数据,使用“K近邻”(KNN)“决策树”(Tree)“逻辑回归”(Logistic Regression)等模型在“评分和测试”(Test & Score)控件中进行测试和评估,最后将评估结果在“Lift曲线”(Lift Curve)**控件中进行展示。

案例中加载 titanic 数据集,针对**“K近邻”(KNN)“决策树”(Tree)“逻辑回归”(Logistic Regression)算法进行模型测试和评估,“评分和测试”(Test & Score)显示每个分类器的评估结果。然后根据“评分和测试”(Test & Score)的结果绘制升力曲线。在下面的例子中,我们试图看到 titanic 数据集上“幸存者”的预测质量。本例在“评分和测试”(Test & Score)控件中比较了三个分类器,并将结果送发到“Lift曲线”(Lift Curve)**控件以查看其随机模型的性能,从图中可看到决策树是三者中最好的。因此可以将其设置为最优分类的阈值。案例中控件的配置以及执行结果如下图所示。