覆盖主要内容
版本: 下个版本

ROC曲线

组件介绍

**“ROC曲线”(ROC Analysis)**控件展示测试模型和相应凸包的ROC 曲线。

ROC曲线用作分类模型之间的比较的平均值。该曲线在x轴上绘制假阳率与 y 轴上的真阳率。曲线越接近 ROC 空间的左侧边界和顶部边界,分类器越精确。ROC曲线还可以在一定误差下确定最优分类器和阈值。


  • 输入:
    • evr:分类器对数据的测试结果
  • 输出:

页面介绍

点击**“ROC曲线”(ROC Analysis)**控件查看参数配置页面,如下图所示:

点击**“查看结果”**按钮,查看曲线:

参数选项

选项说明取值范围样例值
目标类

离散目标属性的取值

离散目标属性的取值默认选中的值是离散目标属性取值的第一个
分类器

要评估的数据挖掘模型,选择后系统会绘制对应的ROC曲线

要评估的数据挖掘模型,支持多选
合并ROC曲线

当数据来自多次迭代的训练或测试(如 k-fold 交叉验证)时,可以显示平均结果。其中平均选项包括:
  根据折数合并预测:将所有测试数据视为单次迭代结果
  平均真阳率:垂直平均曲线,显示相应的置信区间
  平均真阳率和假阳率阈值:遍历阈值,平均曲线的位置并显示水平和垂直置信区间
  显示单独曲线:显示所有曲线,而不计算平均值

根据折数合并预测
平均真阳率
平均真阳率和假阳率阈值
显示单独曲线

根据折数合并预测
ROC凸包

“显示凸曲线”选项是指显示每个单独分类器上的凸曲线
“显示凸包”选项显示结合了所有分类器的凸包

勾选/不勾选不勾选
分析

此部分用于分析曲线,用户可以指定假阳性(FP)和假阴性(FN)的比重以及目标类别概率
默认阈值(0.5)表示如果预测目标等级的概率大于等于 0.5,则由分类器实现ROC曲线上的点
显示性能曲线在 ROC 空间中显示出 iso 性能,因此该线上的所有点都会带来相同的利润/损失

假阳性代价:11000
假阴性代价:1
1000
目标类先验概率:0.01~0.99

假阳性代价:500
假阴性代价:500
目标类先验概率:0.5

使用案例

在下图所示的案例中,使用**“加载文件”(File)控件加载数据,使用“K近邻”(KNN)“决策树”(Tree)等模型在“评分和测试”(Test & Score)控件中进行测试和评估,最后将评估结果在“ROC曲线”(ROC Analysis)**控件中进行展示。

案例中加载 voting 数据集,针对**“K近邻”(KNN)“决策树”(Tree)算法进行模型测试和评估,“评分和测试”(Test & Score)显示每个分类器的评估结果。然后根据“评分和测试”(Test & Score)**的结果ROC曲线。案例中控件的配置以及执行结果如下图所示。