ROC曲线
组件介绍
**“ROC曲线”(ROC Analysis)**控件展示测试模型和相应凸包的ROC 曲线。
ROC曲线用作分类模型之间的比较的平均值。该曲线在x轴上绘制假阳率与 y 轴上的真阳率。曲线越接近 ROC 空间的左侧边界和顶部边界,分类器越精确。ROC曲线还可以在一定误差下确定最优 分类器和阈值。
- 输入:
- evr:分类器对数据的测试结果
- 输出:
- 无
页面介绍
点击**“ROC曲线”(ROC Analysis)**控件查看参数配置页面,如下图所示:
点击**“查看结果”**按钮,查看曲线:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
目标类 | 离散目标属性的取值 | 离散目标属性的取值 | 默认选中的值是离散目标属性取值的第一个 |
分类器 | 要评估的数据挖掘模型,选择后系统会绘制对应的ROC曲线 | 要评估的数据挖掘模型,支持多选 | |
合并ROC曲线 | 当数据来自多次迭代的训练或测试(如 k-fold 交叉验证)时,可以显示平均结果。其中平均选 项包括: | 根据折数合并预测 | 根据折数合并预测 |
ROC凸包 | “显示凸曲线”选项是指显示每个单独分类器上的凸曲线 | 勾选/不勾选 | 不勾选 |
分析 | 此部分用于分析曲线,用户可以指定假阳性(FP)和假阴性(FN)的比重以及目标类别概率 | 假阳性代价:1 | 假阳性代价:500 |
使用案例
在下图所示的案例中,使用**“加载文件”(File)控件加载数据,使用“K近邻”(KNN)、“决策树”(Tree)等模型在“评分和测试”(Test & Score)控件中进行测试和评估,最后将评估结果在“ROC曲线”(ROC Analysis)**控件中进行展示。
案例中加载 voting 数据集,针对**“K近邻”(KNN)、“决策树”(Tree)算法进行模型测试和评估,“评分和测试”(Test & Score)显示每个分类器的评估结果。然后根据“评分和测试”(Test & Score)**的结果ROC曲线。案例中控件的配置以及执行结果如下图所示。