版本: 下个版本

混淆矩阵

组件介绍

**“混淆矩阵”（Confusion Matrix）**控件显示预测类和实际类之间的比例。

混淆矩阵是一种特殊的, 具有两个维度的（实际和预测）列联表（英语：contingency table），并且两维度中都有着一样的类别的集合。从混淆矩阵可得出预测类和实际类之间实例的数量或比例。通过这种方式可以得到哪些实例被错误分类以及被分成了哪一类。矩阵的每一列代表一个类的实例预测，而每一行表示一个实际的类的实例。

输入：
- evr：分类器对数据的测试结果
输出：
- 无

页面介绍

点击**“混淆矩阵”（Confusion Matrix）**控件查看参数配置页面，如下图所示：

点击**“查看结果”**按钮，查看曲线：

参数选项

选项	说明	样例值
分类器	要评估的数据挖掘模型，当选择后会绘制该模型的混淆矩阵	要评估的数据挖掘模型
显示	选择在矩阵中显示的数据：实例个数：以数字形式显示正确和不正确的分类实例预测的概率：显示分类的真实类别是多少实际的概率：显示与预测概率相反的关系	实例个数预测的概率实际的概率	实例个数

使用案例

在下图所示的案例中，使用**“加载文件”（File）控件加载数据，使用“K近邻”（KNN）、“决策树”（Tree）、“逻辑回归”（Logistic Regression）等模型在“评分和测试”（Test & Score）控件中进行测试和评估，最后将评估结果在“混淆矩阵”（Confusion Matrix）**控件中进行展示。

案例中加载 titanic 数据集，针对**“K近邻”（KNN）、“决策树”（Tree）、“逻辑回归”（Logistic Regression）算法进行测试和评估，“评分和测试”（Test & Score）显示每个分类器的评估结果。然后根据“评分和测试”（Test & Score）的结果绘制混淆矩阵，以进一步交叉验证算法的预测结果。“混淆矩阵”（Confusion Matrix）**可以查看有多少实例被错误分类以及错误的类型，案例中控件的配置以及执行结果如下图所示。

组件介绍​

页面介绍​

参数选项​

使用案例​

组件介绍

页面介绍

参数选项

使用案例