多分类任务的混淆矩阵数据挖掘机器学习分类算法

今天我将讨论如何在多分类中使用混淆矩阵评估模型的性能。
什么是混淆矩阵？
它显示了实际值和预测值之间的差异。它告诉我们有多少数据点被正确预测，哪些数据点没有被正确预测。对于多分类来说，它是一个 N N 矩阵，其中 n 是编号。输出列中的类别，也称为目标属性。一二分类任务中包含了 2 个类也就是一个 22 矩阵，一般情况下介绍混淆矩阵都会以二分类为例。如果有 3 个类呢？那么将得到一个 3*3 矩阵依此类推。通过上面描述我们知道，混淆矩阵的类将具有相同数量的行和列。
【多分类任务的混淆矩阵】下面让我们尝试了解一些常用术语，有 TP(True Positive)、FP(False Positive)、False Positive 和 FN(False Negative)。
我们将使用一个 3 x 3 矩阵，我们将使用我将向您展示的技巧计算 TP、TN、FP、FN 值。这个技巧也可以应用于 44、55…N*N 矩阵。
考虑这个混淆矩阵在下图 1 中的数据集的输出列中具有 A、B、C 类。

文章图片

我们将尝试计算 A 类的TP(True Positive)、FP(False Positive)、False Positive 和 FN(False Negative)的值
TP TruePositive(A)：它告诉实际值和预测值相同。A 类的TP只不过是实际值和预测值相同，这意味着单元格 1 的值为 15。
FP FalsePositive(A)：它告诉实际值是负的，在我们的例子中它是 B 类和 C 类，但模型预测它是正的，即 A 类。它是除了 TP 值之外的相应列的值的相加。
FalsePositive(A) = (单元格 4 + 单元格 7)：7+2=9
TN TrueNegative(A)：实际值和预测值的含义相同，对于 A：B 类和 C 类是负分类。它是所有非A行和列的值相加。
TrueNegative(A) = (单元格 5 + 单元格 6 + 单元格 8 + 单元格 9)：15 + 8 +3 + 45= 71
FN FalseNegative(A)：实际值在我们的例子中是正的，它是 A 类，但模型预测它是负的，即 B 类和 C 类。可以通过除 TP 值之外的相邻行来计算的。
FalseNegative(A) = (单元格 2 + 单元格 3)：2 + 3= 5
常用指标现在是计算 A 类的 Precision、Recall 和 Accuracy 的时候了。
精度Precision：“模型认为正确且确实是正确的样本占模型认为正确的所有样本的概率”
Precision (A) = 正确预测 / 总预测 = 15/24 = 0.625
召回Recall ：“模型认为正确且确实是正确的样本占模型认为正确的所有样本的概率”
Recall (A)= 正确分类 / 总实际值 = 15/20 = 0.75
正确率Accuracy ：被分对的样本数除以所有的样本数
Accuracy (A) = 正确分类的总数 / 实际分类的总数 = （15 + 15+ 45）/100 = 0.75
同样，可以计算 B 类和 C 类的 TP、FP、FN、TN、Precision、Recall
作者：Akash Borgalli

多分类任务的混淆矩阵

推荐阅读

冬月是农历几月份农历的冬月是几月

陌生人社交软件分析,可以给陌生人打电话的社交软件

南京交通职业技术学院怎么样好不好南京交通职业技术学院怎么样

宝宝的腿是弯曲的，这种现象正常吗？会不会影响宝宝下肢的发育？

如何看翡翠的真假

成语小秀才192关攻略 192关答案是什么

骨干教师申请书

Java集合练习题——从控制台输入若干个字母放入集合中，将这些字母排序后（忽略大小写）打印出来

mongodb显示所有数据库 mongodb开启数据库

榴莲可以放冰箱冷藏吗

如何保养上海罗杰杜彼自动机械表

如何取消安卓系统更新提示更新提示信息吗,系统更新怎么操作?

王者六字名字温柔女生王者六字名字温柔

海尔电热水器质量好不好海尔热水器怎么样

ocr，信息技术中OCR是什么

红麻薯放冰箱冷藏好吗麻薯要放冰箱冷藏吗

大金中央空调不启动解决故障排除图解,这些方面需要注意了

核心交换机接入路由器配置华为三层交换机配置实例

刘备封黄忠为后将军，关羽为何要破口大骂?

云顶之弈卡莎阵容推荐云顶之弈卡莎阵容怎么搭配