机器学习常见评价指标 -- 混淆矩阵 & Precision(精确度) & Recall(召回率) & Accuracy(准确度)

温故而知新,可以为师矣-- 《论语》
1、混淆矩阵(confusion matrix)
真实情况 预测结果
正例 反例
正例 TP(True Positive,真正例) FN(False Negative,假反例)
反例 FP(False Positive,假正例) TN(True Negative,真反例)
在上面的矩阵中,TP+FN+FP+TN=样本总数。
2、Precision(精确度,查准率),Recall(召回率,查全率),Accuracy(准确度)
以混淆矩阵为基础,可以导出两个评价预测结果的指标,分别为Precision(精确度,查准率)和Recall(召回率,查全率),中文翻译有不同的版本,具体的计算公式如下。
Precison计算方法如下,
机器学习常见评价指标 -- 混淆矩阵 & Precision(精确度) & Recall(召回率) & Accuracy(准确度)
文章图片

实际上Precison就是预测正确的正样本(真实标签是正样本,预测结果也是正样本)的数量和预测结果中被标记为正样本的数量的比值。
Recall计算方法如下,
机器学习常见评价指标 -- 混淆矩阵 & Precision(精确度) & Recall(召回率) & Accuracy(准确度)
文章图片

实际上Recall就是预测正确的正样本的数量和所有真实标签是正样本的数量的比值。
Precision和Recall是一对矛盾的度量,一般来说Precision高时,Recall往往偏低,而Recall高时,Precision往往偏低。
另外还有一个常见的指标Accuracy(准确度),定义如下
机器学习常见评价指标 -- 混淆矩阵 & Precision(精确度) & Recall(召回率) & Accuracy(准确度)
文章图片

【机器学习常见评价指标 -- 混淆矩阵 & Precision(精确度) & Recall(召回率) & Accuracy(准确度)】实际上Accuracy就是预测正确的样本样本总量的比值。

    推荐阅读