Toccata in Nowhere.

分类问题中的 准确率 Accuracy / 精确率 Precision / 召回率 Recall

2020.07.23

在分类问题中,准确率 Accuracy / 精确率 Precision / 召回率 Recall三者的关系和定义经常被忽略且混淆,本文作备忘用。

准确率 Accuracy

准确率是模型预测正确的结果所占的比例,是衡量定义一个分类方法准确性的基础。

定义如下:

$$\text{准确率}=\frac{\text{正确预测}}{\text{所有预测}}$$

精确率 Precision

精确率的含义为:在所有被识别为正类别(predict正)的样本中,真正的正类别(label正)的比例有多少;换言之,即 Prediction 中有多少正类别被准确预测。

数学表达如下:

$$\text{召回率}=\frac{\text{识别正确的正样本数}}{\text{所有识别为正的样本数}}$$

可以注意的是所有被识别为正的样本数包含了正确识别的正样本错误识别的正样本(实际上是负样本)。

召回率 Recall

召回率表示,在所有正类别(label正)的样本中,被识别为正类别(predict正)的比例有多少;

数学表达如下:

$$\text{召回率}=\frac{\text{识别正确的正样本数}}{\text{所有正样本数}}$$

对于召回率与准确率,分式的分子都是「识别正确的正样本数」即要求 predict正 符合 label正。分母则不同,准确率为所有识别为正样本的数量,召回率则是 label 中存在的正样本的数量


Reference

Google Machine Learning