对Precision和Recall再理解 - Jiaxiang Li's Blog

显然， $P r e c i s i o n = \frac{T P}{T P + F P} \overset{c a r e}{\to} F P$ 和 $R e c a l l = \frac{T P}{T P + F N} \overset{c a r e}{\to} F N$ 。举一个例子， $\begin{matrix} P r e d \\ 1 & 0 \\ A c t u a l & = 2 & 1 & T P & F N \\ = 98 & 0 & F P & T N \end{matrix}$

假设真实样本中2个 $y = 1$ ，98个 $y = 0$ 。那么 $A c c$ 是有激励多预测 $\hat{y} = 0$ 。导致 $T N$ 和 $F N$ 上升，而 $T P$ 和 $F P$ 下降的。这反映为 $R e c a l l = \frac{T P ↓}{T P ↓ + F N ↑} \to R e c a l l ↓$ 。

如何理解，就是直觉？

这个公式是从文本检索出来的。如， $T P + F P$ 换言之，都是 $\hat{y} = T R U E$ ，因此是Retrived documents，检索出来的文档，也就是预测出来的。 $T P + F N$ 换言之，都是 $y = T R U E$ ，因此是Relevant documents，也就是真实的文档。 $T P$ 换言之，都是 $y = \hat{y} = T R U E$ 。因此， $P r e c i s i o n = \frac{R e l e v a n t \cap R e t r i v e d}{R e t r i v e d}$ ， $R e c a l l = \frac{R e l e v a n t \cap R e t r i v e d}{R e l e v a n t}$ 。这个就更形象了。