2.10. evaluate评估¶

2.10.1. 评估指标¶

首先，为了更清晰地理解这三个概念，我们先明确一些基础定义:

真正例（TP）：模型预测为正，实际也为正
假正例（FP）：模型预测为正，但实际为负
真反例（TN）：模型预测为负，实际也为负
假反例（FN）：模型预测为负，但实际为正

总结来说，准确率是一个全局的指标，它考虑了所有类别的分类结果；而精确率和召回率则更侧重于正样本的分类效果。精确率关注预测为正样本的实例中有多少是真正的正样本，而召回率则关注所有正样本中有多少被模型预测出来。在实际应用中，我们通常会根据具体的任务需求来选择合适的评估指标。

准确率是分类模型正确分类的样本数占总样本数的比例。计算公式为:

准确率 = (TP + TN) / (TP + FP + TN + FN)

准确率是一个简单直观的指标，但它可能在一些特定场景下并不那么有用，比如当正负样本数量极度不平衡时。
例如，在一个信用卡欺诈检测系统中，正常交易（负样本）的数量可能远大于欺诈交易（正样本）的数量。在这种情况下，即使模型将所有的交易都预测为正常，准确率也会非常高，但这显然不是一个好的欺诈检测模型。

精确率表示模型预测为正样本的实例中，真正为正样本的比例。计算公式为:

精确率 = TP / (TP + FP)

精确率关注的是预测为正样本的实例中，有多少是真正的正样本。在上面的信用卡欺诈检测例子中，我们希望模型预测的欺诈交易中有尽可能多的真实欺诈交易，即精确率要高。
精确率衡量的是所有被分类为欺诈的交易中，真正是欺诈的比例。在信用卡欺诈检测中，如果精确率很高，则分类为欺诈的交易中，绝大多数确实是欺诈，这可以降低误报率，减少对客户的不必要困扰和调查。

召回率表示所有实际为正样本的实例中，被模型预测为正样本的比例。计算公式为:

召回率 = TP / (TP + FN)

召回率关注的是所有正样本中，有多少被模型正确地预测出来。在信用卡欺诈检测中，我们希望尽可能多地找出所有的欺诈交易，即使这意味着可能会误判一些正常交易，即召回率要高。
召回率衡量的是所有实际欺诈交易中，被正确分类为欺诈的比例。在信用卡欺诈检测中，高召回率意味着检测到了更多的欺诈交易，减少了漏报率，有助于防止欺诈行为。