混淆矩阵

混淆矩阵

leesong

2024 年 06 月 16 日

657 次浏览

暂无评论

2695字数

学习记录

原理：

混淆矩阵（Confusion Matrix）是一个用于评价分类模型性能的工具，尤其在二分类和多分类问题中广泛使用。它通过对比模型预测结果与实际结果，展示了分类模型在各个类别上的表现情况。混淆矩阵的每一列代表预测类别，每一行代表实际类别。

对于二分类问题，混淆矩阵是一个 2x2 的方阵，包含以下四个要素：

真阳性（True Positive, TP）：模型正确预测为正类的数量。
真阴性（True Negative, TN）：模型正确预测为负类的数量。
假阳性（False Positive, FP）：模型错误预测为正类的数量（实际为负类）。
假阴性（False Negative, FN）：模型错误预测为负类的数量（实际为正类）。

混淆矩阵帮助我们了解模型的分类错误情况，可以计算出一系列性能指标，如准确率、精确率、召回率和F1分数等。

公式：

通过混淆矩阵，可以计算多种性能指标：

准确率（Accuracy）

$\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}$

精确率（Precision）

精确率衡量的是模型预测为正类的样本中实际为正类的比例。

$\text{Precision} = \frac{TP}{TP + FP}$

召回率（Recall）

召回率（Recall），又称为灵敏度（Sensitivity）或真阳性率（True Positive Rate），是评估分类模型性能的重要指标之一。它衡量的是模型在检测正类样本（例如，患病患者）方面的能力，即模型在实际正类样本中正确预测为正类的比例。

$\text{Recall} = \frac{TP}{TP + FN}$

F1分数（F1 Score）

F1分数是召回率和精确率的调和平均数，用于综合评价模型的性能。

$\text{F1 Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$

特异度（Specificity）

特异度（Specificity），又称为真负率（True Negative Rate），是分类模型性能评估的一个重要指标。它衡量的是模型在识别负类样本（例如，未患病患者）方面的能力，即模型在实际负类样本中正确预测为负类的比例。

$\text{Specificity} = \frac{TN}{TN + FP}$

示例：

假设我们有一个分类模型，用于预测某种疾病的存在。我们有以下分类结果：

实际患病的患者数量为50，其中模型正确预测为患病的数量（TP）为40，错误预测为未患病的数量（FN）为10。
实际未患病的患者数量为50，其中模型正确预测为未患病的数量（TN）为45，错误预测为患病的数量（FP）为5。

构建混淆矩阵如下：

实际\ 预测	患病 (Positive)	未患病 (Negative)
患病 (Positive)	40 (TP)	10 (FN)
未患病 (Negative)	5 (FP)	45 (TN)

根据混淆矩阵计算性能指标：

准确率（Accuracy）

$\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN} = \frac{40 + 45}{40 + 45 + 5 + 10} = \frac{85}{100} = 0.85$

精确率（Precision）

$\text{Precision} = \frac{TP}{TP + FP} = \frac{40}{40 + 5} = \frac{40}{45} \approx 0.89$

召回率（Recall）

$\text{Recall} = \frac{TP}{TP + FN} = \frac{40}{40 + 10} = \frac{40}{50} = 0.80$

F1分数（F1 Score）

$\text{F1 Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} = 2 \times \frac{0.89 \times 0.80}{0.89 + 0.80} \approx 2 \times \frac{0.712}{1.69} \approx 0.84$

特异度（Specificity）

$\text{Specificity} = \frac{TN}{TN + FP} = \frac{45}{45 + 5} = \frac{45}{50} = 0.90$

总结：

混淆矩阵是评估分类模型性能的关键工具，具有以下重要性：

全面性：提供了分类模型在每个类别上的详细表现，能够深入了解模型的错误类型和分布。
多指标计算：可以从混淆矩阵中衍生出多种性能指标（如准确率、精确率、召回率、F1分数等），帮助全面评估模型性能。
适用性广泛：适用于二分类、多分类和多标签分类任务。

应用场景

混淆矩阵广泛应用于各种分类任务中，包括但不限于：

医疗诊断：评估疾病预测模型的性能。
图像分类：评估计算机视觉模型在图像分类任务中的表现。
垃圾邮件过滤：评估邮件分类器的效果。
信用评分：评估信用风险模型的准确性。

混淆矩阵不仅能揭示模型的整体准确性，还能显示模型在特定类别上的强弱点，为进一步优化模型提供指导。

混淆矩阵

leesong • 2024 年 06 月 16 日

原理：

公式：

准确率（Accuracy）

精确率（Precision）

召回率（Recall）

F1分数（F1 Score）

特异度（Specificity）

示例：

准确率（Accuracy）

精确率（Precision）

召回率（Recall）

F1分数（F1 Score）

特异度（Specificity）

总结：

应用场景

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

Docker 安装配置宝塔面板

淘宝镜像报错npm ERR!

SPA和MPA

Vue的核心特性

物理机Esxi 6.7安装教程

SPA和MPA

WIFI图标消失的排查思路

Ubuntu升级OpenSSH

Git 问题合集

计算机意外地重新启动或遇到错误，windows安装无法继续

混淆矩阵

原理：

公式：

准确率（Accuracy）

精确率（Precision）

召回率（Recall）

F1分数（F1 Score）

特异度（Specificity）

示例：

准确率（Accuracy）

精确率（Precision）

召回率（Recall）

F1分数（F1 Score）

特异度（Specificity）

总结：

应用场景

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

混淆矩阵

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款