当前位置：首页 > article >正文

【漫话机器学习系列】027.混淆矩阵（confusion matrix）

article 2025/3/1 7:03:47

混淆矩阵（Confusion Matrix）

混淆矩阵是机器学习中评估分类模型性能的一种工具，特别是在多类别分类问题中。它通过对比模型预测结果和真实标签，帮助我们理解模型的分类效果。

1. 混淆矩阵的结构

混淆矩阵通常是一个二维表格，用于总结分类模型的预测结果。对于二分类问题，混淆矩阵的结构如下：

	预测为正类 (Positive)	预测为负类 (Negative)
实际为正类 (Positive)	真正例 (True Positive, TP)	假负例 (False Negative, FN)
实际为负类 (Negative)	假正例 (False Positive, FP)	真负例 (True Negative, TN)

True Positive (TP)：预测为正类，实际也为正类。
False Positive (FP)：预测为正类，实际为负类。
True Negative (TN)：预测为负类，实际也为负类。
False Negative (FN)：预测为负类，实际为正类。

2. 多类别分类的混淆矩阵

在多类别分类问题中，混淆矩阵的维度会变大。假设我们有 N 个类别，那么混淆矩阵将是一个 N×N 的方阵，其中每个元素 $M_{i,j}$ 表示真实类别为 i 的样本被预测为类别 j 的次数。

	类别1	类别2	...	类别N
类别1	TP1	FP2	...	FPN
类别2	FN1	TP2	...	FP2
...	...	...	...	...
类别N	FNN-1	FPN-2	...	TPN

3. 从混淆矩阵中提取指标

通过混淆矩阵，可以计算出多种评价指标，帮助我们全面了解模型的性能：

3.1 精度（Accuracy）

精度是指所有预测正确的比例：

$Accuracy = \frac{TP + TN}{TP + TN + FP + FN}$

3.2 精确率（Precision）

精确率是指预测为正类的样本中，实际为正类的比例：

$Precision = \frac{TP}{TP + FP}$

3.3 召回率（Recall）

召回率是指实际为正类的样本中，正确预测为正类的比例：

$Recall = \frac{TP}{TP + FN}$

3.4 F1 分数（F1 Score）

F1 分数是精确率和召回率的调和平均值，综合了这两者的性能：

$F1 Score = 2 \times \frac{Precision \times Recall}{Precision + Recall}$

3.5 特异度（Specificity）

特异度是指实际为负类的样本中，正确预测为负类的比例：

$Specificity = \frac{TN}{TN + FP}$

3.6 假阳性率（False Positive Rate）

假阳性率是指实际为负类的样本中，错误预测为正类的比例：

$False Positive Rate = \frac{FP}{TN + FP}$

4. 混淆矩阵的应用

混淆矩阵不仅能够帮助我们了解分类模型的整体表现，还能揭示模型的优缺点。例如：

高精确率表示模型对正类的预测较为准确，假正例较少。
高召回率表示模型对正类的检测能力强，假负例较少。
F1分数则能够在精确率和召回率之间取得平衡，特别是在类别不平衡的情况下，F1分数更加重要。

混淆矩阵对于解决类不平衡问题、模型调优和理解模型的失败案例都具有重要作用。

5. 示例

假设有一个二分类问题，混淆矩阵如下：

	预测为正类	预测为负类
实际为正类	80	20
实际为负类	30	70

TP (真正例) = 80
FP (假正例) = 30
TN (真负例) = 70
FN (假负例) = 20

使用这些值计算各个指标：

精度 = $\frac{80 + 70}{80 + 70 + 30 + 20} = \frac{150}{200} = 0.75$
精确率 = $\frac{80}{80 + 30} = \frac{80}{110} \approx 0.727$
召回率 = $\frac{80}{80 + 20} = \frac{80}{100} = 0.8$
F1分数 = $2 \times \frac{0.727 \times 0.8}{0.727 + 0.8} \approx 0.762$

总结

混淆矩阵是评估分类模型的重要工具，它通过对比模型的预测结果和实际标签，帮助我们深入理解模型的表现，尤其是在处理不平衡数据集时。通过从混淆矩阵中计算出的精度、精确率、召回率和F1分数等指标，我们可以全面评估模型的优缺点，并进行针对性的优化。

查看全文

http://www.kler.cn/a/463598.html

计算机网络•自顶向下方法：DHCP、NAT、IPV6

大模型WebUI：Gradio全解系列8——Additional Features：补充特性（下）

如何将vCenter6.7升级7.0？

vSAN手动平衡磁盘

对比一下Java和go的unsafe包

【电路笔记】-德摩根定理

pycharm+anaconda创建项目

短视频矩阵系统前端搭建技术解析，支持OEM

React之从0开始（1）

Nginx搭建Web网站

玩转树莓派Pico(21): 迷你气象站7——软件整合改进2

基于SSM（Spring + Spring MVC + MyBatis）框架的旅游资源网站

git reset --hard（重置到当前提交，所有未提交的更改都会被永久丢弃）

ubuntu中zlib安装的步骤是什么

运维人员的Go语言学习路线

初学stm32---高级定时器输出n个pwm波

无人机无法返航紧急处理方式！

Redis - 1 ( 11000 字 Redis 入门级教程 )

Linux性能优化-网络篇-NAT详解

基于Docker+模拟器的Appium自动化测试（二）