当前位置：首页 > article >正文

机器学习 - 如何理解函数集合中的准确性、召回率、F1分数呢？

article 2025/1/13 0:34:37

在机器学习中，准确性（Accuracy）、召回率（Recall）、和F1分数是常用的模型性能评价指标，它们从不同的角度衡量模型的表现。要理解它们，首先需要了解它们的定义和适用场景：

1. 基本概念：分类问题中的混淆矩阵

混淆矩阵是分类问题中计算这些指标的基础，它展示了模型预测结果与实际标签之间的对比。以下是一个二分类问题的混淆矩阵：

	预测为正类（Positive）	预测为负类（Negative）
实际为正类	真正类（TP）	假负类（FN）
实际为负类	假正类（FP）	真负类（TN）

TP（True Positive）：模型正确地预测为正的样本数。
FN（False Negative）：模型错误地预测为负的正样本数。
FP（False Positive）：模型错误地预测为正的负样本数。
TN（True Negative）：模型正确地预测为负的样本数。

2. 准确性（Accuracy）

定义

准确性是所有正确预测（包括正类和负类）占总样本的比例。

优点

简单直观，适合类分布平衡的情况。

缺点

对于类别不平衡的问题不敏感。例如，在99%的样本都是负类的情况下，模型全预测为负类也能有99%的准确性，但实际上完全无效。

适用场景

类别分布均衡，且正负类的重要性相当时。

3. 召回率（Recall）

定义

召回率是实际为正类的样本中，模型正确预测为正类的比例。

优点

更关注正类的覆盖率，适合需要降低漏判率的场景。

缺点

不考虑假正类（FP）的数量，可能导致过多错误预测为正类。

适用场景

敏感任务：如疾病检测、垃圾邮件检测、金融风控等，对漏报成本较高时。
- 例如：医疗诊断中，漏诊（FN）可能导致严重后果，因此优先提高召回率。

4. 精确率（Precision）

定义

精确率是模型预测为正类的样本中，真正为正类的比例。

优点

更关注模型预测结果的可信度，适合降低误报率的场景。

缺点

不考虑假负类（FN）的数量，可能导致低覆盖率。

适用场景

严格任务：如信用卡欺诈检测、推荐系统等，对误报成本较高时。
- 例如：风控中，过多的假正类（FP）可能导致业务资源浪费，因此需要高精确率。

5. F1分数

定义

F1分数是精确率和召回率的调和平均数，用于权衡二者：

优点

综合考虑精确率和召回率，适合需要平衡两者的场景。

缺点

如果任务对精确率或召回率有不同的侧重，F1分数可能不完全反映需求。

适用场景

精确率和召回率同等重要时。
- 例如：文本分类、舆情分析等，需要兼顾正类的覆盖率和预测准确性。

6. 示例说明

场景：垃圾邮件分类

假设共有100封邮件：

其中20封是垃圾邮件，80封是正常邮件。
模型预测结果如下：
- TP = 15（15封垃圾邮件被正确预测为垃圾邮件）
- FN = 5（5封垃圾邮件被预测为正常邮件）
- FP = 10（10封正常邮件被预测为垃圾邮件）
- TN = 70（70封正常邮件被正确预测为正常邮件）

计算：

7. 如何选择指标？

优先准确性：适合类分布平衡且误分类成本相当的场景（如图像分类、语音识别）。
优先召回率：适合正类漏判成本高的场景（如医疗诊断、风控审核）。
优先精确率：适合负类误判成本高的场景（如广告推荐、信用欺诈检测）。
优先F1分数：适合需要精确率和召回率平衡的场景。

准确性、召回率和F1分数是从不同角度衡量模型的性能。在选择使用哪个指标时，需要结合任务需求、错误代价和类别分布综合考量。对于实际问题，通常不仅关注单一指标，还需综合使用多个指标来全面评价模型表现。

附：对调和平均数和算数平均数的理解：

F1分数中的调和平均数是一种用来综合两个指标（通常是精确率 Precision 和召回率 Recall）的数学方法。相比算术平均数，调和平均数对两个值之间的平衡性要求更高，更加关注较小的值。

1. 调和平均数的定义

2、调和平均数 vs. 算术平均数

3. 为什么F1分数使用调和平均数？

4. 示例分析

假设一个分类模型的精确率和召回率如下：

模型A：精确率 = 0.8，召回率 = 0.2
模型B：精确率 = 0.5，召回率 = 0.5

计算F1分数：

调和平均数在F1分数中的作用是综合两个指标的表现，同时更关注较小值，只有当精确率和召回率同时较高时，F1分数才会高。
这使得F1分数成为一个能够平衡精确率和召回率的指标，适用于模型需要兼顾两者的场景，尤其是在分类问题中。

查看全文

http://www.kler.cn/a/500042.html

【面试题】技术场景 4、负责项目时遇到的棘手问题及解决方法

git提交

JS爬虫实战演练

最近在盘gitlab.0.先review了一下docker

TypeError: Cannot create a consistent method resolution order (MRO) for

Tkinter组件-Button按键

升级 Spring Boot 3 配置讲解 — 新版本的秒杀系统怎么做？

【物流管理系统 - IDEAJavaSwingMySQL】基于Java实现的物流管理系统导入IDEA教程

R语言在森林生态研究中的魔法：结构、功能与稳定性分析——发现数据背后的生态故事！

计算机网络（四）网络层

探秘MetaGPT：革新软件开发的多智能体框架

homework 2025.01.11 math 6

Chrome_60.0.3112.113_x64 单文件版下载

drawDB docker部属

开源库：jcon-cpp

HTML和CSS相关的问题，为什么某些元素的字体无法加载？

深度学习与大数据的结合：挑战与机遇

协同过滤算法绿色食品推荐系统｜Java｜SSM｜VUE｜

代码随想录算法训练营第三十二天|509.斐波那契数、70.爬楼梯、746.使用最小花费爬楼梯

STM32从零开始深入学习

DBeaver执行本地的sql语句文件避免直接在客户端运行卡顿

php 二维数组根据其他字段值是否相同来进行去重

IOS HTTPS代理抓包工具使用教程

学会使用computed计算属性与watch监听(小白学习笔记)

1. 基本概念：分类问题中的混淆矩阵

2. 准确性（Accuracy）

定义

优点

缺点

适用场景

3. 召回率（Recall）

定义

优点

缺点

适用场景

4. 精确率（Precision）

定义

优点

缺点

适用场景

5. F1分数

定义

优点

缺点

适用场景

6. 示例说明

场景：垃圾邮件分类

计算：

7. 如何选择指标？

1. 调和平均数的定义

3. 为什么F1分数使用调和平均数？

4. 示例分析

计算F1分数：

相关文章：