当前位置: 首页 > article >正文

【漫话机器学习系列】070.汉明损失(Hamming Loss)

汉明损失(Hamming Loss)

汉明损失是多标签分类问题中的一种评价指标,用于衡量预测结果与实际标签之间的差异。它定义为预测错误的标签比例,即错误标签的个数占总标签数量的比值。

在多标签分类中,每个样本可以属于多个类别,因此汉明损失对每个样本的每个类别进行独立评估,而不关心类别之间的相关性。


公式

假设:

  • n 是样本总数。
  • L 是类别总数。
  • 是第 i 个样本的真实标签向量。
  • 是第 i 个样本的预测标签向量。

汉明损失的定义为:

其中:

  • 是指示函数,当真实标签 与预测标签 不相等时,取值为 1,否则为 0。

汉明损失的取值范围为 [0, 1],值越小表示预测越准确。


解释

  • 全对:如果预测完全正确(每个样本的每个标签都正确),汉明损失为 0。
  • 全错:如果预测完全错误(所有标签都被错误预测),汉明损失为 1。

示例

假设有 3 个样本和 4 个类别(标签):

真实标签矩阵 Y:

预测标签矩阵

逐元素比较错误标签数:

错误标签总数为 3,总标签数为

汉明损失:


代码实现

以下是 Python 中的实现代码:

import numpy as np
from sklearn.metrics import hamming_loss

# 定义真实标签矩阵和预测标签矩阵
Y = np.array([
    [1, 0, 1, 0],
    [0, 1, 1, 0],
    [1, 1, 0, 0]
])

Y_pred = np.array([
    [1, 0, 0, 0],
    [0, 1, 0, 0],
    [1, 0, 0, 0]
])

# 计算汉明损失
hamming_loss_value = hamming_loss(Y, Y_pred)
print("汉明损失:", hamming_loss_value)

 

运行结果:

汉明损失: 0.25

 


优点

  1. 适用于多标签分类:汉明损失能够很好地处理多标签分类任务中的标签不平衡问题。
  2. 直观:它计算错误标签的比例,容易理解和解释。

缺点

  1. 忽略标签相关性:汉明损失将每个标签独立处理,无法捕捉类别之间的关系。
  2. 对类别数敏感:类别数多时,错误标签可能占比更高。

应用场景

  1. 多标签分类问题:如文本分类(一个文本可能属于多个类别)。
  2. 多目标预测问题:如图像标注(图像可能含有多种物体标签)。

汉明损失是多标签分类中一种重要的评价指标,通常与其他指标(如准确率、宏平均 F1 值等)结合使用,以全面评估模型性能。

 


http://www.kler.cn/a/526245.html

相关文章:

  • Linux《基础指令》
  • 初始化mysql报错cannot open shared object file: No such file or directory
  • 前端axios拦截器
  • 51单片机开发:串口通信
  • 【MQ】RabbitMq的可靠性保证
  • 代码随想录算法训练营第三十八天-动态规划-完全背包-279.完全平方数
  • 《DeepSeek 实用集成:大模型能力接入各类软件》
  • 【memgpt】letta 课程6: 多agent编排
  • 开源PDF分割合并工具 PDFsam Basic v5.3.0绿色版
  • 归并排序练习
  • 深入解析 JPA 实体生命周期回调
  • (0基础版,无需输入代码爬取)新手小白初步学习八爪鱼采集器
  • 图论——spfa判负环
  • 【ArcGIS微课1000例】0141:提取多波段影像中的单个波段
  • Hive:窗口函数[ntile, first_value,row_number() ,rank(),dens_rank()]和自定义函数
  • linux的/proc 和 /sys目录差异
  • [NVME] PMRCAP-Persistent Memory Region Capabilities
  • 10.4 字符编码和解码
  • 一文大白话讲清楚webpack进阶——8——Module Federation
  • 学习:ASCII码是计算机中用得最广泛的字符集及其编码
  • 算法总结-哈希表
  • Ansys Maxwell:采用对称性的双转子轴向磁通电机
  • 【AI论文】BIOMEDICA:一个源自科学文献的开放生物医学图像-标注档案、数据集及视觉-语言模型
  • 从零开始学习安时积分法(STM32实现程序)
  • Databricks:统一的数据和 AI 平台
  • docker安装nacos2.2.4详解(含:nacos容器启动参数、环境变量、常见问题整理)