当前位置: 首页 > article >正文

【机器遗忘之UNSIR算法】2023年IEEE Trans期刊论文:Fast yet effective machine unlearning

1 介绍

年份:2023

期刊:IEEE Transactions on Neural Networks and Learning Systems

引用量:170

Tarun A K, Chundawat V S, Mandal M, et al. Fast yet effective machine unlearning[J]. IEEE Transactions on Neural Networks and Learning Systems, 2023.

通过生成最大化误差的噪声矩阵和基于损伤-修复的权重操作来实现对特定类别数据的快速遗忘学习,关键步骤包括利用原始模型学习针对待遗忘类别的误差最大化噪声矩阵,然后通过损伤步骤使用高学习率和噪声矩阵剧烈改变模型权重以实现快速遗忘,以及通过修复步骤恢复模型整体性能,从而在保留整体模型准确性的同时实现对特定数据类别的有效遗忘。简而言之,通过学习针对特定类别的误差最大化噪声矩阵,并结合损伤修复步骤来操纵模型权重,从而实现在不重新训练整个模型的情况下快速有效地遗忘机器学习模型中的特定数据类别。

2 创新点

  1. 零观察隐私设置(Zero-Glance Privacy Setting)
    • 提出了一种在不观察完整训练数据的情况下进行机器学习的框架,这比现有的设置更为严格,为更高级别的隐私保护提供了可能性。
  2. 错误最大化噪声生成(Error-Maximizing Noise Generation)
    • 引入了一种新的机器学习框架,通过学习一个错误最大化的噪声矩阵来针对需要被遗忘的数据类别,这种噪声矩阵用于操纵模型权重以实现对目标数据类别的遗忘。
  3. 损伤修复(Impair-Repair)权重操作
    • 提出了一种名为UNSIR(Unlearning by Selective Impair and Repair)的方法,通过单次通过损伤和单次通过修复的方式,无需访问请求删除的数据样本,即可在深度模型中实现单类/多类数据的遗忘。
  4. 高效性和可扩展性
    • 该方法在处理单类和多类数据遗忘时所需的更新步骤数量相似,使得该方法能够扩展到大型问题,并且在效率上与现有方法相比有显著提升。
  5. 多类遗忘的高效实现
    • 在不需要对原始优化机制或网络设计施加任何限制的情况下,该方法能够在多种类型的深度网络(如卷积网络和ViTs)上工作,并且在小型和大型视觉任务中都表现良好。
  6. 实际应用的适用性
    • 该方法不仅适用于小规模问题,还适用于大规模视觉问题,如100类的视觉识别任务,这是首次在深度网络中实现多类遗忘的高效方法。
  7. 源代码公开
    • 提供了实现该方法的源代码链接,方便其他研究者和开发者进行验证和进一步的研究。

3 相关研究

A. 机器学习中的遗忘(Machine Unlearning):

  • Brophy和Lowd [7] 提出了一种支持数据遗忘的随机森林变体,需要最少的重新训练。
  • Guo等人 [12] 提出了一种基于牛顿更新机制的认证信息移除框架,用于凸学习问题。
  • Izzo等人 [14] 提出了一种从线性模型中删除数据点的项目残差更新方法。
  • Neel等人 [15] 研究了基于梯度下降的方法在凸模型中的遗忘效果。

B. 深度神经网络中的遗忘(Unlearning in Deep Neural Networks):

  • Golatkar等人 [9] 提出了一种信息论方法,用于从使用随机梯度下降(SGD)训练的深度网络的中间层中擦除信息。
  • Golatkar等人 [3] 直接训练一个线性化网络用于遗忘,并提出了一个混合线性模型。
  • Thudi等人 [35] 讨论了正式证明模型中某些数据点不存在的困难,并建议当前的遗忘方法仅在算法层面上有定义。

C. 数据隐私(Data Privacy):

  • Shokri和Shmatikov [41] 研究了隐私保护深度学习。
  • Phan等人 [42] 探讨了深度自动编码器的差分隐私保护。
  • Cao等人 [27] 研究了数据删除在k-means聚类中的问题。
  • Abadi等人 [28] 和 Dwork和Roth [29] 讨论了差分隐私的算法基础。

4 算法

4.1 算法原理

  1. 错误最大化噪声生成(Error-Maximizing Noise Generation)
    • 算法首先为目标遗忘的类别学习一个错误最大化的噪声矩阵。这个噪声矩阵用于操纵模型权重,以实现对特定类别数据的遗忘。通过最大化模型损失来生成噪声,使得噪声与目标遗忘类别相关联,但与输入数据集X不重合。
  2. UNSIR(Unlearning by Selective Impair and Repair)
    • UNSIR方法包括两个主要步骤:损伤(Impair)和修复(Repair)。
    • 损伤步骤:在这一步骤中,将生成的噪声矩阵与保留类别的一小部分数据(Dr_sub)结合,然后对模型进行一次训练周期(epoch)。这个高学习率的过程会导致模型在目标遗忘类别上的性能急剧下降,从而实现对这些类别的遗忘。
    • 修复步骤:在损伤步骤之后,为了恢复模型在保留类别上的性能,使用保留类别的子集(Dr_sub)对模型进行再次训练。这次训练有助于稳定网络权重,使其更好地记住保留的任务。
  3. 权重操作
    • 通过损伤和修复步骤,算法能够控制性地操纵网络权重,以实现对特定类别数据的遗忘,同时尽可能保持模型在其他任务上的准确性。
  4. 零观察隐私设置(Zero-Glance Privacy Setting)
    • 该算法在零观察隐私设置下工作,这意味着在遗忘过程中,模型不会看到任何需要被遗忘的数据样本。这提高了隐私保护水平,因为即使在数据被要求删除后,这些数据也不会被用于任何网络权重操作。
  5. 多类别遗忘
    • 该方法能够扩展到多类别遗忘问题,而不需要对每个类别单独进行遗忘处理。这使得算法在处理大规模问题时更加高效。
  6. 效率和可扩展性
    • 算法设计为快速且可扩展,能够在大型数据集和不同的深度网络(如CNN和ViT)上工作,同时保持高效性。

4.2 算法步骤

  1. 错误最大化噪声矩阵学习(Error-Maximizing Noise Matrix Learning)
    • 使用已训练好的模型,为目标遗忘的类别学习一个噪声矩阵N。这个噪声矩阵的目的是最大化模型对于遗忘类别的损失函数,从而生成与遗忘类别高度相关的噪声。
  2. 损伤步骤(Impair Step)
    • 将学习到的噪声矩阵N与保留类别的子集数据(Dr_sub)结合,使用一个非常高的学习率进行一次训练周期(epoch)。这一步骤的目的是让模型在遗忘类别上的表现急剧下降,实现对这些类别的遗忘。
  3. 修复步骤(Repair Step)
    • 在损伤步骤之后,为了恢复模型在保留类别上的性能,仅使用保留类别的子集数据(Dr_sub)对模型进行再次训练周期(epoch)。这一步骤有助于稳定网络权重,使其更好地记住保留的任务。
  4. 模型更新
    • 通过上述损伤和修复步骤,模型的权重被更新,以反映对特定类别数据的遗忘,同时尽可能保持对其他类别数据的识别能力。
  5. 评估和验证
    • 使用一系列评估指标来验证遗忘算法的效果,包括遗忘集(Forget Set)和保留集(Retain Set)的准确率、重训练时间(Relearn Time, RT)、权重距离和遗忘类别数据的预测分布。
  6. 迭代优化(如有必要):
    • 如果需要,可以对损伤和修复步骤进行迭代优化,以进一步提高遗忘效果和保留集的性能。
  7. 多类别遗忘处理
    • 对于需要遗忘多个类别的情况,该方法可以扩展,通过为每个遗忘类别学习一个噪声矩阵,并执行相似的损伤修复步骤。

5 实验分析

  1. 模型和数据集
    • 实验使用了不同类型的深度网络,包括ResNet18、AllCNN、MobileNetv2和ViTs,以及不同的数据集CIFAR-10、CIFAR-100和VGGFace-100,以展示所提方法的广泛适用性。
  2. 评估指标
    • 使用了多个评估指标来衡量遗忘方法的性能,包括遗忘集(Forget Set)的准确度(ADf)应接近零,保留集(Retain Set)的准确度(ADr)应接近原始模型的性能,重学时间(RT)以及权重距离。
  3. 单类别遗忘
    • 实验结果显示,所提方法能够在单次损伤和修复步骤中有效地擦除特定类别的信息,并且在保留集上的准确度和遗忘集上的准确度方面优于现有方法。例如,在CIFAR-10数据集上使用ResNet18时,该方法在保留集上的准确度从77.86%降低到71.06%,而在遗忘集上的准确度从81.01%降低到0%。
  4. 多类别遗忘
    • 所提方法在多类别遗忘方面表现出色。随着需要遗忘的类别数量增加,修复步骤变得更为有效,使得在保留集上的性能更接近原始模型。例如,在CIFAR-100数据集上使用预训练的ResNet18时,遗忘20个类别后,保留集的准确度从77.88%降低到75.38%。
  5. 人脸识别中的遗忘
    • 在VGGFace-100数据集上,使用预训练的ResNet18和ViT模型进行人脸识别任务的遗忘,结果显示该方法在保留集和遗忘集上都取得了良好的性能。例如,在ResNet18上遗忘一个类别时,保留集的准确度从80.63%降低到72.29%,而遗忘集的准确度降低到3%。
  6. 预测分布
    • 对于遗忘类别的数据,所提方法的预测分布是随机的,没有集中在某个特定的保留类别上,表明该方法确实擦除了与遗忘类别相关的信息。
  7. 权重距离
    • 所提方法在层与层之间的权重距离上与重新训练的模型相似,表明遗忘是有效的,并且没有信息泄露的迹象。
  8. 效率
    • 所提方法在效率上显著优于重新训练和现有的遗忘方法。例如,与重新训练相比,所提方法快了154倍,与Fisher方法相比快了1875倍。

图4展示了在不同情况下,经过遗忘处理的模型(包括重新训练的模型和本文提出的模型)与原始模型之间的层级权重距离。这些距离值以对数尺度(log scale)呈现,以便更清晰地观察差异。层级权重距离是指模型中每一层的权重向量之间的差异程度,通常用来评估遗忘的效果——如果遗忘后的模型与原始模型在权重上有很大差异,说明遗忘效果较好,因为这意味着模型已经忘记了与特定类别相关的信息。

使用GradCAM(Gradient-weighted Class Activation Mapping)可视化技术来展示ResNet18模型在CIFAR-100数据集上进行遗忘前后的变化。GradCAM是一种可视化工具,它可以显示模型在做出特定预测时关注的输入图像的哪些区域。通过比较原始模型和遗忘后的模型对同一输入图像的关注点,我们可以直观地理解遗忘对模型行为的影响。

6 思考

(1)GradCAM可视化方法值得关注

(2)权重距离指标,有什么作用?如何计算?

权重距离指标用于衡量经过遗忘处理的模型与原始模型之间的差异程度。这个指标的作用是评估遗忘算法的有效性,即模型在遗忘后是否真的忘记了特定类别的数据。如果遗忘后的模型与原始模型在权重上有很大差异,说明遗忘效果较好,因为这意味着模型已经忘记了与特定类别相关的信息。

权重距离的计算方法通常如下:

  1. 定义权重距离:权重距离是模型中每一层的权重向量之间的差异程度。
  2. 计算单层权重距离:对于每一层,权重距离可以通过计算两个权重向量之间的欧几里得距离(L2距离)来得到:
  3. 计算总权重距离:为了得到整个模型的权重距离,可以对所有层的权重距离求和或求平均:

在实际应用中,权重距离的计算可以使用对数尺度(log scale)来呈现,以便更清晰地观察差异。如果遗忘后的模型与原始模型之间的权重距离与重新训练的模型(不包括遗忘类别的数据)与原始模型之间的权重距离相当或更大,这表明遗忘算法有效地改变了模型权重,使得模型忘记了特定类别的数据。


http://www.kler.cn/a/469064.html

相关文章:

  • 神经网络第一课
  • 深度学习中的正则化方法
  • 鸿蒙HarmonyOS开发:基于Swiper组件和自定义指示器实现多图片进度条轮播功能
  • Echart实现3D饼图示例
  • NVIDIA DLI课程《NVIDIA NIM入门》——学习笔记
  • Vue 全局事件总线:Vue 2 vs Vue 3 实现
  • RepPoints: Point Set Representation for Object Detection
  • 鸿蒙HarmonyOS开发:拨打电话、短信服务、网络搜索、蜂窝数据、SIM卡管理、observer订阅管理
  • 【双层模型】考虑供需双侧的综合能源双层优化模型
  • 钓鱼攻击(Phishing)详解和实现 (网络安全)
  • 中国乡镇界shp全境arcgis格式shp数据乡镇名称下载后内容测评
  • redis源码系列--(四)--redis cluster
  • Mono里运行C#脚本25—mono_codegen
  • jenkins入门--安装jenkins
  • C++实现图书管理系统(Qt C++ GUI界面版)
  • Python抓取豆瓣电影Top250
  • 2025工作管理综合指南:Jira、Confluence等Atlassian工具套件在工作管理中的应用
  • graylog配置日志关键字邮件Email告警
  • 区块链:四大方面引领数字革命新篇章
  • 力扣hot100——栈
  • 在科技查新中怎样判定其项目的新颖性?
  • 单片机复位电路基本理解教程文章·含上拉电阻理解电容开路理解!!!
  • Python中对象序列化以及反序列化的方法
  • Day 22:数据库与 Spring Data JPA
  • Unity3D仿星露谷物语开发17之空库存栏UI
  • vue3如何实现防抖?