当前位置：首页 > article >正文

重要！！！什么是梯度方差； AdaLoRA中的Fisher信息矩阵：核心作用与通俗举例

article 2025/3/17 9:36:00

什么是梯度方差（Fisher信息近似）

AdaLoRA中的Fisher信息矩阵：核心作用与通俗举例

目录

- 什么是梯度方差（Fisher信息近似）
- AdaLoRA中的Fisher信息矩阵：核心作用与通俗举例
- - - 一句话总结
    - 🍉 通俗例子：炒菜放盐的“重要性”
    - 🧠 具体原理与示例（文本分类任务）
    - 🔍 为什么有效？
    - 🌰 玩具数据演示
  - 通过梯度方差量化参数重要性：一个玩具级计算示例
  - - 步骤1：定义数据与损失
    - 步骤2：计算每个样本的梯度（以 $w_1$ 为例）
  - 1. **Z的含义与公式参数**
  - 2. **L（损失值）的含义与公式参数**
  - - 步骤3：计算梯度方差（Fisher信息近似）
    - 步骤4：对比参数重要性
    - 步骤5：AdaLoRA如何利用方差？
  - 关键结论：为什么方差=重要性？
  - 真实场景类比：考试复习

在这里插入图片描述

在这里插入图片描述
Fisher矩阵的本质：通过参数梯度的方差，量化参数对任务的敏感程度（方差越大，参数越重要）。

一句话总结

Fisher信息矩阵是衡量模型参数对任务重要性的“温度计”，AdaLoRA用它识别哪些参数需要**“小心保护”（避免过度更新）**，哪些可以“大胆调整”。

🍉 通俗例子：炒菜放盐的“重要性”

假设你要炒一盘菜，盐的用量（对应模型参数）对味道影响极大（高Fisher值）&#x

http://www.kler.cn/a/588176.html

相关文章：

ctfshow-web-351-360-ssrf-wp

Python 基础知识整理笔记

SGMEA: Structure-Guided Multimodal Entity Alignment

‌React Hooks主要解决什么

使用unsloth进行grpo训练报错及解决方法

netty中黏包，半包

HDR图像处理：色调映射和色域映射参数

蓝桥杯好题推荐----最大字段和

使用生成对抗网络（GAN）进行人脸老化生成的Python示例

【机器学习chp13--（下）】人工神经网络—优化算法

HCIP笔记整理（一）

conda的基本使用及pycharm里设置conda环境

AI绘画软件Stable Diffusion详解教程（11）：图生图进阶篇（局部用上传蒙版重绘）

7个 Vue 路由守卫的执行顺序

为训练大模型而努力-分享2W多张卡通头像的图片

蓝桥杯真题——洛谷 day 9 枚举、贪心、找规律

C语言之数据结构顺序表的实现

网页制作代码html制作一个网页模板

【Agent】OpenManus-Tool 详细分析

一周学会Flask3 Python Web开发-SQLAlchemy删除数据操作-班级模块