当前位置：首页 > article >正文

（五）关于InternVL2的模型训练二（如何训练目标定位模型）

article 2025/3/11 15:42:59

（五）关于InternVL2的模型训练二（如何训练目标定位模型）

前言

环境依赖

最重要的训练策略

执行参数修改和运行

lora模型合并

更新一点 2024年10月29日

今天发现有人提出 hugging face 的transformers库有个严重的bug，如果训练时使用了梯度累积方法（也就是下面的GRADIENT_ACC）。目前官方还在修复，梯度累积设置为1则可以避免这个问题，这和它里面的计算方式有关，每个样本如果不一样长，交叉熵计算损失时不会按样本长度加权平均计算，会多算padding等无效的token在里面。所以在修复之前建议GRADIENT_ACC控制为1，整体训练效果应该会更好。

前言

本章节是训练模型前的最后一节，上一章节介绍了模型配置、数据配置、重要参数说明，这一章节将会介绍最重要的训练策略、执行参数修改和运行、lora模型合并两点。

http://www.kler.cn/a/375811.html

相关文章：

IDEA中通义灵码的使用技巧

Python 游戏开发库比较与示例

vue当中的$使用方法

leetcode71:简化路径

uniapp开发小程序【简单的实现点击下拉选择性别功能】

c++11(下篇)

Node.js 发展史

3.2 页面异常-2

Redis读性能慢问题排查和调优

PAT甲级-1133 Splitting A Linked List

Chromium 中chrome.topSites扩展接口定义c++

Unity中有什么情况下是需要用UniTask替代其他异步方式的吗?

kdd比赛方案

C++【string的模拟实现】

Llama 3.2 Vision Molmo：多模态开源生态系统基础

《双指针篇》---移动零

「Mac畅玩鸿蒙与硬件20」鸿蒙UI组件篇10 - Canvas 组件自定义绘图

Spring Boot 与 Vue 共筑电影院选票新体验

Kong Gateway 指南

HTML 基础标签——链接标签＜a＞和＜iframe＞