当前位置: 首页 > article >正文

(五)关于InternVL2的模型训练二(如何训练目标定位模型)

(五)关于InternVL2的模型训练二(如何训练目标定位模型)

前言
环境依赖
最重要的训练策略
执行参数修改和运行
lora模型合并

更新一点 2024年10月29日

今天发现有人提出 hugging face 的transformers库有个严重的bug,如果训练时使用了梯度累积方法(也就是下面的GRADIENT_ACC)。目前官方还在修复,梯度累积设置为1则可以避免这个问题,这和它里面的计算方式有关,每个样本如果不一样长,交叉熵计算损失时不会按样本长度加权平均计算,会多算padding等无效的token在里面。所以在修复之前建议GRADIENT_ACC控制为1,整体训练效果应该会更好。



前言

本章节是训练模型前的最后一节,上一章节介绍了模型配置、数据配置、重要参数说明,这一章节将会介绍最重要的训练策略、执行参数修改和运行、lora模型合并两点。


http://www.kler.cn/a/375811.html

相关文章:

  • CSS3 3D 转换介绍
  • vue编写一个可拖动的模块,并可以和任何其他组件组合使用
  • c语言第一天
  • 017:推理框架为什么可以加速AI推理?
  • linux下的NFS和FTP部署
  • 51c大模型~合集106
  • IDEA中通义灵码的使用技巧
  • Python 游戏开发库比较与示例
  • vue当中的$使用方法
  • leetcode71:简化路径
  • uniapp开发小程序【简单的实现点击下拉选择性别功能】
  • c++11(下篇)
  • Node.js 发展史
  • 3.2 页面异常-2
  • Redis读性能慢问题排查和调优
  • PAT甲级-1133 Splitting A Linked List
  • Chromium 中chrome.topSites扩展接口定义c++
  • Unity中有什么情况下是需要用UniTask替代其他异步方式的吗?
  • kdd比赛方案
  • C++【string的模拟实现】
  • Llama 3.2 Vision Molmo:多模态开源生态系统基础
  • 《双指针篇》---移动零
  • 「Mac畅玩鸿蒙与硬件20」鸿蒙UI组件篇10 - Canvas 组件自定义绘图
  • Spring Boot 与 Vue 共筑电影院选票新体验
  • Kong Gateway 指南
  • HTML 基础标签——链接标签 <a> 和 <iframe>