当前位置: 首页 > article >正文

(五)关于InternVL2的模型训练二(如何训练目标定位模型)

(五)关于InternVL2的模型训练二(如何训练目标定位模型)

前言
环境依赖
最重要的训练策略
执行参数修改和运行
lora模型合并

更新一点 2024年10月29日

今天发现有人提出 hugging face 的transformers库有个严重的bug,如果训练时使用了梯度累积方法(也就是下面的GRADIENT_ACC)。目前官方还在修复,梯度累积设置为1则可以避免这个问题,这和它里面的计算方式有关,每个样本如果不一样长,交叉熵计算损失时不会按样本长度加权平均计算,会多算padding等无效的token在里面。所以在修复之前建议GRADIENT_ACC控制为1,整体训练效果应该会更好。



前言

本章节是训练模型前的最后一节,上一章节介绍了模型配置、数据配置、重要参数说明,这一章节将会介绍最重要的训练策略、执行参数修改和运行、lora模型合并两点。


http://www.kler.cn/a/375811.html

相关文章:

  • Hailo-8/8L系列汇总
  • 从零开始点亮一个LED灯 —— keil下载、新建工程、版本烧录、面包板使用、实例代码
  • 老电脑不能装纯净版windows
  • CSS3新增背景属性(四)
  • Cuda By Example - 12 (Texture Memory)
  • 探索 ONLYOFFICE:开源办公套件的魅力
  • IDEA中通义灵码的使用技巧
  • Python 游戏开发库比较与示例
  • vue当中的$使用方法
  • leetcode71:简化路径
  • uniapp开发小程序【简单的实现点击下拉选择性别功能】
  • c++11(下篇)
  • Node.js 发展史
  • 3.2 页面异常-2
  • Redis读性能慢问题排查和调优
  • PAT甲级-1133 Splitting A Linked List
  • Chromium 中chrome.topSites扩展接口定义c++
  • Unity中有什么情况下是需要用UniTask替代其他异步方式的吗?
  • kdd比赛方案
  • C++【string的模拟实现】
  • Llama 3.2 Vision Molmo:多模态开源生态系统基础
  • 《双指针篇》---移动零
  • 「Mac畅玩鸿蒙与硬件20」鸿蒙UI组件篇10 - Canvas 组件自定义绘图
  • Spring Boot 与 Vue 共筑电影院选票新体验
  • Kong Gateway 指南
  • HTML 基础标签——链接标签 <a> 和 <iframe>