当前位置: 首页 > article >正文

对“预训练”的理解

预训练有什么用

传统的机器学习是偏数学的,对数据的量不做过多要求,而深度学习的项目通常是有大量的数据可供使用。

在平常的任务或者项目中,我们可能并没有大量数据,只有少量数据,在这时我们就可以通过“借用”有大数据支持的模型的参数,作为基准,这样就能提高效率和准确率。因为他们神经网络的浅层是相似的,也就是说,在任务相似的情况下,可以用已有的模型即“预训练”好的模型参数实现小数据量的模型训练。

预训练可以节省训练时间,和成本。

预训练是什么

通过一个已训练好的模型A,去完成一个小数据量的任务B,前提,任务A和任务B极其相似。

分两步

  • 冻结:浅层参数不变

  • 微调:浅层参数会跟着训练而改变

预训练怎么用

fairseq、transformers库


http://www.kler.cn/a/568990.html

相关文章:

  • 解锁高效开发新姿势:Trae AI编辑器深度体验
  • LDR6020 PD3.1 协议芯片在显示器领域的应用剖析
  • Unity3D 从零开始实现游戏状态管理器详解
  • JMeter 接口关联方法及示例
  • 《向量数据库》揭秘:大模型时代的记忆双引擎架构与工程实践
  • 火山引擎AI一体机-DeepSeek版来了
  • 蜂鸣器使用
  • 聊一聊 IM 如何优化监控
  • 上海市计算机学会竞赛平台2024年5月月赛丙组城市距离之和
  • STM32 USB外设全面解析:从模式选择到实战避坑指南
  • txt 转 json 使用python语言
  • TypeScript 类型声明
  • 【Python机器学习】1.1. 机器学习(Machine Learning)介绍
  • LeetCodeHot100_0x03
  • 分类预测 | Matlab实现GWO-LSSVM灰狼算法优化最小二乘支持向量机多特征分类预测
  • 商城系统单商户开源版源码
  • tableau之标靶图、甘特图和瀑布图
  • 计算机毕业设计SpringBoot+Vue.js校园失物招领系统(源码+文档+PPT+讲解)
  • 开源电商项目、物联网项目、销售系统项目和社区团购项目
  • 牛客刷题自留-深度学习