当前位置: 首页 > article >正文

LLM基础概念:模型训练

模型训练指的是什么:

神经网络模型可以认为是一个非常复杂的数学公式,模型本质有一系列矩阵参数构成。所谓训练,就是给这些参数分配了合适的值。

LLM输入是一段文本,输出也是一段文本,模型训练就是学习输入和输出的映射关系y=f(x)

大模型训练的两个主要阶段:

  1. 预训练
    1. 从输入的文本预测下一个字符
    2. 根据输出不断调整模型参数
    3. 海量数据训练,得到固定的参数
  1. 微调训练(supervised fine tuning,SFT)
    1. 根据少量高质量对话数据,让模型变得更符合人们对对话的形式
    2. 根据业务输入和输出,让模型学习特定领域的知识

http://www.kler.cn/news/330045.html

相关文章:

  • 基于SpringBoot的校园健康信息管理系统
  • 相机基础概念
  • 【分布式训练 debug】VS Code Debug 技巧:launch.json实用参数
  • Grafana链接iframe嵌入Web前端一直跳登录页面的问题记录
  • RabbitMQ 延迟消息
  • 51单片机系列-按键检测原理
  • 【CSS3】css开篇基础(1)
  • 算法笔记(五)——分治
  • 【C++】多态(下)
  • C#基础(4)封装——成员方法
  • CSS文本格式化
  • 分层图 的尝试学习 1.0
  • 基于Python的自然语言处理系列(19):基于LSTM的语言模型实现
  • 51单片机的宠物自动投喂系统【proteus仿真+程序+报告+原理图+演示视频】
  • 【代码记录】多线程示例代码
  • C语言+单片机
  • docker -私有镜像仓库 - harbor安装
  • 10.4 Linux_并发_线程
  • 深入探讨 Docker:远程登录与镜像管理
  • C++容器之list基本使用
  • 上海我店:创新模式引领本地生活新风尚
  • c#使用winscp库实现FTP/SFTP/SCP的获取列表、上传和下载功能
  • 大数据比懂知识点:Parquet、ORC还是Avro作为数据存储格式,哪种在性能和压缩率上更优
  • 【C++二分查找 前缀和】1712. 将数组分成三个子数组的方案数|2078
  • 深入解析开源大模型的GPU资源需求与优化策略
  • 程序员如何通过专业与软技能提升核心竞争力
  • 特权访问管理阻力最小的途径
  • 付费计量系统通用功能(9)
  • 企望制造ERP系统存在RCE漏洞
  • UniVue大版本更新:UniVue2.0.0-preview