当前位置: 首页 > article >正文

LLM基础概念:模型训练

模型训练指的是什么:

神经网络模型可以认为是一个非常复杂的数学公式,模型本质有一系列矩阵参数构成。所谓训练,就是给这些参数分配了合适的值。

LLM输入是一段文本,输出也是一段文本,模型训练就是学习输入和输出的映射关系y=f(x)

大模型训练的两个主要阶段:

  1. 预训练
    1. 从输入的文本预测下一个字符
    2. 根据输出不断调整模型参数
    3. 海量数据训练,得到固定的参数
  1. 微调训练(supervised fine tuning,SFT)
    1. 根据少量高质量对话数据,让模型变得更符合人们对对话的形式
    2. 根据业务输入和输出,让模型学习特定领域的知识

http://www.kler.cn/a/330045.html

相关文章:

  • SpringAOP前置——代理模式
  • 【零基础入门unity游戏开发——unity3D篇】地形Terrain的使用介绍
  • Linux内核的启动
  • Java中的注解:如何自定义注解并实现功能
  • Open FPV VTX开源之默认MAVLink设置
  • 【MySQL实战】mysql_exporter+Prometheus+Grafana
  • 基于SpringBoot的校园健康信息管理系统
  • 相机基础概念
  • 【分布式训练 debug】VS Code Debug 技巧:launch.json实用参数
  • Grafana链接iframe嵌入Web前端一直跳登录页面的问题记录
  • RabbitMQ 延迟消息
  • 51单片机系列-按键检测原理
  • 【CSS3】css开篇基础(1)
  • 算法笔记(五)——分治
  • 【C++】多态(下)
  • C#基础(4)封装——成员方法
  • CSS文本格式化
  • 分层图 的尝试学习 1.0
  • 基于Python的自然语言处理系列(19):基于LSTM的语言模型实现
  • 51单片机的宠物自动投喂系统【proteus仿真+程序+报告+原理图+演示视频】
  • 【代码记录】多线程示例代码
  • C语言+单片机
  • docker -私有镜像仓库 - harbor安装
  • 10.4 Linux_并发_线程
  • 深入探讨 Docker:远程登录与镜像管理
  • C++容器之list基本使用