当前位置: 首页 > article >正文

LLM 架构

LLM 分类 :

  • 自编码模型 (encoder) : 代表模型 : BERT
  • 自回归模型 (decoder) : 代表模型 : GPT
  • 序列到序列模型 (encoder-decoder) : 代表模型 : T5

自编码模型 (AutoEncoder model , AE)

  • 代表模型 : BERT (Bidirectional Encoder Representation from Transformers)
  • 特点 : Encoder-Only
  • 基本原理 : 在输入中随机 MASK 掉一部分单词,根据上下文预测这个词
  • 应用场景 : 内容理解任务,如 : 自然语言理解 (NLU )中的分类任务 (情感分析、提取式问答等 )

自回归模型 (Autoregressive model , AR)

  • 代表模型 : GPT
  • 特点 : Decoder-Only
  • 基本原理 : 从左往右学习的模型,只能利用上文或 下文的信息
  • 应用场景 : 生成式任务,如 : 自然语言生成 (NLG )领域的任务 (摘要、翻译、抽象问答等 )

序列到序列模型 (Sequence to Sequence Model)

  • 代表模型 : T5
  • 特点 : 同时使用编码器和解码器
  • 基本原理 : 将每个 task 视作序列到序列的转换/ 生成
  • 应用场景 : 需要内容理解和生成的任务,如 : 机器翻译

发展图 :


http://www.kler.cn/a/551638.html

相关文章:

  • 零基础入门机器学习 -- 第十一章机器学习模型的评估与优化
  • 机器视觉检测中,2D面阵相机和线扫相机的区别
  • 使用html css js 开发一个 教育机构前端静态网站模板
  • java基础语知识(8)
  • DAY07 Collection、Iterator、泛型、数据结构
  • 异常处理、事务管理
  • C++中变量与容器的默认初始化:0的奥秘
  • 多线程之两阶段终止模式
  • App接入图表:MPAndroidChart,如何创建柱状图、双柱状图以及折线图
  • C学习, 排序算法
  • @Param
  • 航空公司客户价值分析
  • LLM论文笔记 12: Teaching Arithmetic to Small Transformers
  • 使用Linux创作第一个小程序--进度条
  • 虚幻蓝图解决抗锯齿方案
  • 基于微信小程序的宿舍报修管理系统设计与实现,SpringBoot(15500字)+Vue+毕业论文+指导搭建视频
  • 23种设计模式 - 适配器模式
  • CES Asia 2025“传播势能放大器”:科技与环保的双重盛宴
  • 9.PG数据库层权限管理(pg系列课程)第2遍
  • 【HBase】HBaseJMX 接口监控信息实现钉钉告警