当前位置: 首页 > article >正文

图解【提示工程 VS 微调 VS RAG、全量微调 VS LoRA微调、TopK VS TopP】截图笔记

文章目录

  • 一、RAG流程
  • 二、提示工程 VS 微调 VS RAG
  • 三、全量微调 VS LoRA微调
  • 四、微调 VS RAG 使用场景
  • 四、GraphRAG
  • 五、TopK VS TopP
  • 七、RLHF
  • 八、自注意力机制(Self-Attention)


一、RAG流程

RAG实战中难以解决的问题点:

  1. 如何读取文档
  2. 如何分块
  3. 如何进行词嵌入编码成向量的形式
  4. 用户的问题的理解与词嵌入编码
  5. 如何在向量数据库中根据问题向量检索知识向量
  6. 检索到的结果排序
  7. 根据【结合问题和检索结果context】构建提示工程
  8. 将7给大模型,给多大的大模型?给哪个大模型?等等等。。。
  9. 产出的回答response给用户
    在这里插入图片描述

二、提示工程 VS 微调 VS RAG

在这里插入图片描述

三、全量微调 VS LoRA微调

  1. LoRA论文:LoRA: Low-Rank Adaptation of Large Language Models
    Rank对应到视频里的k, k越小需要训练的参数就越少。
  2. Transformer的参数主要由很多矩阵来构成,比如multi-head attention里的矩阵,还有FFN里的矩阵等; 当我们使用LoRA的时候,可以选择性地对某一些矩阵进行改变,这部分可以在config里面进行设置。
  3. 矩阵的乘法:要保证维度的一致性,比如一个矩阵W是M乘N的,那这时候A必须是M

http://www.kler.cn/a/558242.html

相关文章:

  • IGBT的损耗性分析
  • deepseek自动化代码生成
  • 知识图谱-学习计划
  • C语言 / C#改造冒泡排序函数bubble_sort()
  • 【练习】【回溯No.1】力扣 77. 组合
  • Windows 上编译 mebedtls 的鸿蒙库
  • 毕业项目推荐:基于yolov8/yolo11的水稻叶片病害检测识别系统(python+卷积神经网络)
  • HTML Application(hta)入门教程
  • SpringBoot 整合 JPA
  • Redis-线程模型
  • SMT贴片治具关键设计要素与制造工艺探析
  • 设计模式 - 单例模式
  • AspectJ 中类型的绑定
  • 【分治法】线性时间选择问题
  • AWS - Redshift - 外部表读取 Parquet 文件中 timestamp 类型的数据
  • JavaScript函数-函数的使用
  • RNN中远距离时间步梯度消失问题及解决办法
  • 在VSCode中接入deepseek
  • 企业知识管理平台重构数字时代知识体系与智能服务网络
  • Python进行简单医学影像分析的示例