当前位置：首页 > article >正文

图解【提示工程 VS 微调 VS RAG、全量微调 VS LoRA微调、TopK VS TopP】截图笔记

article 2025/2/24 1:13:14

文章目录

一、RAG流程
二、提示工程 VS 微调 VS RAG
三、全量微调 VS LoRA微调
四、微调 VS RAG 使用场景
四、GraphRAG
五、TopK VS TopP
七、RLHF
八、自注意力机制（Self-Attention）

一、RAG流程

RAG实战中难以解决的问题点：

如何读取文档
如何分块
如何进行词嵌入编码成向量的形式
用户的问题的理解与词嵌入编码
如何在向量数据库中根据问题向量检索知识向量
检索到的结果排序
根据【结合问题和检索结果context】构建提示工程
将7给大模型，给多大的大模型？给哪个大模型？等等等。。。
产出的回答response给用户

二、提示工程 VS 微调 VS RAG

在这里插入图片描述

三、全量微调 VS LoRA微调

LoRA论文：LoRA: Low-Rank Adaptation of Large Language Models
Rank对应到视频里的k, k越小需要训练的参数就越少。
Transformer的参数主要由很多矩阵来构成，比如multi-head attention里的矩阵，还有FFN里的矩阵等；当我们使用LoRA的时候，可以选择性地对某一些矩阵进行改变，这部分可以在config里面进行设置。
矩阵的乘法：要保证维度的一致性，比如一个矩阵W是M乘N的，那这时候A必须是M

http://www.kler.cn/a/558242.html

相关文章：

IGBT的损耗性分析

deepseek自动化代码生成

知识图谱-学习计划

C语言 / C#改造冒泡排序函数bubble_sort()

【练习】【回溯No.1】力扣 77. 组合

Windows 上编译 mebedtls 的鸿蒙库

毕业项目推荐：基于yolov8/yolo11的水稻叶片病害检测识别系统（python+卷积神经网络）

HTML Application(hta)入门教程

SpringBoot 整合 JPA

Redis-线程模型

SMT贴片治具关键设计要素与制造工艺探析

设计模式 - 单例模式

AspectJ 中类型的绑定

【分治法】线性时间选择问题

AWS - Redshift - 外部表读取 Parquet 文件中 timestamp 类型的数据

JavaScript函数-函数的使用

RNN中远距离时间步梯度消失问题及解决办法

在VSCode中接入deepseek

企业知识管理平台重构数字时代知识体系与智能服务网络

Python进行简单医学影像分析的示例