当前位置：首页 > article >正文

深度学习-105-RAG技术之嵌入模型安装部署应用的三种方式

article 2025/2/8 7:50:53

文章目录

1 RAG技术背景
- 1.1 RAG原理
- 1.2 技术选型
2 Nomic-Embed-Text嵌入模型
- 2.1 基于Ollama和langchain
- 2.2 基于sentence_transformers
- - 2.2.1 下载模型
  - 2.2.2 基本使用
  - 2.2.3 封装为类
- 2.3 基于transformers
- - 2.3.1 基本使用
  - 2.3.2 封装为类
3 参考附录

1 RAG技术背景

初期接触LLM即大语言模型，觉得虽然很强大，但是有时候AI会一本正经的胡说八道，这种大模型的幻觉对于日常使用来说具有很大的误导性，特别是如果我们要用在生成环境下，由于缺少精确性而无法使用。

为什么会造成这种结果那，简单来说就是模型是为了通用性设计的，缺少相关知识，所以导致回复的结果存在胡说八道的情况，根据香农理论，减少信息熵，就需要引入更多信息。

从这个角度来说，就有两个途径：
一是重新利用相关专业知识再次训练加强模型，或进行模型微调，模型训练的成本是巨大的，微调也需要重新标记数据和大量的计算资源，对于个人来说基本不太现实。
二是在问LLM问题的时候，增加些知识背景，让模型可以根据这些知识背景来回复问题；后者即是知识库的构建原理了。

有个专门的概念叫RAG(Retrieval-Augmented Generation)，即检索增强生成，是一种结合检索技术和生成模型的技术框架，旨在提升模型生成内容的准确性和相关性。其核心思想是：在生成答案前，先从外部知识库中检索相关信息，再将检索结果与用户输入结合，指导生成模型输出更可靠的回答。

1.1 RAG原理

http://www.kler.cn/a/536161.html

相关文章：

Java 8 Lambda表达式详解：从入门到实践

部署LLM模型到云端

web直播弹幕抓取分析 signature

机器学习数学基础：14.矩阵的公式

k8sollama部署deepseek-R1模型,内网无坑

一个可以在浏览器console内运行的极简爬虫，可列出网页内指定关键词的所有句子。

初窥强大，AI识别技术实现图像转文字（OCR技术）

Mac下使用Docker安装CREMEB-PRO宝塔环境

【Leetcode 每日一题】59. 螺旋矩阵 II

广度优先搜索（BFS）算法详解——以走迷宫问题为例

【JS】element-ui table展示勾选状态

AI工具——Cherry Studio，搭建满血DeepSeek R1的AI对话客户端

【医院绩效管理专题】2.绩效管理：医院发展的核心驱动力

Jmeter接口自动化测试

ZIP完美解密解压缩和暴力破解最佳实现

python图片转字符画应用

Java 集合中的 `removeIf` 和 Stream API 的 `filter`

4.Python字符串和列表：字符串输入、字符串输出、下标和切片、字符串常见函数、列表(list)、列表的循环遍历、列表的增删改查、列表的嵌套、列表的切片

基于单片机的电子抢答器设计(论文+源码+实物)

Vue 3 30天精进之旅：Day 17 - 样式和动画

UE学习日志#24 C++笔记#10 内存管理1

linux——网络计算机{序列化及反序列化（JSON）（ifdef的用法）}

DeepSeek本地化部署

【实战】excel分页写入导出大文件

如何在Android Studio中开发一个简单的Android应用？

【截图】selenium自动通过浏览器截取指定元素div的图片