SpringAI系列 - RAG篇(一) - Embedding Model
目录
-
- 一、如何将你的数据与AI模型连接起来
- 二、检索增强生成(Retrieval Augmented Generation)
- 三、嵌入模型(EmbeddingModel)
-
- 3.1 嵌入(Embeddings)
- 3.2 嵌入模型(Embeddings Model)
一、如何将你的数据与AI模型连接起来
之前介绍的 ChatClient 只是帮助我们的应用与大模型进行简单的沟通。除了基本的沟通,应用与AI集成的另一个基本挑战便是如何将企业数据和API
与AI模型
连接起来,即如何让人工智能模型与不在训练集中的数据
一同工作?
请注意,GPT 3.5/4.0 数据集仅支持截止到 2021 年 9 月之前的数据
。因此,该模型表示它不知道该日期之后的知识,因此它无法很好的应对需要用最新知识才能回答的问题。一个有趣的小知识是,这个数据集大约有 650GB。
有三种技术可以定制 AI 模型以整合您的数据:
-
Fine Tuning 微调:这种传统的机器学习技术涉及定制模型并更改其内部权重。然而,
即使对于机器学习专家来说,这是一个具有挑战性的过程
,而且由于 GPT 等模型的大小,它极其耗费资源。此外,有些模型可能不提供此选项。 -
Prompt Stuffing 提示词填充:一种更实用的替代方案是