当前位置：首页 > article >正文

基于LangChain4j调用火山引擎DeepSeek R1搭建RAG知识库实战指南

article 2025/3/1 13:10:56

基于LangChain4j调用火山引擎DeepSeek R1搭建RAG知识库实战指南

基于LangChain4j调用火山引擎DeepSeek R1搭建RAG知识库实战指南
- 一、注册火山引擎账号
- 二、RAG技术核心原理
- 三、环境与工具准备
- - 1. 核心组件
  - 2. 依赖配置（Maven）
- 四、代码实现步骤
- - 步骤1：初始化DeepSeek模型
  - 步骤2：构建本地知识库
  - 步骤3：执行RAG
- 五、效果验证与优化
- - 1. 测试示例
  - 2. 性能优化建议
- 六、总结

随着大语言模型（LLM）的普及，如何结合企业私有知识库提升模型输出的准确性和专业性成为关键挑战。 检索增强生成（Retrieval-Augmented Generation, RAG） 技术通过将外部知识库与生成模型结合，有效解决模型幻觉和时效性问题。本文将基于 LangChain4j（Java版LangChain框架）与火山引擎的 DeepSeek R1 模型，手把手搭建一个RAG知识库系统，并提供完整代码实现步骤。

RAG技术详解可参考：详解RAG技术：大模型时代让AI更懂你的智能知识引擎
RAG技术落地：核心痛点与应对策略全面解析: RAG技术落地：核心痛点与应对策略全面解析

一、注册火山引擎账号

访问地址：火山引擎官网访问点击进入注册账号，注册即享免费token调用额度

点击控制台：
在这里插入图片描述
创建在线推理API key

记住模型名称、地址，使用自己的key，后续代码要使用。

二、RAG技术核心原理

RAG通过以下流程增强大模型的生成能力：

检索（Retrieval）：从向量数据库中检索与用户问题相关的文档片段。
增强（Augmentation）：将检索结果作为上下文输入大模型。
生成（Generation）：模型结合上下文生成最终答案。

优势：

数据安全性：知识库本地存储，无需上传至公网。
动态更新：可随时扩展知识库内容，无需重新训练模型。

三、环境与工具准备

1. 核心组件

工具/服务	作用
LangChain4j	提供RAG流程的模块化支持（文档加载、分块、检索链等）
火山引擎DeepSeek R1	提供高性能开源LLM，支持API调用与本地部署
向量数据库	存储文档向量（示例使用内存数据库`InMemoryEmbeddingStore`）

2. 依赖配置（Maven）

<!-- LangChain4j 核心依赖 -->  
<dependency>  
    <groupId>dev.langchain4j</groupId>  
    <artifactId>langchain4j-core</artifactId>  
    <version>0.31.0</version>  
</dependency>  
<!-- 火山引擎DeepSeek集成 -->  
<dependency>  
    <groupId>dev.langchain4j</groupId>  
    <artifactId>langchain4j-openai</artifactId>  
    <version>0.31.0</version>  
</dependency>  
<!-- 文本嵌入模型（示例使用Ollama） -->  
<dependency>  
    <groupId>dev.langchain4j</groupId>  
    <artifactId>langchain4j-ollama</artifactId>  
    <version>0.31.0</version>  
</dependency>

四、代码实现步骤

步骤1：初始化DeepSeek模型

配置火山引擎API密钥与模型参数：

String apiKey = "YOUR_VOLC_ENGINE_API_KEY";  
String modelName = "deepseek-r1-250120";  
String apiBaseUrl = "https://ark.cn-beijing.volces.com/api/v3/chat/completions";  

ChatLanguageModel chatModel = OpenAiChatModel.builder()  
        .apiKey(apiKey)  
        .modelName(modelName)  
        .baseUrl(apiBaseUrl)  
        .build();

步骤2：构建本地知识库

文档加载与分块：

// 加载本地文档（示例为TXT文件）  
Path documentPath = Paths.get("src/main/resources/knowledge.txt");  
Document document = FileSystemDocumentLoader.loadDocument(documentPath);  

// 分块策略：每段500字符，重叠50字符  
DocumentSplitter splitter = DocumentSplitters.recursive(500, 50, new OpenAiTokenizer());  
List<TextSegment> segments = splitter.split(document);  

// 生成向量并存储  bge-m3的模型key也需要申请
EmbeddingModel embeddingModel = OpenAiEmbeddingModel.builder()
                .modelName("bge-m3")
                .apiKey("none")
                .baseUrl("url")
                .build();
EmbeddingStore<TextSegment> embeddingStore = new InMemoryEmbeddingStore<>();  
List<Embedding> embeddings = embeddingModel.embedAll(subList).content();
// 将嵌入结果存储到嵌入存储中
embeddingStore.addAll(embeddings, subList);

步骤3：执行RAG


String question = "如何配置火山引擎的DeepSeek模型？";  
Query userQuery = Query.from(question);

EmbeddingModel embeddingModel = OpenAiEmbeddingModel.builder()
                .modelName("bge-m3")
                .apiKey("none")
                .baseUrl("url")
                .build();
ChatLanguageModel openAiModel = OpenAiChatModel.builder()  
        .apiKey(apiKey)  
        .modelName(modelName)  
        .baseUrl(apiBaseUrl)  
        .build();  
ContentRetriever retriever = EmbeddingStoreContentRetriever.builder()
        .embeddingStore(embeddingStore)
        .embeddingModel(embeddingModel)
        .maxResults(5)
        .minScore(0.6)
        .build();

List<Content> contentList = new ArrayList<>();
contentList.addAll(retriever.retrieve(userQuery));

ContentInjector contentInjector = new DefaultContentInjector();

UserMessage promptMessage = contentInjector.inject(contentList, userMessage);
log.info("promptMessage: {}", promptMessage.singleText());

Response<AiMessage> generate = openAiModel.generate(promptMessage);
log.info("AI响应: {}", generate);