当前位置: 首页 > article >正文

第1章:LangChain4j的聊天与语言模型

LangChain4J官方文档翻译与解析
目标文档路径:
https://docs.langchain4j.dev/tutorials/chat-and-language-models/

  1. 语言模型的两种API类型
    LangChain4j支持两种语言模型(LLM)的API:
    LanguageModel:这种API非常简单,它接受一个字符串作为输入,并返回一个字符串作为输出。这种API正在逐渐被聊天API(第二种API类型)取代。
    ChatLanguageModel:这种API接受多个ChatMessage作为输入,并返回一个AiMessage作为输出。ChatMessage通常包含文本,但某些LLM还支持其他模态(例如图像、音频等)。例如,OpenAI的gpt-4o-mini和Google的gemini-1.5-pro就是支持这种多模态的聊天模型。
    LangChain4j不再扩展对LanguageModel的支持,所有新功能都将使用ChatLanguageModel API。ChatLanguageModel是LangChain4j中与LLM交互的低级API,提供了最大的灵活性和功能。此外,LangChain4j还支持其他类型的模型,例如:
    EmbeddingModel:将文本转换为嵌入向量。
    ImageModel:生成和编辑图像。
    ModerationModel:检查文本是否包含有害内容。
    ScoringModel:对多段文本进行评分或排名,以确定它们与查询的相关性。这对于检索增强型生成(RAG)非常有用。
  2. ChatLanguageModel API
    ChatLanguageModel API的核心是generate方法,它接受一个或多个ChatMessage作为输入,并返回一个AiMessage。ChatMessage是一个基础接口,代表聊天消息,有以下几种类型:
    UserMessage:用户发送的消息,可以是文本或其他模态内容。
    AiMessage:AI生成的消息,通常是对UserMessage的回应。
    ToolExecutionResultMessage:工具执行请求的结果。
    SystemMessage:系统消息,通常由开发者定义,用于指定LLM在对话中的角色、行为风格等。LLM会更关注SystemMessage,因此不要让用户随意修改或注入内容。
  3. 多轮对话的管理
    由于LLM本身是无状态的,因此需要开发者手动管理对话状态。例如,一个简单的多轮对话如下:
    用户:你好,我叫Klaus。
    AI:你好Klaus,我能帮你什么?
    用户:我的名字是什么?
    AI:Klaus。
    在ChatLanguageModel中,需要将之前的对话消息传递给generate方法,以维护对话上下文。例如:
    java复制
    UserMessage firstUserMessage = UserMessage.from(“你好,我叫Klaus”);
    AiMessage firstAiMessage = model.generate(firstUserMessage).content();
    UserMessage secondUserMessage = UserMessage.from(“我的名字是什么?”);
    AiMessage secondAiMessage = model.generate(firstUserMessage, firstAiMessage, secondUserMessage).content();
  4. 多模态支持
    UserMessage不仅可以包含文本,还可以包含其他类型的内容,例如图像、音频、视频或PDF文件。例如,发送文本和图像的代码如下:
    java复制
    UserMessage userMessage = UserMessage.from(
    TextContent.from(“描述下面的图像”),
    ImageContent.from(“https://example.com/cat.jpg”)
    );
    Response response = model.generate(userMessage);
  5. Kotlin扩展
    LangChain4j为Kotlin提供了扩展,支持异步处理聊天交互。这些扩展利用Kotlin的协程功能,提供了chatAsync和generateAsync方法,简化了聊天请求的构建和对话处理。
    总结
    这篇文章主要介绍了LangChain4j中与语言模型和聊天模型相关的API。它强调了ChatLanguageModel的重要性,并详细解释了如何通过ChatMessage管理多轮对话、支持多模态输入,以及如何利用Kotlin扩展进行异步处理。这些功能使得LangChain4j在构建聊天应用时更加灵活和强大。

http://www.kler.cn/a/556334.html

相关文章:

  • rk3588/3576板端编译程序无法运行视频推理
  • OpenBMC:BmcWeb实例化App
  • 清影2.0(AI视频生成)技术浅析(五):音频处理技术
  • AI Agent Service Toolkit:一站式大模型智能体开发套件
  • C++与Python:两种编程语言的区别
  • 【存储中间件API】MySQL、Redis、MongoDB、ES常见api操作及性能比较
  • windows怎样查看系统信息(处理器等)
  • 2025最新Python机器视觉实战:基于OpenCV与深度学习的多功能工业视觉检测系统(附完整代码)
  • Maven 的高级调试技巧与常见问题
  • 动态存储斐波那契数列(递归优化)
  • Unity游戏制作中的C#基础(2)变量与数据类型
  • Kettle 实战面试题及参考答案(完整版)
  • 【Java基础-46.3】Java泛型通配符详解:解锁类型安全的灵活编程
  • JavaScript如何创建一个对象?对象字面量和构造函数创建对象有什么区别?
  • 【第三节】C++设计模式(创建型模式)-单例模式
  • 通过监督微调提升多语言大语言模型性能
  • 模电知识点总结(5)
  • docker 和 Quay.io的关系
  • 使用 ^= 对每个字节进行异或操作完成校验和
  • Elasticsearch实战应用:从“搜索小白”到“数据侦探”的进阶之路