当前位置：首页 > article >正文

01、聊天与语言模型

article 2025/3/25 10:54:46

一、简单说明模型

LLM目前有两种API提供

LanguageModel：接收一个a作为输入并返回一个b作为输出，这种是已经过时的
ChatLanguageModel：接收多个输入，然后返回相应的输出

ChatLanguaggeModel是LangChain4j中LLM交互低级API，它提供了最大的功能和灵活性。除此之外还有一个高级API（AIService）。

ChatLanguageModel还支持的模型有：

EmbeddingModel：把文本转换为Embedding
ImageModel：用来生成和编辑图片
ModerationModel：这个模型可以检查文本中是否包含有害内容
ScoringModel：可以根据查询对多段文本进行评分（排名），实际上就是用来确定每段文本与查询的关联性，这个对于RAG来说是非常有用的

二、ChatLanguageModel的API

ChatLanguageModel是一个接口，其定义如下：

public interface ChatLanguageModel {

  
    default String generate(String userMessage) {
        return generate(UserMessage.from(userMessage)).content().text();
    }

    
    default Response<AiMessage> generate(ChatMessage... messages) {
        return generate(asList(messages));
    }

    
    Response<AiMessage> generate(List<ChatMessage> messages);

    
    default Response<AiMessage> generate(List<ChatMessage> messages, List<ToolSpecification> toolSpecifications) {
        throw new IllegalArgumentException("Tools are currently not supported by this model");
    }

   
    default Response<AiMessage> generate(List<ChatMessage> messages, ToolSpecification toolSpecification) {
        throw new IllegalArgumentException("Tools are currently not supported by this model");
    }

    @Experimental
    default ChatResponse chat(ChatRequest request) {
        throw new UnsupportedOperationException();
    }

    @Experimental
    default Set<Capability> supportedCapabilities() {
        return emptySet();
    }
}

注意：现在我们看的是关于LangChain4j 0.36.2版本！！

三、关于ChatMessage

这个表示是一个聊天消息，当前有四种类型的聊天消息，每种消息的“来源”对应其中一种

UserMessage：来自己于用户的消息，这里指的用户可以是应用使用的最终用户或者是应用本身，它是相对于LLM大语言模型来说的
AiMessage：由AI生成的消息，通常是为了响应
ToolExecutionResultMessage：聊天过程中执行相关的工具（函数）的结果
SystemMessage：来自己系统的消息，通常用来定义LLM在对话中的角色说明（指定AI应该如何表现以及以何种方式回答...）
CustomMessage：可以包含任意属性的自定义消息，这种消息不是所有的大模型语言都支持，只有支持它的才可以使用

使用多个ChatMessage

我们看到接口中方法定义为什么我们要使用多个ChatMessage?

注意：我们在于LLM进行聊天对话时，它本质上是无状态的，它们是不会维护对话状态的，如果要支持多论对话并且让AI理解对话的上下文，那么就需要使用到多个ChatMessage。因为这个时候我们就需要把多论对话中的所有聊天消息告诉AI，让它了解整个上下文的情况，从而达到一个有状态的假象。

如下所示：

UserMessage firstUserMessage = UserMessage.from("你好，我叫鹏鹏");
AiMessage firstAiMessage = model.generate(firstUserMessage).content();
UserMessage secondUserMessage = UserMessage.from("我叫什么名字?");
AiMessage secondAiMessage = model.generate(firstUserMessage,firstAiMessage,SecondUserMessage).content();

向上面这样手动去维护与管理这些消息是很麻烦的，实际的使用中我们会使用ChatMemory(先了解后续会说)

关于UserMessage

在UserMessage这个类中我们可以看到下面这个方法：

public static UserMessage userMessage(Content... contents) {
    return from(contents);
}

这个方法可以传入多个Content，最终得到一个UserMessage对象

而Content是一个接口，它有如下一些实现（不同的实现可以传入不同类型的内容）

TextContent
ImageContent
AudioContent
VideoContent
PdfFileContent

通过这些不同的Content我们就可以把不同类型的内容转为UserMessage，然后传给LLM，如下所示：

UserMessage userMessage = UserMessage.from(
	TextContent.from("请描述下面的图片信息"),
    ImageContent.from("https://ex.com/myCat.png")
);
Response<AiMessage> response = model.generate(userMessage);

TextContent

它是最为简单的一种，就是把一个普通的文本转为一个字符串

UserMessage.from(TextContent.from("Hello")) 与 UserMessage.from("Hello")这两者没有任何区别。

一次可以向UserMessage当中提供一个或多个TextContent

UserMessage userMessage = UserMessage.from(TextContext.from("Hello"),
                                          TextContext.from("你好啊！"));

ImageContent

根据不同的LLM提供商，ImageContent可以从URL地址或者Base64的二进制数据来提供ImageContent

如下所示，使用Base64的二进数据来提供ImageContent

byte[] imageBytes = readBytes("D:\\myImage\\hi.png");
String imgData = Base64.getEncoder().encodeToString(imageBytes);
ImageContent imageContent = ImageContent.from(imgData,"image/png");
UserMessage userMessage = UserMessage.from(imageContent);

AudioContent

它类似于ImageContent，它表示的是音频内容

VideoContent

它类似于ImageContent，它表示的是视频内容

PdfFileContent

它类似于ImageContent，表示的是PDF文件的二进制内容

四、实践示例

POM依赖

<dependencies>

    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>

    <dependency>
        <groupId>dev.langchain4j</groupId>
        <artifactId>langchain4j-dashscope-spring-boot-starter</artifactId>
        <!-- 添加排除项 -->
        <exclusions>
            <exclusion>
                <groupId>org.slf4j</groupId>
                <artifactId>slf4j-simple</artifactId>
            </exclusion>
        </exclusions>
    </dependency>

    <!-- lombok -->
    <dependency>
        <groupId>org.projectlombok</groupId>
        <artifactId>lombok</artifactId>
        <optional>true</optional>
    </dependency>

    <dependency>
        <groupId>dev.langchain4j</groupId>
        <artifactId>langchain4j</artifactId>
    </dependency>
</dependencies>

其中SpringBoot指定版本为：3.3.5，langchain4j指定版本为0.36.2

yml配置

langchain4j:
  dashscope:
    chat-model:
      api-key: sk-09a****************3686d6c4cfb
      #model-name: deepseek-v3
      model-name: qwen-max-latest

chat:
  systemMessage: 你是普京，接下来以普京的语气来进行对话

其中aipkey是在阿里百炼平台申请的aipkey，这里要使用时需要替换为自已申请好的apikey

主启动

@SpringBootApplication
public class ChatApplication {

    public static void main(String[] args) {
        SpringApplication.run(ChatApplication.class, args);
    }
}

controller

@Slf4j
@RestController
@RequestMapping("/chat")
public class ChatController {

    // 注入聊天大语言模型
    @Resource
    private ChatLanguageModel chatLanguageModel;

    @Value("${chat.systemMessage}")
    private String systemMessage;


    @GetMapping("/simple")
    public String chat(@RequestParam("message") String message) {
        UserMessage userMessage = UserMessage.from(message);
        Response<AiMessage> generate = chatLanguageModel.generate(userMessage);
        log.info("generate: {}", generate);
        return generate.content().text();
    }

    @GetMapping("/sys/simple")
    public String chatSys(@RequestParam("message") String message) {
        Response<AiMessage> aiResponse;
        UserMessage userMessage = UserMessage.from(message);
        if (systemMessage != null && !systemMessage.isEmpty()) {
            SystemMessage systemMessage = SystemMessage.from(this.systemMessage);
            aiResponse = chatLanguageModel.generate(List.of(systemMessage, userMessage));
        } else {
            aiResponse = chatLanguageModel.generate(userMessage);
        }
        if (aiResponse == null) {
            return "大模型未返回任何内容~~~";
        }
        log.info("generate: {}", aiResponse);
        return aiResponse.content().text();
    }
}

这其中有两个不同的请求，一个是简单的聊天请求，另一个是我们指定了特定的SystemMessage的请求。

查看全文

http://www.kler.cn/a/597897.html