当前位置: 首页 > article >正文

VLLM专题(三十一)—架构概述

本文档提供了vLLM架构的概述。

1. 入口点

vLLM 提供了多个与系统交互的入口点。下图展示了它们之间的关系。
在这里插入图片描述

1.1 LLM 类

LLM 类提供了用于进行离线推理的主要 Python 接口,即在不使用单独的模型推理服务器的情况下与模型进行交互。

以下是 LLM 类的使用示例:

from vllm import LLM, SamplingParams

# Define a list of input prompts
prompts = [
    "Hello, my name is",</

http://www.kler.cn/a/593880.html

相关文章:

  • 蓝桥杯十四届C++B组真题题解
  • 计算机网络基础:网络配置与管理
  • springboot实现文件上传到服务器上,并通过url访问
  • 批量将 PPT 转换为PDF/XPS/JPG图片等其它格式
  • 谈谈 CSS 中z - index属性的作用及在什么情况下会失效。
  • LVGL和其他图形库区别于联系
  • 1.环境搭建VUE+Spring boot
  • 「清华大学、北京大学」DeepSeek 课件PPT专栏
  • 小型状态机实现
  • Kubeasz工具快速部署K8Sv1.27版本集群(二进制方式)
  • Promethues 添加访问密码
  • 数据结构与算法的学习路线
  • Redis设置开机自启报错start-limit-hit
  • MySQL配置主从复制教程(MySQL8)
  • 【C++语言】继承和多态常见的面试问题
  • 深入理解DFS:从迷宫探险到动态剪枝的征服之路(C++实现)
  • @maptalks/gl-layers中的VectorTileLayer的setStyle属性的全部line配置
  • Linux应用:进程间通信
  • 集成学习(Ensemble Learning)基础知识2
  • sqli-labs学习记录5