当前位置：首页 > article >正文

VLLM专题（十九）—兼容 OpenAI 的服务器

article 2025/3/21 6:46:55

vLLM 提供了一个 HTTP 服务器，能够实现 OpenAI 的 Completions API、Chat API 等功能！

您可以通过 vllm serve 命令启动服务器，或者通过 Docker 启动：

vllm serve NousResearch/Meta-Llama-3-8B-Instruct --dtype auto --api-key token-abc123

要调用服务器，您可以使用官方的 OpenAI Python 客户端，或任何其他 HTTP 客户端。

from openai import OpenAI
client = OpenAI(
    base_url="http://localhost:8000/v1"

Matplotlib 柱形图

波场trx质押能量租赁平台开发

剑指 Offer II 113. 课程顺序

NPN三极管基极接稳压管的作用

deque

九、JavaScript作用域、预解析

2025年高校辅导员考试题库及答案

第十三章，L2TP VPN

XSS漏洞靶场练习