当前位置: 首页 > article >正文

vllm稳定输出json

vllm版本

0.6.6

请求样例

def send_call_json(prompt="You are a helpful assistant.",
                   msg="",
                   top_p=1.0,
                   temperature=0.7):
    import requests, json, traceback, time
    retry_count = 5
    data = {
        "model":
        "Qwen2__5-72B-Instruct",
        "messages": [
            {
                "role": "system",
                "content": prompt
            },
            {
                "role": "user",
                "content": msg
            },
        ],
        "stream":
        0,
        "stop": ["<|EOT|>", "<|im_end|>"],
        "top_p":
        top_p,
        "repetition_penalty":
        1.05,
        "temperature":
        temperature,
        # 此参数用以强制返回json
        "response_format": {
            "type": "json_object"
        }
    }
    for i in range(0, retry_count):
        try:
            url = "自己的地址"
            headers = {"Content-Type": "application/json"}
            print(f"请求\n{data}")
            response = requests.post(
                url,
                data=json.dumps(data, ensure_ascii=False).encode('utf8'),
                headers=headers,
                timeout=300)
            response.encoding = 'utf-8'
            print(f"响应\n{response.text}")
            response_json = response.json()
            content = response_json["choices"][0]["message"]["content"]
            return content
        except Exception:
            '''
            模型不停输出导致超时时,修改下面两个参数为默认值
            '''
            data["top_p"] = 1.0
            data["temperature"] = 0.7
            print(f"报错再次尝试 {i} {traceback.format_exc()}")
            time.sleep(5)
    return ""


http://www.kler.cn/a/510007.html

相关文章:

  • OA-CNN:用于 3D 语义分割的全自适应稀疏 CNN
  • Java开发提效秘籍:巧用Apache Commons IO工具库
  • 解决 MySQL 服务无法启动:failed to restart mysql.service unit not found
  • c语言第一天
  • ubuntu22.04安装注意点
  • 【Flink系列】6. Flink中的时间和窗口
  • 素描风格渲染
  • 基于Java+Sql Server实现的(GUI)学籍管理系统
  • springboot基于微信小程序的传统美食文化宣传平台小程序
  • docker 基础语法学习,K8s基础语法学习,零基础学习
  • python-leetcode-存在重复元素 II
  • Linux shell zip 命令实现不切换当前终端的工作目录打包另一个路径下的文件和文件夹
  • TCP 重传演进:TCP RACK Timer 能替代 RTO 吗
  • 【触想智能】工业电脑一体机在数控机床设备上应用的注意事项以及工业电脑日常维护知识分享
  • 《汽车与驾驶维修》是什么级别的期刊?是正规期刊吗?能评职称吗?
  • 使用 Java 和 FreeMarker 实现自动生成供货清单,动态生成 Word 文档,简化文档处理流程。
  • Vue.js组件开发全解析
  • Excel中函数SIGN()的用法
  • Reactive StreamsReactor Core
  • ES elasticsearch安装(8.17)
  • spring-cloud-starter-gateway 使用中 KafkaAppender的问题
  • C# OpenCV机器视觉:特征匹配 “灵魂伴侣”
  • Vue.js组件开发-实现输入框与筛选逻辑
  • Nginx反向代理架构介绍
  • RabbitMQ-消息可靠性以及延迟消息
  • Python虚拟环境使用的全方位指南