当前位置: 首页 > article >正文

【模型】Qwen2-VL 服务端UI

1. 前言

最近在测试VLM模型,发现官方的网页demo,代码中视频与图片分辨率可能由于高并发设置的很小,导致达不到预期效果,于是自己研究了一下,搞了一个简单的前端部署,自己在服务器部署了下UI界面,方便在本地笔记本进行测试。

2.代码

import streamlit as st
from PIL import Image
from transformers import Qwen2VLForConditionalGeneration, AutoProcessor
from qwen_vl_utils import process_vision_info
import torch
import os

# 加载模型和处理器 (只加载一次)
@st.cache_resource  # 这个装饰器会缓存模型和处理器
def load_model():
    model = Qwen2VLForConditionalGeneration.from_pretrained(
        "../qwen2_vl/model_7b/", torch_dtype=torch.float16, device_map="auto"
    )
    processor = AutoProcessor.from_pretrained("../qwen2_vl/model_7b/")
    return model, processor


# 加载模型和处理器
model, processor = load_model()


def load_image(image_file):
    img = Image.open(image_file)
    return img


# Function to load and resize image to fixed height
def resize_image_to_height(image, height):
    # Resize image keeping the aspect ratio
    width = int(image.width * height / image.height)
    return image.resize((width, height))


# 处理输入
def process_input(messages):
    # Preparation for inference
    t

http://www.kler.cn/a/469347.html

相关文章:

  • 【服务器常见网络攻击】
  • 基于Arduino的FPV头部追踪相机系统
  • PHP进阶-php文件读取与连接数据库基础部分
  • redis相关概念介绍
  • phpStorm环境配置与应用
  • C# 设计模式(行为型模式):模板方法模式
  • PHP7和PHP8的最佳实践
  • k8s中,Containerd运行时与Dockerd运行时区别
  • githu报错:ssh: connect to host github.com port 22: Connection timed out
  • 我用Ai学Android Jetpack Compose之Composable函数
  • jenkins入门4 --window执行execute shell
  • 《量子比特:解锁人工智能并行计算加速的密钥》
  • dfs复习
  • 我用AI学Android Jetpack Compose之入门篇(1)
  • unity 播放 序列帧图片 动画
  • 【0379】Postgres内核 walreceiver (libpqwalreceiver API)分析
  • STM32完全学习——0V5640的JPEG模式采集
  • 如何利用 Jenkins 实现高效的邮件告警
  • 【计算机网络】课程 实验三 跨交换机实现 VLAN 间路由
  • 海思Linux(一)-Hi3516CV610的开发-ubuntu22_04环境创建