当前位置: 首页 > article >正文

浅谈人工智能之基于容器云进行图生视频大模型搭建

浅谈人工智能之基于容器云进行图生视频大模型搭建

根据之前我们所讲过的内容:
文生图
文生视频
我们继续讲解图生视频大模型搭建。

引言

随着深度学习技术的不断发展,图生视频(image-to-video)大模型成为了计算机视觉和自然语言处理领域的一个研究热点。图生视频模型可以根据输入的文本描述生成高质量的视频,广泛应用于艺术创作、广告设计、虚拟现实等领域。本文将介绍如何搭建一个基于iic/Image-to-Video的文生视频大模型。

模型效果展示

我们首先看一下我们对搭建好的模型的效果进行展示,我们输入的图片如下:
在这里插入图片描述## 环境搭建
基于上一篇文生图的模型搭建,我们进行文生视频的搭建。
第一步:依赖安装

pip install modelscope==1.8.4
pip install xformers==0.0.20
pip install torch==2.0.1
pip install open_clip_torch>=2.0.2
pip install opencv-python-headless
pip install opencv-python 
pip install einops>=0.4
pip install rotary-embedding-torch
pip install fairscale 
pip install scipy
pip install imageio
pip install pytorch-lightning
pip install torchsde

第二步:模型下载调用

from modelscope.pipelines import pipeline
from modelscope.outputs import OutputKeys

pipe = pipeline(task="image-to-video", model='damo/Image-to-Video', model_revision='v1.1.0', device='cuda:0')

# IMG_PATH: your image path (url or local file)
output_video_path = pipe("/root/image.jpg", output_video='./output.mp4')[OutputKeys.OUTPUT_VIDEO]
print(output_video_path)

第三步:大概率情况下会提示没有安装ffmpeg提示

2024-11-26 17:10:12,990 - modelscope - ERROR - Save Video Error with /bin/sh: 1: ffmpeg: not found
2024-11-26 17:10:12,996 - modelscope - WARNING - task image-to-video output keys are missing

第四步:安装ffmpeg

sudo apt update
sudo apt install ffmpeg

第五步:再次跑py脚本,我就可以获得对应的输出视频了,如果上述跑脚本的时候提示缺少对应依赖,根据提示信息再对对应依赖进行安装部署。


http://www.kler.cn/a/417083.html

相关文章:

  • JavaScript:还在用if判断属性是否存在?哒咩(?.)用起来
  • 使用sunshine和moonlight串流时的音频输出问题
  • 【Git】tortoisegit使用配置
  • mysql 存储过程和自定义函数 详解
  • QML 和 Qt Quick 介绍
  • 数据结构:单链表
  • labelimg每次标注的时候自动导入预设标签
  • scrapy爬虫框架小案例
  • 音视频-什么是帧,视频为什么要编码
  • 从 HTML 到 CSS:开启网页样式之旅(四)—— 长度单位与显示模式全解析
  • MFC 分段记录时间log类
  • 论文阅读:Dual-disentangled Deep Multiple Clustering
  • HCIE:详解OSPF,从基础到高级特性再到深入研究
  • 剧本字幕自己看
  • 鸿蒙系统(harmony)支持Android应用的双框架技术架构分析
  • 数据湖的概念(包含数据中台、数据湖、数据仓库、数据集市的区别)--了解数据湖,这一篇就够了
  • 实时数据开发|Flink实现数据输出--DataSinks操作
  • 实现PDF文档加密,访问需要密码
  • vue.js学习 (day 15)
  • 量化交易系统开发-实时行情自动化交易-8.2.发明者FMZ平台
  • rabbitMq两种消费应答失败处理方式
  • 制作苹果IOS.APP所使用步骤和方法-有步骤视情况待完善
  • 三维渲染中顺序无关的半透明混合(OIT)(二——Stencil Route)
  • 电脑文件自动提取器介绍
  • WEB攻防-通用漏洞XSS跨站绕过修复http_onlyCSP标签符号
  • 计算机毕业设计Python异常流量检测 流量分类 流量分析 网络流量分析与可视化系统 网络安全 信息安全 机器学习 深度学习