当前位置: 首页 > article >正文

【文生图】Win10环境借助基于ComfyUI的图狗2.3.1抢先体验阿里万相wan2.1

【文生视频】Win10环境借助基于ComfyUI的图狗2.3.1抢先体验阿里万相wan2.1

前言

上周【也就是20250225】阿里云视觉生成基座模型万相2.1(Wan)宣布开源!

Github: https://github.com/Wan-Video/Wan2.1

HuggingFace:https://huggingface.co/spaces/Wan-AI/Wan2.1

魔搭社区:https://modelscope.cn/studios/Wan-AI/Wan-2.1

分为1.3B小模型和14B大模型,其中1.3B小模型只能用于文生图/480P的视频,14B大模型额外支持图生视频/720P视频。借助于类似Topaz等AI软件,将视频拉到4K240Fps并不难。尤其是1.3B小模型只需要8GB多一点的显存就可以勉强运行起来,适合我等经济困难的贫民窟难民使用!!!

最新的好消息是Wan2.1已经集成了ComfyUI:

在这里插入图片描述

但是笔者还没有部署过它,并且为了防止复杂的环境配置产生新问题,更倾向于使用类似容器化等方式减少环境方面的影响。

感谢B站大佬【灵仙儿和二狗子】封装好的一键启动包,自带所需的Python环境,解压即用,麻麻再也不用担心我的运维能力有待提高了:

https://www.bilibili.com/video/BV1cG9uYNEs7

整合包由于自带了1.3B小模型和14B大模型导致RAR压缩包比较大,下载后需要140GB解压,启动后加载模型也很慢,建议有条件的最好放SSD,放HDD的话只要内存够大其实也只有首次初始化加载时很慢。

其他大佬也有提供类似的一键启动包,B站是个好大学。。。

导入缺失的模型

虽然叫整合包,但还是缺了一个模型:v1-5-pruned-emaonly-fp16.safetensors

下载好放置到启动包下即可:

E:\soft\ergouzi\ComfyUIwan2.1\models\checkpoints

启动图狗

在这里插入图片描述

双击启动即可。

在这里插入图片描述

使用自带的控制台启动,可以防止误关闭CMD命令。启动后还需要导入一个ComfyUIJson,此时会出现一个画布:

在这里插入图片描述

民用小显卡就不用尝试图生视频了,别问我为神马知道的!!!

文生视频

笔者启用了第二个开关。

在这里插入图片描述

老老实实选1.3B的小模型。

在这里插入图片描述

提示词可以是中文也可以是英文。选好后就可以启动。

负载情况

在这里插入图片描述

可以看出主要是GPUCuda负载比较高,丽台RTX A4000的16GB显存接近打满了!!!HDD加载速度慢、刀卡性能偏低导致耗时比较长。效果还是不错的。

输出

在这里插入图片描述

虽然叫做文生视频,但实际上生成的是个webp的动图!!!拆帧及重新序列化、卷积拉高分辨率、插帧素质三联就不用笔者演示了,相信每一杆资深大数据学徒工都已掌握!!!

尾言

2025年注定是不平凡的一年,从DeepSeek开始到混元Wan2.1,陆续开源了好多优秀的模型,让我等庶民也能私有化部署,白piao科学技术进步的成果!!!没有刀卡的童鞋们近期也可以白piao比如即梦可灵大模型。后续成熟了,再试试ComfyUI原生部署Wan2.1

转载请注明出处:https://lizhiyong.blog.csdn.net/article/details/146030135

在这里插入图片描述


http://www.kler.cn/a/571697.html

相关文章:

  • 【Linux】【网络】UDP打洞-->不同子网下的客户端和服务器通信(未成功版)
  • OpenHarmony文件管理子系统
  • XMOS推出“免开发固件方案”将数字接口音频应用的开发门槛大幅降低
  • angular实现nodejs增删改查
  • 前端2025
  • 开源之夏经验分享|Koupleless 社区黄兴抗:在开源中培养工程思维
  • Spring Boot Gradle 项目中使用 @Slf4j 注解
  • 基于微信小程序的竞赛报名系统设计与实现
  • 能做期权交易的标的物有哪些?
  • IO进程线程2
  • vscode设置不自动打开项目【超详细图解】
  • 深度学习R8周:RNN实现阿尔兹海默症(pytorch)
  • C++学习(七)(标准库+STL(iotstream公司,日期/时间,器皿,算法,迭代器,多线程))
  • 深入理解网络通信中的关键概念:HTTP、TCP与Socket的关系及TCP的可靠性保障
  • Google C++ 开源风格指南
  • 用AI学安卓游戏开发1——控制小球上下左右移动2
  • JavaEE基础之-sessioncookie
  • centos和ubunt下安装redis
  • 论文阅读和代码实现EfficientDet(BiFPN)
  • 基于vue框架的游戏商城系统cq070(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。