当前位置: 首页 > article >正文

GLM大模型 - CogVideoX:5B 开源,2B 转为 Apache 协议

8月6日,我们发布并开源了CogVideoX-2B模型,受到广大开发者的欢迎。

为了促进社区的自主使用和开放式创新,我们现决定将参数规模更大、性能更强的产品级模型 CogVideoX-5B 开源,同时 CogVideoX-2B 的开源协议调整为更加开放的Apache 2.0协议。

CogVideoX-2B 升级

自8月6日发布以来,CogVideoX-2B 在推理设备门槛上已有显著优化:

  • 支持多种推理精度,包括 FP16、BF16、FP32、INT8 等;

  • 在 INT8 精度下,推理显存需求仅为 7.8GB,即使用 1080 Ti 显卡也可以完成推理;

  • 在 FP16/BF16 精度,Step=50 的设定下,单卡 A100 仅需 90 秒完成推理,单卡 H100 仅需 45 秒;

  • LoRA 微调显存需求为 47GB,SFT 微调为 62GB,单卡 A100(80GB)即可满足微调需求。

CogVideoX-5B 开源

CogVideoX-5B 模型相较于 CogVideoX-2B 拥有更高的视频生成质量,并在工程优化上保持了一致的高标准:

  • 同样支持多种推理精度;

  • 推理显存需求最低仅为 11.4GB,即单张 3060 显卡即可完成推理;

  • LoRA 微调显存需求为 63GB,SFT 微调为 75GB,单卡 A100(80GB)同样可以完成微调任务。

为进一步支持开源社区的广泛使用与开发,我们已将 CogVideoX-2B 的协议调整为 Apache 2.0,任何企业与个人均可自由使用。

同时,我们推出了在线体验,并将其源代码开源,涵盖了插帧、超分辨率等先进功能,均采用开源技术方案,实现全流程开源。

代码仓库:https://github.com/THUDM/CogVideo

模型论文:https://arxiv.org/abs/2408.06072

模型下载:

  • Huggingface:https://huggingface.co/THUDM/CogVideoX-5b

  • 魔搭社区:https://modelscope.cn/models/ZhipuAI/CogVideoX-5b

在线体验:

  • Huggingface:https://huggingface.co/spaces/THUDM/CogVideoX-5B-Space

  • 魔搭社区:https://modelscope.cn/studios/ZhipuAI/CogVideoX-5b-demo

下面为模型参数概要:

图片

Demo

Promt:A lone boy, clad in a rugged oilskin jacket and boots, stands bravely atop a tiny, bobbing boat amidst a tumultuous sea, its waves crashing and foam swirling as a fierce storm rages around him. In the distance, an enormous, fearsome whale emerges, its gargantuan mouth agape, threatening to engulf the boy and his vessel. Undeterred, the boy grips his trusty weapon tightly, a look of fierce determination etched upon his face, and prepares to strike back at the monstrous creature, the salty wind whipping through his hair as he readies for the confrontation. 


http://www.kler.cn/a/287731.html

相关文章:

  • django解决跨域问题
  • 【Android原生问题分析】夸克、抖音划动无响应问题【Android14】
  • 【软件测试】设计测试用例的万能公式
  • 31DNS设置
  • Oracle Instant Client 23.5安装配置完整教程
  • centos7 升级openssl 与升级openssh 安装卸载 telnet-server
  • 红帽认证初级有用吗?对个人帮助,报名时间分享
  • 如何为零售行业构建有效的勒索病毒防御体系
  • git branch 不显示分支名称
  • 速盾:便宜的高防 CDN 推荐,高防 CDN 能抵御 DDoS 吗?
  • es相关概念、索引操作(相当于mysql中的数据库操作)
  • Altium designer设计经验谈——常用规则的使用(二)
  • Mysql基础练习题 610.判断三角形 (力扣)
  • 力扣SQL仅数据库(570-579)
  • 5个常见问答 | 1+X证书《大数据应用开发(Python)》
  • 微信小程序代码目录结构介绍
  • 【Java】使用Java调用Python的四种方法
  • js编写缓慢回到顶部
  • 代码随想录八股训练营第二十五天| C++
  • OpenCV绘图函数(4)绘制轮廓线的函数drawContours()的使用
  • 【C语言】十六进制、二进制、字节、位、指针、数组
  • Spring理论知识(Ⅳ)——Spring Instrumentation模块
  • 深度学习(四)-卷积神经网络
  • Git 系列文章导航
  • 【Next.js 入门指南】5分钟创建你的第一个 Next.js 应用
  • 深度学习-OpenCV运用(3)