当前位置: 首页 > article >正文

大模型——CogView4:生成中英双语高清图片的开源文生图模型综合介绍

CogView4:生成中英双语高清图片的开源文生图模型综合介绍

CogView4 是由清华大学 KEG 实验室(THUDM)开发的一款开源文生图模型,专注于将文本描述转化为高质量图像。它支持中英双语提示词输入,尤其擅长理解中文提示并生成带有汉字的图像,非常适合广告设计、短视频创作等场景。作为首个支持在画面中生成汉字的开源模型,CogView4 在复杂语义对齐和指令跟随能力上表现出色。它基于 GLM-4-9B 文本编码器,支持任意长度的提示词输入,并能生成高达 2048 分辨率的图像。项目托管在 GitHub 上,提供详细代码和使用文档,吸引了大量开发者与创作者关注与参与。

最新的 CogView4 模型将于3月13日上线 智谱清言 官网。

CogView4:生成中英双语高清图片的开源文生图模型-1

在线体验:https://huggingface.co/spaces/THUDM-HF-SPACE/CogView4

功能列表

  • 中英双语提示词生成图像:支持中文和英文描述,能精准理解并生成符合提示的图

http://www.kler.cn/a/571194.html

相关文章:

  • DeepSeek vs Grok vs ChatGPT:大模型三强争霸,谁将引领AI未来?
  • Web⾃动化测试及常用函数
  • pnpm+monorepo实现前端公共函数、组件库
  • 芯麦 GC1272 芯片:电脑散热风扇领域的高效替代之选,对比 APX9172/茂达芯片优势解析
  • Linux基础 -- ARM 32位常用机器码(指令)整理
  • Deepseek的底层架构思维构成
  • 面试-----每日一题
  • android13打基础: 接收自定义广播并在接收到广播时触发设备震动
  • 3月4日C高级
  • 通往 AI 之路:Python 机器学习入门-线性代数
  • ffmpeg 添加字幕subtitles绝对路径
  • Servlet理论和tomcat(2)http
  • 制服小程序的“滑手”:禁用页面左右滑动全攻略
  • leetcode112-路径总和
  • 练习题:66
  • Python 矩阵对角线操作函数介绍
  • 音频3A测试--AEC(回声消除)测试
  • 什么是线性代数
  • 2025机械考研复试面试问题汇总篇(含13门科目),考研机械复试专业面试常见重点问题总结!考研机械复试专业面试准备看这一篇就够了!
  • 爬虫Incapsula reese84加密案例:Etihad航空