体验 DeepSeek 多模态大模型 Janus-Pro-7B
含有图片的链接:
https://mp.weixin.qq.com/s/i6kuVcGU1CUMYRPDM-bKog?token=2020918682&lang=zh_CN
继上篇文章下载了 Janus-Pro-7B 后,准备本地运行时发现由于电脑配置配置太低(显存小于24G),无法运行,因此只能用线上运行的网站体验一下了。
在 HF 网站的 deepseek-ai 主页上有在线体验的入口:
https://huggingface.co/deepseek-ai 或 https://hf-mirror.com/deepseek-ai(国内)。
点进去后:
发一张图片试试:
识别还是比较准确的,再换一张难度大一点的:
勉强也算准确,只是图片中没有 Git,描述中却出现了 Git,有点无中生有了。
再来试试文生图,文生图只支持英语,如果用中文会生成相差十万八千里的图片:
换成英语就正常了:
不过图像质量仍然有待提高。当然也可能是提示词和参数应该改善。
虽然和想象中的“高山流水”不太一样,但是也算没错了。
体验是免费的,但是有次数限制,用了4-5次后就暂时不能用了:
总的来说,Janus-Pro-7B 还是比较强大的,能够在评测中超过 DALL3 也是实至名归。