当前位置: 首页 > article >正文

【AIGC】接着昨天的AI“洗图”骚操作,继续调戏国产大模型

目录

一、洗稿,洗图,洗视频

二、如何洗图

2.1 先看看效果

2.2 如何做的

2.3 提示词示例

三、试试星火和通义

2.1 星火和通义的特点

 2.2 星火的做图能力理解力强,准确度还有待提高

2.3 通义大模型伺候

2.4 这3个大模型可以配合使用

四、文字还是大于图片的能力


一、洗稿,洗图,洗视频

提前声明,本人坚决支持和鼓励原创!

但是既然AIGC了,有工具也要去用,毕竟都是发展生产力。

“洗稿”大家都听说过,就是自己不写稿,去找一篇别人写好的稿件,改吧改吧,弄的跟原创似的。

其实大家在写大学毕业论文的时候,有很大的成分就是在洗稿,很多题目,学长都发过了,而且本身就是要参考很多权威的文献,但是查重指标。于是,在“参考”和“原创”之间,要找到自己的出路,想想还是挺不容易的。“条条大路通罗马”,非要说成“万涓细流汇大海”,总是会差点意思。

那么“洗图”呢?原创保护和版权问题,越来越重要,再也不能象以前那样,随便的到百度上搜个图,配到自己的公众号或者文章了。洗图就成了一个生产力的刚需了。

其实除了洗图,现在最多骚操作是洗视频。因为短视频平台的视频,都要求原创,要高画质,才有流量,于是,视频翻转、抽帧、换声音、拼接,就成了通用的做法。很多做这种工具的,都赚了一大笔。其实工具大家是买了,用起来并不是和你想的那样,一建就生成完全不同的素材了。平台的算法工程师,可不是闹着玩的,很快就能识别。现在有AIGC工具了,洗视频有了新的方法。就是太消耗机器资源,成本比较高。

二、如何洗图

2.1 先看看效果

具体洗图的方法,可以参考我昨天的文章:

【AIGC】今天想用AI“洗个图”,失败了,进来看我怎么做的-CSDN博客

给大家看看原图和百度的文心一言洗图的结果对比。

真心的,效果还是有的。百度的文心一言,每次也出4张图,我挑出了效果最好的右图。

文心一格的效果,就差一些了,专业做图片创意的,反而对提示词理解的没有那么到位。

这就有点不像了。但是,可以看到,原型,中间的屋子,路,两边的树和花,都到位了。光影的效果,没做出来。

洗图到这个程度,就可以说是原创了。

提示词也许还可以再优化一下,这个需要时间和对模型的更多理解。

2.2 如何洗图

昨天已经说了,有如下的步骤就可以洗图。

  • 把图提供给AI,让他给你描述;
  • 把描述改为提示词;
  • 用提示词让AI给你做图;
  • 调整,优化,选出最合适的;
2.3 提示词示例

上面效果最好的提示词,如下:

图中是一个微缩的日式花园庭院,庭院里有一个日式房屋和一个白色圆形灯笼,房屋周围环绕着各种植物、假山和石灯。

升级后的提示词:

帮我做个图,图中是一个微缩的日式花园庭院,庭院里有一个日式房屋和一个白色圆形灯笼,房屋是木制的,多层,房屋周围环绕着各种植物、假山和石灯。这个模式是夜晚的场景,窗户透出温暖的光线,周围环绕着柔和的户外灯光,给人一种宁静安详的感觉。

终极提示词:

这是利用chatGPT对图片理解,生成的提示词,不得不说,chatGPT的能力要要更高一些。

帮我做一张图片,在图片的中心,是一个复杂的、精致的东亚传统多层木屋的缩影。这个模型是夜晚的场景,窗户透出温暖的光线,周围环绕着柔和的户外灯光,给人一种宁静安详的感觉。 木屋是多层的,屋顶陡峭,覆盖着仿真的迷你瓦片。墙壁由细小的木条拼接而成,呈现出复杂的木纹。每一层都有多个窗户,窗框细致入微,窗玻璃透出黄色的光线,像是屋内的灯光。门口有一盏明亮的灯笼,为入口提供了照明。 房子周围是一个郁郁葱葱的花园,里面种满了各种迷你的树木和花卉。樱花树、松树、枫树和竹子交织在一起,树叶和花朵清晰可见。花园里还散布着一些石灯笼和挂在树枝上的小灯笼,它们在夜晚发出柔和的光芒,增添了神秘和浪漫的气氛。 在房子的一侧,有一个由石板铺成的露台,上面摆放着一些迷你的户外家具。有一张小桌子和几把椅子,还有一把白色的遮阳伞。露台的边缘有一些盆栽,里面是盛开的花朵。这个露台提供了一个可以欣赏花园美景的休闲空间。 在图片的外围,也就是圆圈的边缘,保持空白,没有任何元素,这样可以突出中心的建筑和花园,让人更加专注于这个宁静美丽的东亚场景。

非常遗憾的,百度的文心一言,无法根据上面的提示词,进行生成图片,憋了大概30秒之后,告诉我,抱歉,臣妾做不到。(꒦_꒦) 

三、试试星火和通义

换别的试试!

星火是科大讯飞大模型,通义是阿里大模型。具体还有哪些国产的大模型,请参考我的文章:

群模乱舞,AI大模型盛开,国内大模型盘点-CSDN博客

2.1 星火和通义的特点

我发现了一个非常好有意思的点,就是星火能做图,不能读图;通义能理解图,但是不能做图!他们两个是商量好的吗?

如图,通义承认了自己不能做图,但是他理解图的能力,真的比百度文心要强,不过别忘记了,文心能力还是最全面的。

通义也很中肯,坦诚的说了自己不能做图,还推荐了chatGPT的插件,还推荐了几个做图的软件。

 2.2 星火的做图能力理解力强,准确度还有待提高

昨天那个英文和中文大段的提示词,中文有453个字,百度文心屈服了。但是星火,把图做好了。

这是英文提示词的做图效果:

Create an Top-front view of an intricatelvdetailed miniature of a traditional East Asianmulti-story wooden house at night, withilluminated windows and ambient outdoorlighting. Surround the house with a lushgarden full of miniature trees, floweringplants, and lanterns. Include a stone patiowith outdoor furniture and a white umbrellaThe scene should evoke tranquility andthe beauty of East Asian architecture andgardens. all the above elements make a circle and stayin the center of the pic, leaving scenery blankaround.

这是中文453字符提示词的效果。

 

我优化了一下提示词,进行了缩写:

帮我做个图,图中是一个微缩的日式花园庭院,庭院里有一个日式房屋和一个白色圆形灯笼,房屋是木制的,多层,房屋周围环绕着各种植物、假山和石灯。这个模式是夜晚的场景,窗户透出温暖的光线,周围环绕着柔和的户外灯光,给人一种宁静安详的感觉。在图片的外围,也就是圆圈的边缘,保持空白,没有任何元素,这样可以突出中心的建筑和花园,让人更加专注于这个宁静美丽的东亚场景。也就是说,所有的图形元素,集中在一个圆形的微缩景观内,呈现2.5D的立体效果,类似一个盆景。 

 

2.3 通义大模型伺候

我输入如下的提示词:

如果让你生成这张图片类似的风格图片,要如何描述,如何写提示词,效果要接近给你的图片。

输入这样的原图:

得到这样的描述,比较准确,把图片的内容描述的很好,但是如果要生成图片,确实要自己再去调整。

这张图片的风格是日式庭院景观,其中包含了一个传统的日式建筑和精心设计的园林景观。如果要生成类似的风格图片,可以考虑以下提示词:

1. 日式建筑:描述建筑的外观和结构,例如“传统的日式建筑,木质结构,黑色瓦片屋顶,飞檐翘角”。

2. 庭院景观:描述庭院中的植物和景观元素,例如“精心设计的园林景观,包括修剪整齐的树木、灌木和花卉,以及石子路和水景”。

3. 照明效果:描述照明效果,例如“夜晚时分,庭院中的灯笼和灯光照亮了整个场景,营造出宁静而神秘的氛围”。

4. 视角和构图:描述视角和构图,例如“从高处俯瞰整个庭院,可以看到建筑和园林景观的全貌,构图平衡而和谐”。

5. 色彩和风格:描述色彩和风格,例如“色彩以自然的绿色和暖色调为主,整体风格简洁而雅致”。

通过使用这些提示词,可以生成一张类似风格的图片,其中包含一个传统的日式建筑和精心设计的园林景观,以及夜晚时分的照明效果。

当然,把这个文字,喂给星火,效果还是不理想。但是星火可以做图,文心一言,就直接拒绝了。生成失败,停止在40%,之后停顿10秒,就失败了。

2.4 这3个大模型可以配合使用

由此,总结下——

文心一言星火通义
解图依赖插件,输出的描述比较简单。输出的描述比较详细。
做图提示词不能太复杂,部分图拒绝给做。提示词要有一定的技巧。较大段的提示词也可以支持。

于是,如何利用AIGC来洗图,大家都应该明白怎么做了。

四、文字还是大于图片的能力

这几个大模型,对图片的支持,还是要进一步的提升。我相信,过一段,也许我这篇文章的内容,就比较陈旧了。

给大家再分享个我测试的例子。

帮我做个搞笑的图片,以“热门”为含义。一个门,门上贴着一张纸,有“热门”2个字。

文心一言:

 

基本不是想要的,也许我的提示词水平不行,我想粉丝老铁们,肯定知道我要做什么图。

星火的效果:

 

没有一个大模型,能把门上的热门两个字写上去啊!

所以,原创这的是且行且珍惜的一个事,我还是宁愿被洗吧。

原创不易,感谢阅读,欢迎点赞关注,更多有用有趣的文章,持续输出。 


http://www.kler.cn/a/154308.html

相关文章:

  • RabbitMQ 在 Java 和 Spring Boot 中的应用详解
  • PySpark——Python与大数据
  • 【设计模式】行为型模式(五):解释器模式、访问者模式、依赖注入
  • Redis 5 种基本数据类型详解
  • 传奇996_23——杀怪掉落,自动捡取,捡取动画
  • 后台管理系统(开箱即用)
  • Android 应用资源概览
  • 蓝桥杯day03——Bigram 分词
  • 2023年12月03日新闻简报(国内国际)
  • 【送书活动三期】解决docker服务假死问题
  • 智能诊疗体验:整合AI技术的互联网医院小程序开发
  • LZW的编码和解码
  • AntDB“超融合+流式实时数仓”——打造分布式数据库新纪元
  • C语言结构体详解(一)(能看懂文字就能明白系列)
  • PyLMKit(5):基于网页知识库的检索增强生成RAG
  • 前端页面转pdf
  • Couchdb 命令执行漏洞复现 (CVE-2017-12636)
  • 常见场景题-接口重试策略如何设计?
  • Day41 使用listwidget制作简易图片播放器
  • 科研学习|论文解读——Open government research over a decade: A systematic review
  • 【android开发-06】android中textview,button和edittext控件的用法介绍
  • vue3-vite-ts:编写Rollup插件并使用 / 优化构建过程
  • 来CSDN一周年啦!!!
  • DBeaver 社区版(免费版)下载、安装、解决驱动更新出错问题
  • 初识短线交易
  • 华为OD机试真题-来自异国的客人-2023年OD统一考试(C卷)