当前位置: 首页 > article >正文

五音不全?手把手教你用自己声音唱任何歌;最详细的Auto-GPT整理;4月AI绘画模型推荐;HayoAI平台简直太酷了 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🤖 『ChatGPT + Code Interpreter = Magic』魔法!离谱!正在怀疑人生…

OpenAI 近期面向部分用户发放了 Code Interpreter (代码解释器) 插件使用权限,推上目前满屏惊讶脸 😮 拿到权限的用户,展示了使用 Code Interpreter插件进行的诸多尝试:

1. 处理图片。输出动态二维码、脸部识别、图片转ASCII码、创建调色板等

2. OCR 识别。导入图片输出文本等

3. 画图,生成较为复杂的svg

4. 生成 GIF 动画,也可以将GIF转为视频

5. 生成音频。创作音乐等

6. 生成日历邀请文件 .ics

7. 游戏模拟器,比如吃豆人游戏、行星轨道、跳棋、国际象棋

8. 数据分析。对上传的任意excel文件进行数据分析,绘制各类型图表,并提供洞察

9. 多个插件之间可以串起来,前一个代码运行的结果可以给下一个插件代码作为参数 ⋙ 部分推文

🤖 『微软 Bing Chat 全面开放并即将发布插件』

微软今天公布了 Bing 聊天机器人的重大升级,增加了图像和视频回答、餐厅预订、聊天历史记录以及更智能的 Microsoft Edge 整合。具体的功能包括:

1. Bing 聊天插件。类似于 ChatGPT 的插件系统,现在可以使用微软的 Bing AI 来完成任务,而无需在站点之间来回跳转。

视频里面演示了搜索结果推荐了一家餐厅,它就可以找到适合的预订时间,并帮助在聊天界面中预订所有餐厅

2. 多模态答案,支持图像搜索。很快就可以在 Bing 聊天中搜索,并要求查找物体、动物、地点等的照片或视频

3. 持续的聊天+聊天记录。聊天历史记录将使你能够在不同设备之间继续聊天机器人对话,甚至将 Bing 聊天用作研究工具

4. 官方已经取消了等候名单。注册即可使用了 ⋙ the verge | 中文解读

🤖 『生成式设计工具「即时AI」全面开放』

即时AI,可以将用户输入的自然语言描述快速生成可二次编辑的 UI 设计稿。5月4日,官方宣布全面开放,不再需要内测码,登录即可开始使用。

无论是「类似豆瓣App首页」的简单需求,还是「一个类似我的世界风格的游戏详情页,里面请包含了游戏简介、游戏截图、 steam 上的评分和评价」这类包含具体信息的需求,都可以在几十秒内完成,帮助设计师释放时间进行更有意义的思考和深入探索 ⋙ 官网

🤖 『面向AI的编程语言 Mojo 发布』可能是过去三十年来编程语言最大的革新

5月3日,前苹果工程师、swift 编程语言创建者 Chris Lattner 创立的 ModularAI 网站,发布了一个新的编程语言 Mojo。根据测试,该语言比 Python 最高提速 35000 倍!

Mojo 最大的特点是有类似Python那样的语法,但是没有Python编程语言的问题。换句话说,这个编程语言号称非常简洁,但是性能却非常好。总的来说,官方宣传Mojo的特点如下:

1. 完全兼容 Python 生态

2. 比 C++ 更快

3. 比 CUDA 更容易定制和修改(more hackable)

4. 和 RUST 一样安全 ⋙ 官网 | 中文解读

🤖 『Chat Chat 开源啦』解锁你的下一级 AI 对话体验

Chat Chat 可以使用 OpenAI、微软 Azure、Claude、Cohere、Hugging Face 等多个 API,让你的 AI 对话体验更加丰富。

此外,Chat Chat 还支持 Plugins,可以搜索内容和总结网页;并且支持分享记录,支持云端存储记录和个人设置等 ⋙ GitHub | 官网

🤖 『HayoAI = Product Hunt + Midjourney社区 + Discord + 聊天机器人+ FlowGPT』

Hayo 是一个强大的应用 (尤其是客户端),集合了 AI 聊天、艺术创作、工具推荐、新闻以及科技创新交流,有点类似于以下几大应用的结合体!完成度非常高,体验流畅,想做的事情有点大,大家快去下载体验!!

HayoAI = Product Hunt + Midjourney社区 + Discord + 聊天机器人+ FlowGPT

1. Product Hunt。HayoAI 收集了1700+ AI工具 ,有详细的介绍、点赞排名和标签分类,允许工具官方发布信息和用户交流

2. Midjourney社区。指令模块类似一个 AIGC 内容社区,可以浏览和直接使用内容的 Prompt,目前主要是 Stable Diffusion

3. Discord。 针对部分工具有单独的聊天室,比如可以直接在 Stable Diffusion 社区内输入 Prompt 进行作画,目前可以免费生成15张/小时,50张/天

4. 聊天机器人。支持包含 ChatGPT 在内的5个AI模型对话,而且可以在指令工厂里的 Prompt 页面直接跳转到聊天室使用,不用魔法上就可以用

5. FlowGPT。内置 300+ Prompt,也可以创建自己的 Prompt ⋙ HayoAI官网 | 解读

🤖 『我把我的声音训练成了AI模型,并让它唱了一首歌…』附超全面教程

AI歌姬现在非常火,B站遍地都是AI歌声,AI孙燕姿,AI周杰伦等等。在初音未来、洛天依之后,AI音乐的时代这次真正的到来了。

作者 @数字生命卡兹克 五音不全,这次终于借助 So-VITS-SVC,用自己的声音完整唱了一首「富士山下」。作者用大量的图文,详细写了整个AI声音教程,并准确了完整安装包。

1. 准备声音数据集。声音模型对数据集的要求比较苛刻,想训练自己的声音需要录制1小时以上的无杂音的纯人声,WAV 格式,再使用 Audio Slicer (音频切分工具) 将其剪裁成10秒左右的分段文件

2. 租云算力,上传数据集。训练模型挺烧显卡的,直接找到便宜稳定的云算力平台,充值三五十元就可以搞定!轻松便捷

3. 在云上训练模型。跟着截图在云平台的控制台操作,进行 10,000 步的模型训练,耗时较久,做好准备

4. 本地进行推理模型重绘歌曲。声音重绘的原理是,用模型的音色替换人声。这一步推荐了大量实用工具,比如分离工具「UVR5」、音乐获取「QQ音乐」、歌曲合成「AU/剪映」等

注意!项目完成时云算力还在烧钱!如果不继续使用,直接先点关机,然后点击释放实例 ⋙ 完整教程@数字生命卡兹克

🤖 『前魅族CMO李楠三个比喻解释AIGC』构建AI时代的核心能力和护城河

前魅族 CMO 李楠最新一期关于 AIGC 的视频「让所有人更好的理解 AIGC 的三个比喻」,观点和产出方式都很有意思,看完感觉很受启发。

他在视频里多次强调,新一代的技术之所以是革命性的,因为「带来了完全不同的思维方式和发展逻辑」,只有要抓住这个东西,才不会被时代淘汰。

比喻1:种子,水源和大树

种子 - 模型

水源 - Data

大树 - 可以使用的大模型 (比如训练好的 ChatGPT)

比喻2:工程师和魔法师

工程师 - 本质上前三次工业革命所有的参与者,都是工程师

魔法师 - 运用 AI 得到结果,但是并不清楚原理的人

比喻3:命令行和图形操作界面

命令行 - 上一代的技术,同时也是的确是下一代技术的基石

图形操作界面 - 下一代技术,但是其实会使用完全不同的逻辑发展

关于AIGC的内容,我们要小心什么

1. 用已知解释一切的人 - 福特汽车,无非就是更快的马。当真正技术变革发生的时候,不要听部分用已知解释一切的上个时代精英BB,因为他们把一切都纳入到自己的体系内,自洽的结果是他没办法进入新的领域,学习新的东西

2. 用技能掩盖认知 - 10 个技巧帮你玩转 Midjourney。技术进步的阶段,你尚可研究“ 10 个技巧玩转Midjourney”。但当技术发生颠覆性变革的时候,你不能用技巧用技能掩盖认知的落后

人类真正的价值在哪里

1. 预测和判断 - 用丰富的经验预测动荡未来,并且判断的能力

2. 感受力 - 对真实世界和人类社会更丰富的感受能力是 AI 不具有的数据

3. 跨界 - 不断进入新领域的学习能力,并且把自己的所有经历链接起来的能力

4. 面对未知,解决争论,创造 - 在动荡和不确定中领导和创造的能力 ⋙ B站视频

🤖 『4月AI绘画模型推荐榜』7个值得躺进收藏夹的模型

1. Anything V5:生成高质量的二次元和动漫图片 | 模型ID「9409」

2. AbyssOrangeMix3:生成高质量、逼真的纹理插图 | 模型ID「9942」

3. meinamix:擅长描绘二次元和动漫风格的图像,能够呈现出逼真且富有生动感的视觉效果 | 模型ID「7240」

4. GuoFeng3:高度逼真的古风角色模型,具有中国传统文化特色和华丽古风造型 | 模型ID「10415」

5. ReV Animated:适用于肖像和全身动漫般图片的人物描绘模型,同时也适用于幻想风景的2.5D或3D绘制 | 模型ID「7371」

6. Cute_girl_mix4:该LORA模型与Chilloutmix搭配使用,能够生成自然可爱的二次元女孩形象 | 模型ID「14171」

7. 墨心:该LORA模型与兴化板桥先生、八大山人等优秀作品搭配使用,生成的图片兼具传统与现代之美 | 模型ID「12597」 ⋙ 来源

🤖 『4月份爆火的 Auto-GPT 的系列整理』目前最详细清晰

随着 Auto-GPT、Baby AGI 以及斯坦福大学关于 AI Agents 的社会实验的出现,AI 代理/智能代理瞬间成为了 AI 领域的全球热点。本文从 Web 端、长期记忆、垂直领域服务、反面案例等等角度,整理了截止目前最具代表性的 AI 代理产品。

Auto-GPT

1. Auto-GPT

作为首批独立运行的 GPT-4 实例之一,Auto-GPT 重新定义了 AI 技术的边界,核心在于基于最少的人工输入/提示,利用 GPT-4 的推理能力解决更广泛、更复杂的问题

https://github.com/Significant-Gravitas/Auto-GPT

Baby AGI

2. Baby AGI

受 AGI 的定义启发,Untapped Capital 的合伙人 Yohei Nakajima 基于 GPT-4、Pinecone 和 LangChain搭建了一个名为 Baby AGI 的任务驱动的自动化代理

https://github.com/yoheinakajima/babyagi

Web Version|Web 端版本

3. AgentGPT

功能最基础的网页版 AutoGPT,界面清爽,易于使用,可一键存储/复制所生成的结果,也可选择使用自己的 API key

https://agentgpt.reworkd.ai/

4. Godmode

需要人为添加任务并确认每个步骤的网页版 AutoGPT,可人为控制变量

https://godmode.space/

5. Cognosys

目前最火的 Web 端 Auto GPT,由 Homam Tradeit 与 Sully Omarr 共同开发。输入项目名称,设定目标,输入或自动生成三项任务,即可让代理自动完成目标

https://www.cognosys.ai/

Long-Term Memory|长期记忆

6. MemoryGPT

MemoryGPT 是记忆力更长久的 ChatGPT,这个特点让它可以解决更复杂更具体的问题,同时也可以更个性化

https://memorygpt.io/

7. Teenage AGI

一个真正拥有长期记忆,记住初始目标并自动规划完成复杂任务的 AI agent

https://github.com/seanpixel/Teenage-AGI

More Professional Service|更专业的服务

8. Coding Assistant by Mckay Wrigley

开发者Mckay 通过 AI agents 进一步实现了与经过身份验证的用户搭建应用程序,当前可以构建和设计 Web 应用程序、创建具有工作数据库的后端、处理身份验证、部署到 Vercel等

https://twitter.com/mckaywrigley/status/1646596881420783619

9. e2b (english2bits)

基于开发文档,利用 AI agents 自动搭建软件。目前云托管版本还在开发,使用还需本地部署

https://www.e2b.dev/

Bad cases tigger|反面案例

10. ChaosGPT

一个对人类充满敌意并且想要统治世界的 Auto-GPT,虽然产品本身展现的意图是负面的,但让大家可以更直观地了解到 AI 的威胁性并(也许可以)提前做好应对准备,目前已经被推特关闭

https://twitter.com/chaos_gpt ⋙ 来源

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!


http://www.kler.cn/a/17950.html

相关文章:

  • PyTorch深度学习与企业级项目实战-预训练语言模型GPT
  • 【VIM】vim 常用命令
  • HTTP常见的请求头有哪些?都有什么作用?在 Web 应用中使用这些请求头?
  • WebAssembly在现代Web开发中的应用
  • qt QKeySequence详解
  • 24.11.13 Javascript3
  • 错题本——数据库系统工程师 2022
  • 大家都去荷兰注册公司到底是为了什么?
  • MySQL数据库——MySQL修改和删除索引(DROP INDEX)
  • 后端程序员的前端必备【Vue】 - 07 ES6新语法
  • 测试20K要什么水平?25岁测试工程师成功斩下offer(附面试题)
  • 校园网自动登陆(河南科技学院)
  • cartographer源码阅读---位姿推测器
  • 榜单!直接式TPMS前装搭载率突破60%,哪些厂商在领跑
  • 2008-2020年上市公司能源消耗数据
  • MySQL知识学习06(SQL语句在MySQL中的执行过程)
  • 使用循环数组和环形链表实现双端队列
  • PVE 安装 windows10
  • 三十、组播技术——IGMP、IGMP-snooping、PIM-DM、PIM-SM
  • LiveData详解(实战+源码+粘性事件解决方案)
  • 亚马逊云科技开启您的云财务管理之旅:云财务运营
  • 电子招标采购系统源码之什么是电子招投标系统?
  • JavaScript的ES6
  • 作者等级与权益说明
  • 系统分析师之系统设计(十五)
  • 成为数据分析师,需要具备哪些技能?