五音不全?手把手教你用自己声音唱任何歌;最详细的Auto-GPT整理;4月AI绘画模型推荐;HayoAI平台简直太酷了 | ShowMeAI日报
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
🤖 『ChatGPT + Code Interpreter = Magic』魔法!离谱!正在怀疑人生…
OpenAI 近期面向部分用户发放了 Code Interpreter (代码解释器) 插件使用权限,推上目前满屏惊讶脸 😮 拿到权限的用户,展示了使用 Code Interpreter插件进行的诸多尝试:
1. 处理图片。输出动态二维码、脸部识别、图片转ASCII码、创建调色板等
2. OCR 识别。导入图片输出文本等
3. 画图,生成较为复杂的svg
4. 生成 GIF 动画,也可以将GIF转为视频
5. 生成音频。创作音乐等
6. 生成日历邀请文件 .ics
7. 游戏模拟器,比如吃豆人游戏、行星轨道、跳棋、国际象棋
8. 数据分析。对上传的任意excel文件进行数据分析,绘制各类型图表,并提供洞察
9. 多个插件之间可以串起来,前一个代码运行的结果可以给下一个插件代码作为参数 ⋙ 部分推文
🤖 『微软 Bing Chat 全面开放并即将发布插件』
微软今天公布了 Bing 聊天机器人的重大升级,增加了图像和视频回答、餐厅预订、聊天历史记录以及更智能的 Microsoft Edge 整合。具体的功能包括:
1. Bing 聊天插件。类似于 ChatGPT 的插件系统,现在可以使用微软的 Bing AI 来完成任务,而无需在站点之间来回跳转。
视频里面演示了搜索结果推荐了一家餐厅,它就可以找到适合的预订时间,并帮助在聊天界面中预订所有餐厅
2. 多模态答案,支持图像搜索。很快就可以在 Bing 聊天中搜索,并要求查找物体、动物、地点等的照片或视频
3. 持续的聊天+聊天记录。聊天历史记录将使你能够在不同设备之间继续聊天机器人对话,甚至将 Bing 聊天用作研究工具
4. 官方已经取消了等候名单。注册即可使用了 ⋙ the verge | 中文解读
🤖 『生成式设计工具「即时AI」全面开放』
即时AI,可以将用户输入的自然语言描述快速生成可二次编辑的 UI 设计稿。5月4日,官方宣布全面开放,不再需要内测码,登录即可开始使用。
无论是「类似豆瓣App首页」的简单需求,还是「一个类似我的世界风格的游戏详情页,里面请包含了游戏简介、游戏截图、 steam 上的评分和评价」这类包含具体信息的需求,都可以在几十秒内完成,帮助设计师释放时间进行更有意义的思考和深入探索 ⋙ 官网
🤖 『面向AI的编程语言 Mojo 发布』可能是过去三十年来编程语言最大的革新
5月3日,前苹果工程师、swift 编程语言创建者 Chris Lattner 创立的 ModularAI 网站,发布了一个新的编程语言 Mojo。根据测试,该语言比 Python 最高提速 35000 倍!
Mojo 最大的特点是有类似Python那样的语法,但是没有Python编程语言的问题。换句话说,这个编程语言号称非常简洁,但是性能却非常好。总的来说,官方宣传Mojo的特点如下:
1. 完全兼容 Python 生态
2. 比 C++ 更快
3. 比 CUDA 更容易定制和修改(more hackable)
4. 和 RUST 一样安全 ⋙ 官网 | 中文解读
🤖 『Chat Chat 开源啦』解锁你的下一级 AI 对话体验
Chat Chat 可以使用 OpenAI、微软 Azure、Claude、Cohere、Hugging Face 等多个 API,让你的 AI 对话体验更加丰富。
此外,Chat Chat 还支持 Plugins,可以搜索内容和总结网页;并且支持分享记录,支持云端存储记录和个人设置等 ⋙ GitHub | 官网
🤖 『HayoAI = Product Hunt + Midjourney社区 + Discord + 聊天机器人+ FlowGPT』
Hayo 是一个强大的应用 (尤其是客户端),集合了 AI 聊天、艺术创作、工具推荐、新闻以及科技创新交流,有点类似于以下几大应用的结合体!完成度非常高,体验流畅,想做的事情有点大,大家快去下载体验!!
HayoAI = Product Hunt + Midjourney社区 + Discord + 聊天机器人+ FlowGPT
1. Product Hunt。HayoAI 收集了1700+ AI工具 ,有详细的介绍、点赞排名和标签分类,允许工具官方发布信息和用户交流
2. Midjourney社区。指令模块类似一个 AIGC 内容社区,可以浏览和直接使用内容的 Prompt,目前主要是 Stable Diffusion
3. Discord。 针对部分工具有单独的聊天室,比如可以直接在 Stable Diffusion 社区内输入 Prompt 进行作画,目前可以免费生成15张/小时,50张/天
4. 聊天机器人。支持包含 ChatGPT 在内的5个AI模型对话,而且可以在指令工厂里的 Prompt 页面直接跳转到聊天室使用,不用魔法上就可以用
5. FlowGPT。内置 300+ Prompt,也可以创建自己的 Prompt ⋙ HayoAI官网 | 解读
🤖 『我把我的声音训练成了AI模型,并让它唱了一首歌…』附超全面教程
AI歌姬现在非常火,B站遍地都是AI歌声,AI孙燕姿,AI周杰伦等等。在初音未来、洛天依之后,AI音乐的时代这次真正的到来了。
作者 @数字生命卡兹克 五音不全,这次终于借助 So-VITS-SVC,用自己的声音完整唱了一首「富士山下」。作者用大量的图文,详细写了整个AI声音教程,并准确了完整安装包。
1. 准备声音数据集。声音模型对数据集的要求比较苛刻,想训练自己的声音需要录制1小时以上的无杂音的纯人声,WAV 格式,再使用 Audio Slicer (音频切分工具) 将其剪裁成10秒左右的分段文件
2. 租云算力,上传数据集。训练模型挺烧显卡的,直接找到便宜稳定的云算力平台,充值三五十元就可以搞定!轻松便捷
3. 在云上训练模型。跟着截图在云平台的控制台操作,进行 10,000 步的模型训练,耗时较久,做好准备
4. 本地进行推理模型重绘歌曲。声音重绘的原理是,用模型的音色替换人声。这一步推荐了大量实用工具,比如分离工具「UVR5」、音乐获取「QQ音乐」、歌曲合成「AU/剪映」等
注意!项目完成时云算力还在烧钱!如果不继续使用,直接先点关机,然后点击释放实例 ⋙ 完整教程@数字生命卡兹克
🤖 『前魅族CMO李楠三个比喻解释AIGC』构建AI时代的核心能力和护城河
前魅族 CMO 李楠最新一期关于 AIGC 的视频「让所有人更好的理解 AIGC 的三个比喻」,观点和产出方式都很有意思,看完感觉很受启发。
他在视频里多次强调,新一代的技术之所以是革命性的,因为「带来了完全不同的思维方式和发展逻辑」,只有要抓住这个东西,才不会被时代淘汰。
比喻1:种子,水源和大树
▢ 种子 - 模型
▢ 水源 - Data
▢ 大树 - 可以使用的大模型 (比如训练好的 ChatGPT)
比喻2:工程师和魔法师
▢ 工程师 - 本质上前三次工业革命所有的参与者,都是工程师
▢ 魔法师 - 运用 AI 得到结果,但是并不清楚原理的人
比喻3:命令行和图形操作界面
▢ 命令行 - 上一代的技术,同时也是的确是下一代技术的基石
▢ 图形操作界面 - 下一代技术,但是其实会使用完全不同的逻辑发展
关于AIGC的内容,我们要小心什么
1. 用已知解释一切的人 - 福特汽车,无非就是更快的马。当真正技术变革发生的时候,不要听部分用已知解释一切的上个时代精英BB,因为他们把一切都纳入到自己的体系内,自洽的结果是他没办法进入新的领域,学习新的东西
2. 用技能掩盖认知 - 10 个技巧帮你玩转 Midjourney。技术进步的阶段,你尚可研究“ 10 个技巧玩转Midjourney”。但当技术发生颠覆性变革的时候,你不能用技巧用技能掩盖认知的落后
人类真正的价值在哪里
1. 预测和判断 - 用丰富的经验预测动荡未来,并且判断的能力
2. 感受力 - 对真实世界和人类社会更丰富的感受能力是 AI 不具有的数据
3. 跨界 - 不断进入新领域的学习能力,并且把自己的所有经历链接起来的能力
4. 面对未知,解决争论,创造 - 在动荡和不确定中领导和创造的能力 ⋙ B站视频
🤖 『4月AI绘画模型推荐榜』7个值得躺进收藏夹的模型
1. Anything V5:生成高质量的二次元和动漫图片 | 模型ID「9409」
2. AbyssOrangeMix3:生成高质量、逼真的纹理插图 | 模型ID「9942」
3. meinamix:擅长描绘二次元和动漫风格的图像,能够呈现出逼真且富有生动感的视觉效果 | 模型ID「7240」
4. GuoFeng3:高度逼真的古风角色模型,具有中国传统文化特色和华丽古风造型 | 模型ID「10415」
5. ReV Animated:适用于肖像和全身动漫般图片的人物描绘模型,同时也适用于幻想风景的2.5D或3D绘制 | 模型ID「7371」
6. Cute_girl_mix4:该LORA模型与Chilloutmix搭配使用,能够生成自然可爱的二次元女孩形象 | 模型ID「14171」
7. 墨心:该LORA模型与兴化板桥先生、八大山人等优秀作品搭配使用,生成的图片兼具传统与现代之美 | 模型ID「12597」 ⋙ 来源
🤖 『4月份爆火的 Auto-GPT 的系列整理』目前最详细清晰
随着 Auto-GPT、Baby AGI 以及斯坦福大学关于 AI Agents 的社会实验的出现,AI 代理/智能代理瞬间成为了 AI 领域的全球热点。本文从 Web 端、长期记忆、垂直领域服务、反面案例等等角度,整理了截止目前最具代表性的 AI 代理产品。
⭕ Auto-GPT
1. Auto-GPT
作为首批独立运行的 GPT-4 实例之一,Auto-GPT 重新定义了 AI 技术的边界,核心在于基于最少的人工输入/提示,利用 GPT-4 的推理能力解决更广泛、更复杂的问题
https://github.com/Significant-Gravitas/Auto-GPT
⭕ Baby AGI
2. Baby AGI
受 AGI 的定义启发,Untapped Capital 的合伙人 Yohei Nakajima 基于 GPT-4、Pinecone 和 LangChain搭建了一个名为 Baby AGI 的任务驱动的自动化代理
https://github.com/yoheinakajima/babyagi
⭕ Web Version|Web 端版本
3. AgentGPT
功能最基础的网页版 AutoGPT,界面清爽,易于使用,可一键存储/复制所生成的结果,也可选择使用自己的 API key
https://agentgpt.reworkd.ai/
4. Godmode
需要人为添加任务并确认每个步骤的网页版 AutoGPT,可人为控制变量
https://godmode.space/
5. Cognosys
目前最火的 Web 端 Auto GPT,由 Homam Tradeit 与 Sully Omarr 共同开发。输入项目名称,设定目标,输入或自动生成三项任务,即可让代理自动完成目标
https://www.cognosys.ai/
⭕ Long-Term Memory|长期记忆
6. MemoryGPT
MemoryGPT 是记忆力更长久的 ChatGPT,这个特点让它可以解决更复杂更具体的问题,同时也可以更个性化
https://memorygpt.io/
7. Teenage AGI
一个真正拥有长期记忆,记住初始目标并自动规划完成复杂任务的 AI agent
https://github.com/seanpixel/Teenage-AGI
⭕ More Professional Service|更专业的服务
8. Coding Assistant by Mckay Wrigley
开发者Mckay 通过 AI agents 进一步实现了与经过身份验证的用户搭建应用程序,当前可以构建和设计 Web 应用程序、创建具有工作数据库的后端、处理身份验证、部署到 Vercel等
https://twitter.com/mckaywrigley/status/1646596881420783619
9. e2b (english2bits)
基于开发文档,利用 AI agents 自动搭建软件。目前云托管版本还在开发,使用还需本地部署
https://www.e2b.dev/
⭕ Bad cases tigger|反面案例
10. ChaosGPT
一个对人类充满敌意并且想要统治世界的 Auto-GPT,虽然产品本身展现的意图是负面的,但让大家可以更直观地了解到 AI 的威胁性并(也许可以)提前做好应对准备,目前已经被推特关闭
https://twitter.com/chaos_gpt ⋙ 来源
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!