AGI自学分享,简单有用的理论与实践
开始必备
谷歌邮箱
没有谷歌邮箱简直“寸步难行”。
GitHub · Build and ship software on a single, collaborative platform · GitHub
GitHub上有所有开源项目的源代码,当然还有许许多多资源的分享。
huggingface
huggingface上的space可以试用许多模型demo,当然也可以下载众多的模型。
通往AGI之路
通过AGI之路
包含了AI生成内容的所有方面,教程与资源,文本,绘画,视频,语音,音乐...
这样超大集合网站,推荐先粗略看看每种AGI是做什么,然后专注到某一个方面学习。
并不推荐分散精力什么都去看看,太多太杂真的劝退人,还是去看最想看的东西。
AIGC知识库
Wiki
AI之旅工具导航
AI之旅 | 为用户提供全面的AI工具和资源导航平台
包含了AI各种实用工具的导航网站,既可以直接用,也能用来学习目前“AI到底能做什么”。
AI文本
目前生成内容应用最广泛的AI应用,也是大模型名称来源,所谓Large Language Models,也就ChatGTP等文本对话应用,不同于之前,对话AI目前的差距并没有天壤之别了,对于多数常见区别不大。
做什么
- 询问办法:你只需要提出需求,给出它专业身份,它会给出主流办法,比如如何实现批量解压压缩包。
- 解释技术:特别是计算机相关的知识,因为网络资源丰富,GTP非常擅长而且专业,比如解释transformer。
- 工具编程:GTP对于简单的需求已经能够非常好实现了,比如写一个python处理数据输出excel,bash批量解压。
- 推荐工具:直接告诉它你要做什么,让它直接给出相关工具的网址。
- ....
应用网站
https://poe.com/
poe:各种GTP导航网站,主要是可以用ChatGTP-mini很多次。
Kimi.ai - 会推理解析,能深度思考的AI助手
kimi:长文本对话,一个对话框可以上下文聊很多很多,支持读取图片内容,可以联网搜索。
智谱清言
智谱清言:多模态AI,文本,绘画,视频都可以尝试。
Prompt
结构化Prompt模板与技巧 | GPTPMT
深入浅出学习如何写一个prompt,了解必要的AI对话基本概念,也是AI智能体的基础。
云中江树的prompt
超大合集资源,可以看看各种专业的prompt是如何写的,但我感觉没必要那么复杂。
理论原理
GTP发展历程
你可以看看GTP的发展历程,了解GTP的训练过程,也是神经网络和机器学习的通用过程,了解模型的训练过程有助于明白数据标注在做什么,当然更有利于使用GTP这件事情,写出更准确的prompt。
Generative AI exists because of the transformer
这里你可以深入浅出的了解GTP到底是如何处理你的输入,给出它的输出(精致的动画演示),而且还有更为重要的算法核心-transformer。是一种神经网络,是大模型真正实用的开端。
transformer到底是如何工作的
解释transformer是如何工作的,说不上研究算法,但对使用GTP有更交心的对话体验。
AI绘画
面向创造最成熟的AI应用,无论是工作还是娱乐,都可以。
做什么
- 媒体编辑配图,再也不用各种费尽心思寻找,独一无二又简单方便。
- 分享灵感观点,再怎么说也不如给出一个草图来的直接。
- 创造艺术分享,不会画画的我终于可以创造脑海想法了,表达审美。
- ....
应用网站
目前主流是midjourney和stable diffusion。下面只是官方网站,并不能直接使用。
Sign in to Diffus
https://www.midjourney.com/home
不同于文本应用的点击即用,AI绘画需要巨大的计算性能,还要复杂的配置参数,对于只想简单表达想法小白真是复杂呀,所以我主要推荐一些点击即用的model,但也足够了日常使用了。
下面的网址是huggingface上space免费的试用接口,点击即用。
https://dreamstudio.ai/generate
stable diffusion demo
midjourney demo
able diffusion的试用model更为强大,模型效果更好。但并不是说那个模型更好,AI绘画相对AI文本复杂很多,绘画效果不仅跟使用的底层模型,还有调优模型,还有prompt,还有许许多多的参数有关。
Prompt
对于AI绘画简单使用者,prompt可比模型如何配置重要的多。
prompt的关键还是自己多尝试,找到“词语的实际感觉”
AI绘画分享社区,prompt
对于第一次的新手,模仿才是最快的理解方式,去看别人的prompt结构。
这份 Stable diffusion 提示词攻略,记得收好了! - 大模型知识库|大模型训练|开箱即用的企业大模型应用平台|智能体开发|53AI
简单但实用的入门教程。
开源图像模型Stable Diffusion入门手册
https://proximacentaurib.notion.site/e28a4f8d97724f14a784a538b8589e7d?v=ab624266c6a44413b42a6c57a41d828c
全面可以参考的艺术家风格。
全面介绍stablediffusion各方面的参数,包括如何生成原理和prompt书写原则。
https://prompt.qpipi.com/
上面链接是在线的提示词选择网站,基本够用了。
理论原理
stable diffusion工作原理
stablediffusion是如何工作的,也是AI绘画通用的原理。
Docs
stable diffusion技术完整解读
深入浅出,全面完整各方面专业的stable diffusion技术解读。
AI语音
应用已经非常成熟了,模仿人的声音,还是变声。
语音合成(TTS)技术原理简介:如何一步步将文字变成语音-腾讯云开发者社区-腾讯云
做什么
- 数字人+语音生成AI视频。
- AI声音对视频配音。
- 模仿特定人物声音娱乐。
- ...
应用网站
不同于AI文本和AI绘画,需要自己提供素材进行训练。要么使用别人训练好的模型,也就是对应的角色声音,要么就只能自己训练模型,从步骤上说更加复杂。
https://gsv.acgnai.top/
上面可以输入参考文本合成原神和星穹铁道的角色语音。可以发现很受制于人。如果想要其他声音只能不断寻找别人训练好的网站,更现实的是自己训练。
当然如果只是体验完全足够了。
Text To Speech - 在线文本转语音
上面这个在线网站,有多种人声可以合成10000字文本,可以用于配音等等。
GitHub - LokerL/tts-vue: 🎤 微软语音合成工具,使用 Electron + Vue + ElementPlus + Vite 构建。
上面这个软件本地使用
理论原理
此处为语雀内容卡片,点击链接查看:整合包教程 · 语雀
一个通用的TTS训练过程。