当前位置: 首页 > article >正文

【极速版 -- 大模型入门到进阶】快速了解大型语言模型

文章目录

    • 🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力
    • 🌊 LLM 如何生成输出:简而言之就是文字接龙
    • 🌊 GPT 之前 ...:模型规模和数据规模概览
    • 🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习
    • 🌊 ChatGPT 使用:人类向 chatgpt 靠近
    • 🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)


🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力

🌊 LLM 如何生成输出:简而言之就是文字接龙

🌊 GPT 之前 …:模型规模和数据规模概览

  • 之前都是从网络上各类文字资料学习 …
  • 之后开启下一个阶段:【督导式学习】由人类告诉 GPT 我们想要的答案是什么,这一阶段并不需要大量资料 (上万的资料就可以)

🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习

  • Reinforcement Learning from Human Feedback (RLHF):原理复杂概念简单;模型要有一定能力(偶有佳作),进入 RLHF才有意义

🌊 ChatGPT 使用:人类向 chatgpt 靠近

  • 讲清需求

  • 提供足够的信息,也可以上传档案

  • 提供范例: in-context learning (注意,是没有训练,没有改变参数的)

  • 鼓励 chatgpt 想一想 (例如使用下面的魔法咒语表 🔮 Chain of Thought (CoT))

  • 使用外挂 (例如 +搜索引擎, 具体怎么学习呢 -> 参考:https://youtu.be/ZlD220t Mpl?feature=shared)

  • 拆解任务后执行 (可以让 chatgpt 自己拆解)

  • 让它反思 (例如:告诉它请检查上述答案是否正确)

🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)


参考资料:面向每个人的生成式AI, 【李宏毅 LLM 大模型】


http://www.kler.cn/a/598733.html

相关文章:

  • lua实现面向对象(封装/继承/多态)
  • Elasticsearch8.17 集群重启操作
  • Android应用退出后不在任务栏显示
  • Docker和Dify学习笔记
  • 什么是 “超参数” ?
  • ROS多机通信(四)——Ubuntu 网卡 Mesh 模式配置指南
  • 批量删除或修改 PPT 幻灯片页面背景
  • 美图AI增强优化版 | 功能解锁与安全部署指南
  • Redis 基础篇笔记
  • LeetCode146.LRU 缓存(哈希表+双向链表)
  • RabbitMQ 的 Ack 机制是什么?怎么合理使用它?
  • vue 对接 paypal 订阅和支付
  • 【C/C++】二叉树的最大深度(leetcode T104)bfs dfs经典例题 每日一遍
  • CE设备(Customer Edge device,用户边缘设备)
  • RoboVQA
  • Spring Boot整合SSE实现消息推送:跨域问题解决与前后端联调实战
  • A1 PPT 投影
  • 深入探究 JVM 堆的垃圾回收机制(二)— 回收
  • 【AcWing】算法基础课-数学知识
  • 2024年MathorCup数学建模A题移动通信网络中PCI规划问题解题全过程文档加程序