当前位置：首页 > article >正文

【极速版 -- 大模型入门到进阶】快速了解大型语言模型

article 2025/3/29 5:32:13

文章目录

- 🌊 大模型作为一种生成式人工智慧，厉害在哪儿？-> 通用能力
- 🌊 LLM 如何生成输出：简而言之就是文字接龙
- 🌊 GPT 之前 ...：模型规模和数据规模概览
- 🌊 ChatGPT 有三个训练阶段：预训练、督导式学习、强化学习
- 🌊 ChatGPT 使用：人类向 chatgpt 靠近
- 🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)

🌊 大模型作为一种生成式人工智慧，厉害在哪儿？-> 通用能力

🌊 LLM 如何生成输出：简而言之就是文字接龙

🌊 GPT 之前 …：模型规模和数据规模概览

之前都是从网络上各类文字资料学习 …
之后开启下一个阶段：【督导式学习】由人类告诉 GPT 我们想要的答案是什么，这一阶段并不需要大量资料 (上万的资料就可以)

🌊 ChatGPT 有三个训练阶段：预训练、督导式学习、强化学习

Reinforcement Learning from Human Feedback (RLHF)：原理复杂概念简单；模型要有一定能力(偶有佳作)，进入 RLHF才有意义

🌊 ChatGPT 使用：人类向 chatgpt 靠近

讲清需求
提供足够的信息，也可以上传档案
提供范例: in-context learning (注意，是没有训练，没有改变参数的)
鼓励 chatgpt 想一想 (例如使用下面的魔法咒语表 🔮 Chain of Thought (CoT))
使用外挂 (例如 +搜索引擎, 具体怎么学习呢 -> 参考：https://youtu.be/ZlD220t Mpl?feature=shared)
拆解任务后执行 (可以让 chatgpt 自己拆解)
让它反思 (例如：告诉它请检查上述答案是否正确)

🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)

参考资料：面向每个人的生成式AI, 【李宏毅 LLM 大模型】

http://www.kler.cn/a/598733.html

相关文章：

lua实现面向对象(封装/继承/多态)

Elasticsearch8.17 集群重启操作

Android应用退出后不在任务栏显示

Docker和Dify学习笔记

什么是 “超参数” ？

ROS多机通信（四）——Ubuntu 网卡 Mesh 模式配置指南

批量删除或修改 PPT 幻灯片页面背景

美图AI增强优化版 | 功能解锁与安全部署指南

Redis 基础篇笔记

LeetCode146.LRU 缓存（哈希表+双向链表）

RabbitMQ 的 Ack 机制是什么？怎么合理使用它？

vue 对接 paypal 订阅和支付

【C/C++】二叉树的最大深度（leetcode T104）bfs dfs经典例题每日一遍

CE设备（Customer Edge device，用户边缘设备）

RoboVQA

Spring Boot整合SSE实现消息推送：跨域问题解决与前后端联调实战

A1 PPT 投影

深入探究 JVM 堆的垃圾回收机制（二）— 回收

【AcWing】算法基础课-数学知识

2024年MathorCup数学建模A题移动通信网络中PCI规划问题解题全过程文档加程序