当前位置: 首页 > article >正文

Datawhale X 李宏毅苹果书 AI夏令营 《深度学习详解》第十九章 ChatGPT

19.1 ChatGPT 简介和功能

1、对话框可以输入任何东西

2、可以继续追问

19.2 对于 ChatGPT 的误解

1、第一个误解是 ChatGPT 的回答是罐头讯息

2、另外一个常见的误解是 ChatGPT 的答案是网络搜索的结果

3、那 ChatGPT 真正在做的事情是什么呢?一言以蔽之就是做文字“接龙”。ChatGPT 简单来将其本身就是一个函数,输入一些东西,就输出一些东西。可以以一个句子作为输入,它输出这个句子后面应该接的词汇的概率。它会给每一个可能的符号一个概率。ChatGPT 输出的是这样一个概率的分布,那 ChatGPT 输出概率分布以后,接下来会从这个概率分布里面去做采样,根据这个概率分布去采样出一个词汇。所以这就是为什么ChatGPT 每次的答案都是不一样的,因为他每次产生答案的时候是有随机性的,它是从一个概率分布里面去做取样,所以他每次的答案都是不同的。

         其生成句子的方式就是将词汇连续输出

4、那 ChatGPT 怎么考虑过去的对话历史记录呢?如何做出连续的对话呢?其实这里原理是一样的,因为它的输入不是只有现在的输入,还包含同一则对话里面所有过去的互动。所以同一则对话里面,所有过去的互动,也都会一起被输入到这个函数里面,让这个函数决定要接哪一个词汇,那这个函数它显然是非常非常复杂的

5、但是没有联网的 ChatGPT 是如何通过大量网络数据来进行学习的呢?这里我们要分明确训练和测试,要切成两个部分来看,寻找函数的过程,我们叫做训练。寻找函数的时候,ChatGPT 有去搜集网络的数据,来帮助他找到这个可以做文字接龙的函数。但是当这个可以做文字接龙的函数被找出来以后,模型就不需要联网了,就进入下一个阶段了,叫做测试。测试就是使用者给一个输入,ChatGPT 给一个输出,当进入测试的时候,是不需要去网络搜索的。

19.3 ChatGPT 背后的关键技术——预训练

1、G——生成;P——预训练;T——Transformer

2、我们要让机器学会英文翻中文,首先要有人类收集大量中英成对的例句。这种需要成对的东西来学习的技术,叫做监督式的学习。

3、另外,我们知道 ChatGPT 中不只是有监督式的学习,还有加上强化学习,其使用的是强化学习中常见的 PPO 算法

4、所以综上,ChatGPT 的学习基本上就是三个步骤——先做预训练,再做监督学习,然后做强化学习。

19.4 ChatGPT 带来的研究问题

1、第一个是如何精准提出需求

2、如何让机器修改一个错误,不要弄错更多地方,这会是一个新的研究的主题,即神经编辑(neural editing)

3、判断输出的内容是否由 AI 生成

4、ChatGPT 会不会口风不紧,泄露了不该泄露的机密


hahaha都看到这里了,要是觉得有用的话就辛苦动动小手点个赞吧! 


http://www.kler.cn/news/309901.html

相关文章:

  • Python 入门教程(3)基础知识 | 3.6、标准输入与输出
  • c++----模板(进阶)
  • 什么是VHDX文件?
  • 国科云域名解析课堂:一个域名可以解析到多个IP地址吗?
  • 高校能耗管控方案如何做到节能减排
  • 【Python123题库】#绘制温度曲线 #XRD谱图绘制 #态密度曲线绘制
  • 3个WebSocket的.Net开源项目
  • 基于vue框架的宠物店管理系统的设计与实现4czn0(程序+源码+数据库+调试部署+开发环境)系统界面在最后面。
  • StackTrace在.Net中获取当前线程的堆栈跟踪信息
  • 【MySQL】MySQL连接池原理与简易网站数据流动是如何进行
  • mysql笔记7(单表查询)
  • 计算机毕业设计 健身房管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解
  • Github 2024-09-12 Go开源项目日报Top10
  • 智能车镜头组入门(二)电路硬件的设计
  • mysql的高级查询:函数的运用(日期/数字/字符/聚合)及分组查询
  • 清理C盘缓存的垃圾,专业清理C盘缓存垃圾的步骤与策略
  • 深度学习-点击率预估-研究论文2024-09-14速读
  • LeetCode 每日一题 2024/9/9-2024/9/15
  • 计算机毕业设计 扶贫助农系统的设计与实现 Java实战项目 附源码+文档+视频讲解
  • qt-creator-10.0.2之后版本的jom.exe编译速度慢下来了
  • JVM: JDK内置命令 - JPS
  • 计算机毕业设计 《计算机基础》网上考试系统的设计与实现 Java实战项目 附源码+文档+视频讲解
  • Java入门程序-HelloWorld
  • 实习项目|苍穹外卖|day11
  • 【机器学习-监督学习】集成学习与梯度提升决策树
  • vue3+ant design vue实现可编辑表格弹出气泡弹出窗~
  • Day 72
  • 在k8s中,客户端访问服务的链路流程,ingress--->service--->deployment--->pod--->container
  • 【大数据】探索怎么从一段话中解析关键信息(寄件人相关信息)
  • 体感魂斗罗(一)