当前位置: 首页 > article >正文

面向开发者的LLM入门教程(学习笔记01)

关注B站可以观看更多实战教学视频:hallo128的个人空间

面向开发者的LLM入门教程(学习笔记01)

吴恩达老师的《Prompt Engineering for Developer》课程

一、简介

1.LLM的定义

大语言模型(LLM) 的更强大功能是能通过 API 接口调用,从而快速构建软件应用程序

2.分类

(1)基础LLM:是基于文本训练数据,训练出预测下一个单词能力的模型。
(2)指令微调 LLM :通过专门的训练,可以更好地理解并遵循指令。

3.如何训练

指令微调 LLM 的训练通常基于预训练语言模型,先在大规模文本数据上进行预训练,掌握语言的基本规律。在此基础上进行进一步的训练与微调(finetune),输入是指令,输出是对这些指令的正确回复。有时还会采用RLHF(reinforcement learning from human feedback,人类反馈强化学习)技术,根据人类对模型输出的反馈进一步增强模型遵循指令的能力。通过这种受控的训练过程。

指令微调 LLM 可以生成对指令高度敏感、更安全可靠的输出,较少无关和损害性内容。


http://www.kler.cn/a/310639.html

相关文章:

  • Django Form
  • Mysql前言
  • C++《stack与queue》
  • 【Linux】常用命令(2.6万字汇总)
  • Unity 网格模型及优化
  • 面试题之---解释一下原型和原型链
  • 探索学习Python的最佳开发环境和编辑器
  • 家用燃气报警器-家庭可燃气体探测器-旭华智能
  • 【网络安全】服务基础第二阶段——第四节:Linux系统管理基础----Linux网络与日志服务器
  • Docker 镜像制作(Dockerfile)
  • 为解决bypy大文件上传报错—获取百度云文件直链并使用Aria2上传文件至服务器
  • Mini-Omni:语言模型可以在流中听、说和思考
  • Docker本地部署Chatbot Ollama搭建AI聊天机器人并实现远程交互
  • Spring boot aop集成(面向切面的编程)
  • TMStarget学习——T1 Segmentation数据处理及解bug
  • js进阶-作用域是什么
  • idear导入他人项目如何快速运行
  • 【PostgreSQL】安装及使用(Navicat/Arcgis),连接(C#)
  • 环境搭建2(游戏逆向)
  • 深入解析:ECMAScript与JavaScript的区别与联系
  • 江科大笔记—OLED显示屏
  • golang的sync包浅析
  • ARM驱动学习之 IOremap实现GPIO 读
  • 安卓13去掉下拉菜单的Dump SysUI 堆的选项 android13删除Dump SysUI 堆
  • react hooks--概述
  • Linux从入门到开发实战(C/C++)Day12-ICMP协议