当前位置：首页 > article >正文

面向开发者的LLM入门教程（学习笔记01）

article 2024/11/13 11:56:33

关注B站可以观看更多实战教学视频：hallo128的个人空间

面向开发者的LLM入门教程（学习笔记01）

吴恩达老师的《Prompt Engineering for Developer》课程

一、简介

1.LLM的定义

大语言模型（LLM）的更强大功能是能通过 API 接口调用，从而快速构建软件应用程序

2.分类

（1）基础LLM：是基于文本训练数据，训练出预测下一个单词能力的模型。
（2）指令微调 LLM ：通过专门的训练，可以更好地理解并遵循指令。

3.如何训练

指令微调 LLM 的训练通常基于预训练语言模型，先在大规模文本数据上进行预训练，掌握语言的基本规律。在此基础上进行进一步的训练与微调（finetune），输入是指令，输出是对这些指令的正确回复。有时还会采用RLHF（reinforcement learning from human feedback，人类反馈强化学习）技术，根据人类对模型输出的反馈进一步增强模型遵循指令的能力。通过这种受控的训练过程。

指令微调 LLM 可以生成对指令高度敏感、更安全可靠的输出，较少无关和损害性内容。

查看全文

http://www.kler.cn/a/310639.html