面向开发者的LLM入门教程(学习笔记01)
关注B站可以观看更多实战教学视频:hallo128的个人空间
面向开发者的LLM入门教程(学习笔记01)
吴恩达老师的《Prompt Engineering for Developer》课程
一、简介
1.LLM的定义
大语言模型(LLM) 的更强大功能是能通过 API 接口调用,从而快速构建软件应用程序
2.分类
(1)基础LLM:是基于文本训练数据,训练出预测下一个单词能力的模型。
(2)指令微调 LLM :通过专门的训练,可以更好地理解并遵循指令。
3.如何训练
指令微调 LLM 的训练通常基于预训练语言模型,先在大规模文本数据上进行预训练,掌握语言的基本规律。在此基础上进行进一步的训练与微调(finetune),输入是指令,输出是对这些指令的正确回复。有时还会采用RLHF(reinforcement learning from human feedback,人类反馈强化学习)技术,根据人类对模型输出的反馈进一步增强模型遵循指令的能力。通过这种受控的训练过程。
指令微调 LLM 可以生成对指令高度敏感、更安全可靠的输出,较少无关和损害性内容。