当前位置：首页 > article >正文

Build a Large Language Model (From Scratch)学习汇总

article 2025/2/28 15:50:31

目录

中文理解代码
电子书
全文中文翻译
- 第1章：理解大型语言模型
- 第2章：处理文本数据
- 第3章：编码Attention机制
- 第4章：从零实现GPT模型
- 第5章：在未标记数据上进行预训练
- 第6章：用于文本分类的微调
- 第7章：为指令执行进行微调
- 附录A：PyTorch简介
- 附录E：使用LoRA进行参数高效微调

中文理解代码

https://github.com/Czi24/Awesome-MLLM-LLM-Colab/tree/master/LLMs-from-scratch-CN-Colab

电子书

通过网盘分享的文件：Build a Large Language Model (From Scratch).pdf
链接: https://pan.baidu.com/s/1BKVbCtaW7BV2my-9_T9xSA?pwd=8vjk 提取码: 8vjk
–来自百度网盘超级会员v7的分享

全文中文翻译

第1章：理解大型语言模型

md版本：
https://blog.csdn.net/weixin_46460463/article/details/137842001
pdf版本：
https://blog.csdn.net/weixin_46460463/article/details/140028245

第2章：处理文本数据

md版本：
https://blog.csdn.net/weixin_46460463/article/details/138326265
pdf版本：
https://blog.csdn.net/weixin_46460463/article/details/140028914

第3章：编码Attention机制

md版本：
https://blog.csdn.net/weixin_46460463/article/details/137842001
pdf版本：
https://blog.csdn.net/weixin_46460463/article/details/140028527

第4章：从零实现GPT模型

md版本：
https://blog.csdn.net/weixin_46460463/article/details/140594223
pdf版本：

第5章：在未标记数据上进行预训练

md版本：
https://blog.csdn.net/weixin_46460463/article/details/140622833
pdf版本：
https://blog.csdn.net/weixin_46460463/article/details/140028821

第6章：用于文本分类的微调

pdf版本：
https://blog.csdn.net/weixin_46460463/article/details/140028973

第7章：为指令执行进行微调

pdf版本：
https://blog.csdn.net/weixin_46460463/article/details/140480811

附录A：PyTorch简介

pdf版本：
https://blog.csdn.net/weixin_46460463/article/details/140182619

附录E：使用LoRA进行参数高效微调

pdf版本：
https://blog.csdn.net/weixin_46460463/article/details/140181974

http://www.kler.cn/a/331201.html

相关文章：

uni-app运行到 Android 真机和Android studio模拟器

three.js 通过着色器实现热力图效果

【项目开发】跨专业合作平台实战（附源码）

esp32开发环境搭建和烧录测试

10.2学习

Sqoop面试整理

LeetCode[中等] 763. 划分字母区间

Leecode热题100-75.颜色分类

【AndroidStudio】关于AndroidStudio的常见控件TextView和Button

Vue2（十三）：路由

Java文件上传同时传入JSON参数

软件工程的详细学习要点和学习方向

git commit -am 仅提交已修改文件

怎么绕开华为纯净模式安装软件

机器学习篇-day02-KNN算法实现鸢尾花模型和手写数字识别模型

Pikachu- SQL Inject - http header 头注入

《Linux从小白到高手》理论篇（六）：Linux软件安装一篇通

Leecode SQL 184. Department Highest Salary 找出tie

基于STM32的数字温度传感器设计与实现

测试面试题：请你分别介绍一下单元测试、集成测试、系统测试、验收测试、回归测试