Build a Large Language Model (From Scratch)学习汇总
目录
- 中文理解代码
- 电子书
- 全文中文翻译
- 第1章:理解大型语言模型
- 第2章:处理文本数据
- 第3章:编码Attention机制
- 第4章:从零实现GPT模型
- 第5章:在未标记数据上进行预训练
- 第6章:用于文本分类的微调
- 第7章:为指令执行进行微调
- 附录A:PyTorch简介
- 附录E:使用LoRA进行参数高效微调
中文理解代码
https://github.com/Czi24/Awesome-MLLM-LLM-Colab/tree/master/LLMs-from-scratch-CN-Colab
电子书
通过网盘分享的文件:Build a Large Language Model (From Scratch).pdf
链接: https://pan.baidu.com/s/1BKVbCtaW7BV2my-9_T9xSA?pwd=8vjk 提取码: 8vjk
–来自百度网盘超级会员v7的分享
全文中文翻译
第1章:理解大型语言模型
md版本:
https://blog.csdn.net/weixin_46460463/article/details/137842001
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028245
第2章:处理文本数据
md版本:
https://blog.csdn.net/weixin_46460463/article/details/138326265
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028914
第3章:编码Attention机制
md版本:
https://blog.csdn.net/weixin_46460463/article/details/137842001
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028527
第4章:从零实现GPT模型
md版本:
https://blog.csdn.net/weixin_46460463/article/details/140594223
pdf版本:
第5章:在未标记数据上进行预训练
md版本:
https://blog.csdn.net/weixin_46460463/article/details/140622833
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028821
第6章:用于文本分类的微调
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028973
第7章:为指令执行进行微调
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140480811
附录A:PyTorch简介
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140182619
附录E:使用LoRA进行参数高效微调
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140181974