当前位置: 首页 > article >正文

Build a Large Language Model (From Scratch)学习汇总

目录

  • 中文理解代码
  • 电子书
  • 全文中文翻译
    • 第1章:理解大型语言模型
    • 第2章:处理文本数据
    • 第3章:编码Attention机制
    • 第4章:从零实现GPT模型
    • 第5章:在未标记数据上进行预训练
    • 第6章:用于文本分类的微调
    • 第7章:为指令执行进行微调
    • 附录A:PyTorch简介
    • 附录E:使用LoRA进行参数高效微调

中文理解代码

https://github.com/Czi24/Awesome-MLLM-LLM-Colab/tree/master/LLMs-from-scratch-CN-Colab

电子书

通过网盘分享的文件:Build a Large Language Model (From Scratch).pdf
链接: https://pan.baidu.com/s/1BKVbCtaW7BV2my-9_T9xSA?pwd=8vjk 提取码: 8vjk
–来自百度网盘超级会员v7的分享

全文中文翻译

第1章:理解大型语言模型

md版本:
https://blog.csdn.net/weixin_46460463/article/details/137842001
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028245

第2章:处理文本数据

md版本:
https://blog.csdn.net/weixin_46460463/article/details/138326265
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028914

第3章:编码Attention机制

md版本:
https://blog.csdn.net/weixin_46460463/article/details/137842001
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028527

第4章:从零实现GPT模型

md版本:
https://blog.csdn.net/weixin_46460463/article/details/140594223
pdf版本:

第5章:在未标记数据上进行预训练

md版本:
https://blog.csdn.net/weixin_46460463/article/details/140622833
pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028821

第6章:用于文本分类的微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140028973

第7章:为指令执行进行微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140480811

附录A:PyTorch简介

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140182619

附录E:使用LoRA进行参数高效微调

pdf版本:
https://blog.csdn.net/weixin_46460463/article/details/140181974


http://www.kler.cn/a/331201.html

相关文章:

  • 基于kraft部署kafka集群
  • AttributeError: module ‘numpy‘ has no attribute ‘bool‘.
  • MacOS M3源代码编译Qt6.8.1
  • ubuntu 网络管理
  • 【C++语言】多态
  • 272-1路万兆光纤SFP+和1路千兆网络 FMC子卡模块
  • uni-app运行到 Android 真机和Android studio模拟器
  • three.js 通过着色器实现热力图效果
  • 【项目开发】跨专业合作平台实战(附源码)
  • esp32开发环境搭建和烧录测试
  • 10.2学习
  • Sqoop面试整理
  • LeetCode[中等] 763. 划分字母区间
  • Leecode热题100-75.颜色分类
  • 【AndroidStudio】关于AndroidStudio的常见控件TextView和Button
  • Vue2(十三):路由
  • Java文件上传同时传入JSON参数
  • 软件工程的详细学习要点和学习方向
  • git commit -am 仅提交已修改文件
  • 怎么绕开华为纯净模式安装软件
  • 机器学习篇-day02-KNN算法实现鸢尾花模型和手写数字识别模型
  • Pikachu- SQL Inject - http header 头注入
  • 《Linux从小白到高手》理论篇(六):Linux软件安装一篇通
  • Leecode SQL 184. Department Highest Salary 找出tie
  • 基于STM32的数字温度传感器设计与实现
  • 测试面试题:请你分别介绍一下单元测试、集成测试、系统测试、验收测试、回归测试