当前位置: 首页 > article >正文

大语言模型参数传递、model 构建与tokenizer构建(基于llama3模型)

文章目录

  • 前言
  • 一、传递参数构建
    • 1、构建模型参数
    • 2、构建数据参数
    • 3、构建训练参数
    • 4、类似parse方式解析数据、模型、训练参数
  • 五、构建tokenizer与model
    • 1、tokenizer与model调用代码
    • 2、tokenizer实现
    • 2、model实现

前言

上一篇说到huggingface的参数传递理论方法,本篇文章应用与llama3参数构建实践代码开发。并在参数传递基础上构建模型model与tokenizer。

提示:使用huggingface方法传参与模型构建!

一、传递参数构建

参数还是很简单,一个模型参数、数据参数和trainer训练参数,我也不在解读,直接给出。

1、构建模型参数

模型参数一般都是载入模型、载入tokenizer等路径啥的,没啥说的,直接给出方法,如下:

@dataclass
class ModelArguments:
    """
    Arguments pertaining to which model/config/tok

http://www.kler.cn/news/368706.html

相关文章:

  • 技术成神之路:设计模式(二十一)外观模式
  • unity3d——PlayerPrefs day01——基础知识点
  • MSR寄存器独有的还是共享的
  • 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-24
  • 尚硅谷redis 第150节答疑 String源码sds
  • 使用Python计算相对强弱指数(RSI)进阶
  • 关于洛谷中XJS-SINGA科技站点 系统讨论团队的一些介绍
  • 【网络】:网络基础
  • 地球Online生存天数计算器(java小案例)
  • GPU的使用寿命可能只有1~3年
  • 基于去哪儿旅游出行服务平台旅游推荐网站【源码+安装+讲解+售后+文档】
  • Linux 重启命令全解析:深入理解与应用指南
  • 51单片机完全学习——红外遥控
  • LeetCode——最小差值
  • RTMP视频推流EasyDSS平台重装服务器系统后无法启动是什么原因?
  • [LeetCode] 47. 全排列Ⅱ
  • 如何成为一个优秀的大数据开发工程师?
  • 基于SpringBoot的流浪动物管理系统设计与实现
  • Java面试题十三
  • 【Linux网络】Linux网络基础入门:初识网络,理解网络协议
  • 微知-Lecroy力科的PCIe协议分析仪型号命名规则(PCIe代,金手指lanes数量)
  • SQL Server 当前日期及其未来三天的日期
  • 【pytest中同一个用例多次执行生成一个测试报告的方法】
  • 学习FPGA需要掌握哪些语言
  • 线程支持库(C++11)
  • 【JavaEE初阶】网络原理-深入理解网络通信中协议的概念