当前位置: 首页 > article >正文

深度学习-16-深入理解BERT基于本地数据微调训练文本分类模型的流程

文章目录

  • 1 加载库和设置通用参数
    • 1.1 DistilBert
    • 1.2 模型库
    • 1.3 微调任务
  • 2 准备数据
    • 2.1 加载数据
    • 2.2 切分数据
    • 2.3 数据分词
    • 2.4 制作数据集
  • 3 使用Trainer API微调transformer
    • 3.1 加载预训练模型
    • 3.2 定义训练器
    • 3.3 执行训练
    • 3.4 评估性能
    • 3.5 保存模型
  • 4 使用训练好的模型
  • 5 参考附录

1 加载库和设置通用参数

import pandas as pd
import torch
import transformers
from transformers import DistilBertTokenizerFast
from transformers import DistilBertForSequenceClassification

torch.backends.cudnn.deterministic = True  # 用于固定cuda的随机数种子
RANDOM_SEED = 123
torch.manual_seed(RANDOM_SEED)  

http://www.kler.cn/a/316612.html

相关文章:

  • A3超级计算机虚拟机,为大型语言模型LLM和AIGC提供强大算力支持
  • FFmpeg 4.3 音视频-多路H265监控录放C++开发十三.2:avpacket中包含多个 NALU如何解析头部分析
  • 深度学习之pytorch常见的学习率绘制
  • vue3+elementplus+虚拟树el-tree-v2+多条件筛选过滤filter-method
  • websocket初始化
  • androidstudio下载gradle慢
  • SQL语法学习指南
  • 9月23日
  • Shiro rememberMe反序列化漏洞(Shiro-550) 靶场攻略
  • 水下攻防面试题
  • 『功能项目』QFrameWork拾取道具UGUI【69】
  • 深度学习速通系列:什么是文本数据标注
  • 《SmartX ELF 虚拟化核心功能集》发布,详解 80+ 功能特性和 6 例金融实践
  • 高级大数据开发协会
  • PHP邮件发送教程:如何用PHP发送电子邮件?
  • 4.结构型设计模式 - 第1回:引言与适配器模式 (Adapter Pattern) ——设计模式入门系列
  • Vulkan 学习(8)---- vkImageView 创建
  • 关于SpringBoot项目使用maven打包由于Test引起的无法正常打包问题解决
  • 亲测好用,ChatGPT 3.5/4.0新手使用手册~
  • 振弦式渗压计常见故障有哪些?怎么解决?
  • 探秘淘宝商品详情原数据:主图与数据的神秘获取之旅
  • 盲盒扭蛋机系统开发源码部署
  • LeetCode 滑动窗口 每个字符最多出现两次的最长子字符串
  • 中小微企业生产管理利器-- 超轻量生产工单系统
  • 微信支付开发-后台统计工厂实现
  • 优化SQL查询的常见方法