当前位置：首页 > article >正文

深度学习-16-深入理解BERT基于本地数据微调训练文本分类模型的流程

article 2024/11/15 23:34:33

文章目录

1 加载库和设置通用参数
- 1.1 DistilBert
- 1.2 模型库
- 1.3 微调任务
2 准备数据
- 2.1 加载数据
- 2.2 切分数据
- 2.3 数据分词
- 2.4 制作数据集
3 使用Trainer API微调transformer
- 3.1 加载预训练模型
- 3.2 定义训练器
- 3.3 执行训练
- 3.4 评估性能
- 3.5 保存模型
4 使用训练好的模型
5 参考附录

1 加载库和设置通用参数

import pandas as pd
import torch
import transformers
from transformers import DistilBertTokenizerFast
from transformers import DistilBertForSequenceClassification

torch.backends.cudnn.deterministic = True  # 用于固定cuda的随机数种子
RANDOM_SEED = 123
torch.manual_seed(RANDOM_SEED)

http://www.kler.cn/a/316612.html

相关文章：

A3超级计算机虚拟机，为大型语言模型LLM和AIGC提供强大算力支持

FFmpeg 4.3 音视频-多路H265监控录放C++开发十三.2：avpacket中包含多个 NALU如何解析头部分析

深度学习之pytorch常见的学习率绘制

vue3+elementplus+虚拟树el-tree-v2+多条件筛选过滤filter-method

websocket初始化

androidstudio下载gradle慢

SQL语法学习指南

9月23日

Shiro rememberMe反序列化漏洞（Shiro-550）靶场攻略

水下攻防面试题

『功能项目』QFrameWork拾取道具UGUI【69】

深度学习速通系列：什么是文本数据标注

《SmartX ELF 虚拟化核心功能集》发布，详解 80+ 功能特性和 6 例金融实践

高级大数据开发协会

PHP邮件发送教程：如何用PHP发送电子邮件？

4.结构型设计模式 - 第1回：引言与适配器模式 (Adapter Pattern) ——设计模式入门系列

Vulkan 学习(8)---- vkImageView 创建

关于SpringBoot项目使用maven打包由于Test引起的无法正常打包问题解决

亲测好用，ChatGPT 3.5/4.0新手使用手册~

振弦式渗压计常见故障有哪些?怎么解决?

探秘淘宝商品详情原数据：主图与数据的神秘获取之旅

盲盒扭蛋机系统开发源码部署

LeetCode 滑动窗口每个字符最多出现两次的最长子字符串

中小微企业生产管理利器-- 超轻量生产工单系统

微信支付开发-后台统计工厂实现

优化SQL查询的常见方法