当前位置：首页 > article >正文

gpt2的学习

article 2024/11/24 12:24:48

现在学习下gpt2模型做摘要，我们都知道gpt2 是纯decoder，做摘要说话的效果较好。
把数据拆分
在这里插入图片描述

按照这个进行tokenizer
用这个tokenizer = BertTokenizer.from_pretrained(‘bert-base-chinese’)

2w多词汇表
用交叉熵做lossf，
设好一些简单的训练参数

开始了漂亮的训练
载入模型开始预测

还是可以基本做出摘要的。基本可以用，就是代码仍然感觉不是很简单。
shift_logits = outputs.logits[…, :-1, :] 是忽略最后一个词
shift_labels = labels[…, 1:] 目标数据集忽略第一个词，拿这2个来比较算loss，很不容易理解。

http://www.kler.cn/a/407161.html

相关文章：

遗传算法（Genetic Algorithm, GA）

Android蓝牙架构，源文件目录/编译方式学习

Python 中的三重引号

Python 使用 Token 认证方案连接 Kubernetes (k8s) 的详细过程

运维团队3D可视化智能机房管理方案

面试小札：Java的类加载过程和类加载机制。

LVM缩容

Chrome DevTools Protocol 进阶：DOM 域

开放性实验——网络安全渗透测试

Flutter实现气泡提示框学习

设计模式-创建型-抽象工厂模式

Android kotlin之配置kapt编译器插件

微信小程序数据绑定与事件绑定详解：从入门到精通

Unity UI射线检测道具拖拽

网络安全与加密

Spring Boot 整合 Prometheus 实现资源监控

全面提升系统安全：禁用不必要服务、更新安全补丁、配置防火墙规则的实战指南

鸿蒙开发-音视频

AI赋能 Python编程之2. 从构思到优化：用AI快速实现Python项目

【多线程-第一天-多线程的执行原理-多线程的优缺点-主线程 Objective-C语言】

Arcpy 多线程批量重采样脚本

11 —— 打包模式的应用

一站式学习：害虫识别与分类图像分割

汽车加油行驶问题-动态规划算法（已在洛谷AC）

埃文科技携手河南企业代表团亮相第十九届广州中博会

移门缓冲支架：为好梦加分