当前位置: 首页 > article >正文

gpt2的学习

现在学习下gpt2模型做摘要,我们都知道gpt2 是纯decoder,做摘要说话的效果较好。
把数据拆分
在这里插入图片描述
在这里插入图片描述
按照这个进行tokenizer
用这个tokenizer = BertTokenizer.from_pretrained(‘bert-base-chinese’)
在这里插入图片描述
2w多词汇表
用交叉熵做lossf,在这里插入图片描述
设好一些简单的训练参数
在这里插入图片描述
开始了漂亮的训练
载入模型开始预测
在这里插入图片描述
在这里插入图片描述
还是可以基本做出摘要的。基本可以用,就是代码仍然感觉不是很简单。
shift_logits = outputs.logits[…, :-1, :] 是忽略最后一个词
shift_labels = labels[…, 1:] 目标数据集忽略第一个词,拿这2个来比较算loss,很不容易理解。


http://www.kler.cn/a/407161.html

相关文章:

  • 遗传算法(Genetic Algorithm, GA)
  • Android蓝牙架构,源文件目录/编译方式学习
  • Python 中的三重引号
  • Python 使用 Token 认证方案连接 Kubernetes (k8s) 的详细过程
  • 运维团队3D可视化智能机房管理方案
  • 面试小札:Java的类加载过程和类加载机制。
  • LVM缩容
  • Chrome DevTools Protocol 进阶:DOM 域
  • 开放性实验——网络安全渗透测试
  • Flutter实现气泡提示框学习
  • 设计模式-创建型-抽象工厂模式
  • Android kotlin之配置kapt编译器插件
  • 微信小程序数据绑定与事件绑定详解:从入门到精通
  • Unity UI射线检测 道具拖拽
  • 网络安全与加密
  • Spring Boot 整合 Prometheus 实现资源监控
  • 全面提升系统安全:禁用不必要服务、更新安全补丁、配置防火墙规则的实战指南
  • 鸿蒙开发-音视频
  • AI赋能 Python编程之2. 从构思到优化:用AI快速实现Python项目
  • 【多线程-第一天-多线程的执行原理-多线程的优缺点-主线程 Objective-C语言】
  • Arcpy 多线程批量重采样脚本
  • 11 —— 打包模式的应用
  • 一站式学习:害虫识别与分类图像分割
  • 汽车加油行驶问题-动态规划算法(已在洛谷AC)
  • 埃文科技携手河南企业代表团亮相第十九届广州中博会
  • 移门缓冲支架:为好梦加分