当前位置: 首页 > article >正文

[Bert模型微调]

1. attention_mask 问题

  • https://blog.csdn.net/python_plus/article/details/136194789

有效的值为1,无效的为0。

但是即使反过来,让有效的变成0,他也是能拟合的!!只不过效果会很差。所以debug的时候就很烦xxx

2. 使用pad+attention_mask的效果和不使用mask+没有pad的效果是不一样的

很神奇的一个问题,我也不知道后续能不能复现。

a = [101, 1, 2, 3, 102, 0, 0, 0, 0, 0]
a = torch.tensor(a).reshape(1, -1)
amask = torch.tensor([1, 1, 1, 1, 1, 0, 0, 0, 0, 0]).reshape(1, -1)
a = bert(input_ids=a, attention_mask=amask)

b = [101, 1, 2, 3, 102]
b = torch.tensor(b).reshape(1, -1)
b = bert(input_ids=b)

assert torch.allclose(a, b, atol=1e-5)  # assert false

http://www.kler.cn/news/358295.html

相关文章:

  • TOMCAT Using CATALINA——OPTS,闪退解决方法(两种)
  • oracle ORA-24920:列大小对于客户机过大
  • 【AIGC】智能创作的革新与未来展望
  • PMOS和NMOS管
  • iOS 大数相乘
  • 【Bug】STM32串口空闲中断接收不定长数据异常
  • PyTorch:强大灵活的深度学习框架
  • 多IP访问浏览器
  • Mybatis 直接传入sql执行, 并且传入参数List<Object> params
  • Ubuntu设置静态IP地址
  • C控制语句
  • 车辆电气化集成式 E/E 系统 应对车辆电气化挑战的端到端解决方案
  • 嵌入式开发介绍以及项目示例
  • python如何提取MYSQL数据,并在完成数据处理后保存?
  • 基于springboot+thymeleaf+springsecurity搭建一套web小案例
  • mysql--视图
  • IDEA使用Alibaba Cloud Toolkit插件自动化部署jar包
  • qs插件使用
  • 【Python-GUI图形化界面-PyQt5模块(4)】——QPushButton核心模块
  • 大数据新视界 --大数据大厂之 Dask:分布式大数据计算的黑马