当前位置: 首页 > article >正文

BERT详解

1.背景结构

1.1 基础知识

BERT(Bidirectional Encoder Representations from Transformers)是谷歌提出,作为一个Word2Vec的替代者,其在NLP领域的11个方向大幅刷新了精度,可以说是前几年来自残差网络最优突破性的一项技术了。论文的主要特点以下几点:

  1. 使用了双向Transformer作为算法的主要框架,之前的模型是从左向右输入一个文本序列,或者将 left-to-right 和
    right-to-left 的训练结合起来,实验的结果表明,双向训练的语言模型对语境的理解会比单向的语言模型更深刻;
  2. 使用了Mask Language Model(MLM) 和 Next Sentence Prediction(NSP) 的多任务训练目标;
  3. 使用更强大的机器训练更大规模的数据,使BERT的结果达到了全新的高度,并且Google开源了BERT模型,用户可以直接使用BERT作为Word2Vec的转换矩阵并高效地将其应用到自己的任务中。

BERT 只利用了 Transformer 的 encoder 部分。因为 BERT 的目标是生成语言模型,所以只需要 encoder 机制。


http://www.kler.cn/a/508744.html

相关文章:

  • OpenGL —— 基于Qt的视频播放器 - ffmpeg硬解码,QOpenGL渲染yuv420p或nv12视频(附源码)
  • 初识go语言之指针用法
  • 精度论文:【Focaler-IoU: More Focused Intersection over Union Loss】
  • Vue.js组件开发-实现输入框与筛选逻辑
  • Spring Boot Actuator 详细介绍
  • C#上位机通过CAN总线发送bin文件
  • linux解压命令(可整理到CSDN)
  • 【gin】模型绑定、参数验证及文件上传go案例演示
  • w163美食推荐商城
  • unity2022以上导出到AndroidStudio后更新步骤
  • 智能学习环境(Intelligent Learning Environment,ILE)
  • 如何发现架构中的耦合(5大场景)?(第36讲)
  • G1原理—10.如何优化G1中的FGC
  • 几种矩阵内积的定义和计算
  • git使用-合并代码查看是否冲突解决冲突
  • 基于springboot+vue.js+uniapp技术开发的一套大型企业MES生产管理系统源码,支持多端管理
  • 麒麟V10系统上安装Oracle
  • Golang:报错no required module provides package github.com/xx的解决方法
  • Oracle连接数满问题解决及排查 ORA-00020:maximumnumber of processes
  • 【人工智能】从Keras到TensorFlow 2.0:深入掌握Python深度学习技术
  • 【统计的思想】假设检验(一)
  • 如何在 Rocky Linux 上安装极狐GitLab?
  • stm32控制直流电机程序
  • 无限世界中的具身导航与交互!InfiniteWorld:通用视觉语言机器人交互的统一仿真框架
  • C++多态的认识与理解
  • doris: Flink导入数据