当前位置: 首页 > article >正文

nlp第八节——序列标注任务

一、介绍

序列标注任务是基于文本中的每个时间步做分类,得到每个时间步的标签
对于输入:X1X2X3X4….Xn
预测输出:Y1Y2Y3Y4……Yn
应用场景:
分词,词性标注,句法分析,命名实体识别(NER)等

二、命名实体识别

在这里插入图片描述
BA:地址左边界 MA:地址内部 EA:地址右边界

BO:机构左边界 MO:机构内部 EO:机构右边界

BP:人名左边界 MP:人名内部 EP:人名右边界

O:无关字

深度学习:
基于神经网络,将每个token向量化,预测分类标签
在这里插入图片描述
crf:
crf是基于分类后的概率分布训练出一个转移概率矩阵的,维度是label nums×label nums
在这里插入图片描述
crf的loss定义为:
在这里插入图片描述
经过crf场后会得到一个转移概率矩阵,所以我们还需要一个解码过程:
beamsearch:
在每个结点x上只保留下一列节点中到x概率最大的beamsize个结点的路径,复杂度为n(层数)×beamsize×D
维特比解码:
在每个结点x上只保留前一列节点中到他概率最大的那条路经(转移概率乘前面那个结点上的概率),复杂度为n(层数)×D×D

NER的评价指标:
序列标注准确率 ≠ 实体挖掘准确率
因为可能出现前三个字预测正确,但是最后一个字预测错误,这样正确率高,但是实体挖掘准确率不高。实体需要完整命中才能算正确。
准确率(accuracy):预测的准确率。TP(true positive)+TN(true negative)/TP+TN+FP(false positive)+FN(false negative)
召回率(recall):在正样本中召回正样本的比例。TP/TP+FN
precision:TP/TP+NP
F1值:在这里插入图片描述
macroF1:对所有类别的F1值取平均
microF1:将所有样本的召回率、准确率一起计算,最后带入算F1值
两种计算方式的区别在于样本是否均衡。
句子级别的序列标注:
将每句话进行向量化,之后仅需进行序列标注


http://www.kler.cn/a/570259.html

相关文章:

  • Spring Security + OAuth2.0
  • C++运算符重载的学习笔记
  • 【计算机网络】HTTP1.0/1.1/2.0对比,常用请求方式总结,HTTPS加密过程,浏览器访问域名详细过程
  • 记一次复杂分页查询的优化历程:从临时表到普通表的架构演进
  • Linux远程连接vscode
  • OpenCV(12):图像拼接、简单滤镜效果
  • 磁盘空间不足|如何安全清理以释放磁盘空间(开源+节流)
  • Pytorch实现之SRGAN+CBAM的结构设计
  • 【Transformer优化】什么是稀疏注意力?
  • 测试工程师Ai应用实战指南简例prompt
  • 软考教材重点内容 信息安全工程师 第18章 网络安全测评技术与标准
  • C语言嵌入式Linux高级编程:程序的编译、链接与运行深度解析
  • vue 和 react 底层采用的 diff 算法的区别
  • [数据结构]用栈实现队列
  • JUC模块
  • 点云 PCA生成包围盒流程
  • 我代表中国受邀在亚马逊云科技全球云计算大会re:Invent中技术演讲
  • 软件工程---净室软件工程
  • 分布式锁—2.Redisson的可重入锁二
  • 【基于RabbitMQ的消息队列服务器模拟实现】