命名实体识别
背景
一般仅仅提取一些关键的字段,例如名称,时间,组织,地点等。 可应用于关系抽取(二者之间的关系),事件抽取(某人感兴趣的事件),知识图谱,问答系统,机器翻译
模型
LSTM+CRF
LSTM这种模型可以用来学习序列信息。CRF被用来做状态转移概率。
指标
Precision达到80%, Recall达到50%表明可以达标。
Precision:
P
=
T
P
T
P
+
F
P
P=\frac{TP}{TP+FP}
P=TP+FPTP
Recall:
R
=
T
P
T
P
+
F
N
R=\frac{TP}{TP+FN}
R=TP+FNTP
专业名词
O2O:线上到线下Online to Offline
POI: Point of interest
垂直搜索:针对某一个行业的专业搜索引擎。
UGC:用户原创内容
参考资料
美团命名实体识别:
https://zhuanlan.zhihu.com/p/163256192
https://blog.csdn.net/sunshinezhihuo/article/details/108234412
https://www.cnblogs.com/anai/p/11492956.html
https://blog.csdn.net/macanv/article/details/85684284
关于HMM,CRF, LSTM做实体识别的博客
https://www.lookfor404.com/%E5%91%BD%E5%90%8D%E5%AE%9E%E4%BD%93%E8%AF%86%E5%88%AB%E7%9A%84%E8%AF%AD%E6%96%99%E5%92%8C%E4%BB%A3%E7%A0%81/
https://mp.weixin.qq.com/s?__biz=MzA3NDIyMjM1NA==&mid=2649036099&idx=1&sn=7671dfd7c4f748c3aa0d12f57956fabf&chksm=8712ab3eb065222862a03a0f18ec62cce6a6a8166656a3477c7c2f492c9749b7b68b75679693&mpshare=1&scene=1&srcid=&sharer_sharetime=1572016847231&sharer_shareid=4fa659852096f33de8f023fd01576ab8&key=68be3ae943e49b4fbb7838f992ea2e842c457074724db7168c475a4bf1116361daf0c2f626cc1f5f6b619c5fc9e1f9ec1e91ef29ab2a2bd3f89dcbcf96828cdd1b3ee44f788225091d6974746deedf1c&ascene=1&uin=OTk1NzUyMjg0&devicetype=Windows+10&version=62070152&lang=zh_CN&pass_ticket=6AIkBD91lXgG6tU+pIy+UhgTchkQRsROj4GqFT1Fs9vsp6i0wq/ljafTyMzMsw8O
https://www.pianshen.com/article/874512843/ (实体识别的一些应用)
为什么要基于预测模型做实体识别
https://tech.meituan.com/2020/07/23/ner-in-meituan-nlp.html
实战
https://zhuanlan.zhihu.com/p/88547918
NerCode
使用
参考资料
Li J, Sun A, Han J, et al. A survey on deep learning for named entity recognition[J]. IEEE Transactions on Knowledge and Data Engineering, 2020, 34(1): 50-70.
https://zhuanlan.zhihu.com/p/373304254 (综述对应的知乎文章)
https://blog.csdn.net/kevinjin2011/article/details/124691670(前沿方法总结)