当前位置: 首页 > article >正文

深度学习速通系列:超长法律文件隐私过滤(基于预训练模型Bert)

法律文件隐私过滤

网上使用bert的中文模型进行命名识别教程少的可怜,摸索了一周的时间,硬是把法律文书的人名全部识别出来了,目前可以达到98.9999%(开玩笑的,不过准确率保守估计是有90%以上).注意:这个法律文书目前只是针对裁决书,其他还没测试过,可支持超长文本识别

github仓库地址

欢迎各位点个☆Star!!!

使用的模型

bert-base-chinese-ner 下载路径:https://hf-mirror.com/ckiplab/bert-base-chinese-ner (国内镜像,不用魔法也能访问)
下载好,直接放在当前目录下

使用步骤

1.先去下载模型,放在当前目录下
2.将里面的text改成你的文本,"text=''' 你的法律文书内容''' "
3.全局搜索from_pretrained,后面的两处路径都改成模型的绝对路径
4.启动person_filterling.py文件
5.在当前目录找到一个.docx文件,直接打开,就可以看到识别后的文件了

提醒

虽然项目只是针对了法律文书进行了调整,也可以尝试使用其他类型文本,效果应该也是可观的


http://www.kler.cn/news/355537.html

相关文章:

  • R语言机器学习算法实战系列(六)K-邻近算法 (K-Nearest Neighbors)
  • 笔试题总结
  • 【复盘笔记】25国考一期_套题1
  • 9.6 Linux_I/O_IO模型
  • 开源 AI 智能名片 2+1 链动模式 S2B2C 商城小程序:企业产供销全流程的创新驱动
  • {输电线路监控设备功耗}
  • 疗愈门店系统|个案疗愈系统|疗愈小程序对美业门店管理有哪些作用?美业收银系统源码
  • 代理 IP 在 AI 爬虫中的关键应用
  • 华为开发者论坛入口
  • 华为HCIP-openEuler认证详解
  • UNIX网络编程-传输层
  • Java基于SSM微信小程序物流仓库管理系统设计与实现(lw+数据库+讲解等)
  • Redis数据可视化如何实现?
  • 滑动窗口-无重复字符的最长字串
  • Java老鸟前端小白uniapp+uview开发小程序第2天
  • HTML第一次作业
  • 【X11转发】解决远程服务器无法显示可视化GUI问题(Mac m1)
  • WS2812 可以用3.3V 电源驱动
  • docker 多架构接口数据交换
  • 人工智能教学实验箱_国产处理器:5-29 语音识别控制实验