当前位置: 首页 > article >正文

Spacy小笔记:zh_core_web_trf、zh_core_web_lg、zh_core_web_md 和 zh_core_web_sm区别

Spacy小笔记

最近频繁用到spacy,就小记一下。
2024.11.29

zh_core_web_trf、zh_core_web_lg、zh_core_web_md 和 zh_core_web_sm区别

首先,它们都是预训练的中文模型:

  • zh_core_web_trf:395M
    架构: 基于 Transformer 架构(bert-base-chinese)。
    大小: 较大,通常在几十到几百 MB 之间。
    性能: 最高,尤其在复杂的自然语言处理任务上表现优秀,如命名实体识别、依存关系解析等。
    资源需求: 需要较多的计算资源和时间来加载和运行。
    适用场景: 需要最高准确性的复杂任务,如情感分析、机器翻译等。
  • zh_core_web_lg:575M
    架构: 基于传统的统计方法。
    大小: 较大,通常在几十 MB 到 100 MB 之间。
    性能: 较好,适用于大多数常见的自然语言处理任务。
    资源需求: 需要的计算资源比 trf 模型少,但比 md 模型多。
    适用场景: 一般用途的任务,如文本分类、实体识别等。
  • zh_core_web_md:74M
    架构: 基于传统的统计方法。
    大小: 中等,通常在几十 MB 之间。
    性能: 适中,适用于大多数常见的自然语言处理任务。
    资源需求: 需要的计算资源较少,适合资源受限的环境。
    适用场景: 一般用途的任务,如文本分类、实体识别等。
  • zh_core_web_sm:46M
    架构: 基于传统的统计方法。
    大小: 较小,通常在几 MB 到十几 MB 之间。
    性能: 较低,但在某些简单任务上仍然有效。
    资源需求: 需要的计算资源最少,适合资源非常有限的环境。
    适用场景: 简单的任务,如基本的分词、词性标注等。

下载地址:https://github.com/explosion/spacy-models/

上面这些库下载后都通过pip安装,注意要和对应版本的spacy匹配!

实际使用过程中,发现md、lg、trf三者的区别并不大,也许md是性价比最高的选择?


http://www.kler.cn/a/417243.html

相关文章:

  • Golang的引用类型和指针
  • 大学资产管理系统中的下载功能设计与实现
  • STM32的HAL库开发---高级定时器---输出比较模式实验
  • C++版本DES加密/解密
  • 8. k8s二进制集群之Kubectl部署
  • SpringBoot的工作原理
  • 在鸿蒙应用中 Debug 对开发者的帮助
  • Spring AOP相关知识详解
  • 3d扫描建模产品开发-三维扫描检测蓝光检测
  • 基于大数据python 社团管理系统(源码+LW+部署讲解+数据库+ppt)
  • 【北京迅为】iTOP-4412全能版使用手册-第二十四章 进程创建与回收
  • mind+自定义库编写注意事项
  • Gradle vs. Maven: 到底哪个更适合java 项目?
  • LeetCode 力扣 热题 100道(十一)字母异位词分组(C++)
  • 力扣_876. 链表的中间结点
  • UE5 打包报错 Unknown structure 的解决方法
  • 入门产品经理,考PMP还是NPDP?
  • 在windows上安装sqlite
  • ENSP IPV6-over-IPV4
  • windows11 使用体验记录
  • webpack(react)基本构建
  • 实习冲刺第三十六天
  • 【React】React 组件通信:多种方式与最佳实践
  • shodan2-批量查找CVE-2019-0708漏洞
  • OceanBase数据库系列之:基于docker快速安装OceanBase数据库,基于linux服务器快速部署OceanBase数据库
  • 2025年Java面试八股文大全