当前位置: 首页 > article >正文

加载Word2Vec模型时候出现的错误总结

加载Word2Vec模型时候出现的错误总结

首先,要明确gensim内置了训练和加载各种预训练的词向量模型,如Word2Vec、FastText、GloVe等,所以我们这里有关Word2Vec的错误要要联想到可能是gensim库出现了问题!!!

源代码:

word_vectors = gensim.models.KeyedVectors.load_word2vec_format('./tool/zhwiki_2017_03.sg_50d.word2vec', binary=False)
vocab = word_vectors.wv.vocab
print('搜狗词向量语料加载,成功!')

错误1展示:

在这里插入图片描述

错误1原因:

从错误提示中可以看出,无属性wv,经过查找错误和官方文档发现,在gensim 4.0.0及以上版本中,gensim库的最新版本(4.0.1及以上)已经将KeyedVectors作为一个独立的类,因此不再需要使用"wv"属性来访问词向量。您可以直接使用加载的KeyedVectors对象进行操作。

错误1解决办法:

既然版本升级以后,不再使用wv属性来访问,则直接将wv去掉,直接去访问vocab

第一次修改后代码:

word_vectors = gensim.models.KeyedVectors.load_word2vec_format('./tool/zhwiki_2017_03.sg_50d.word2vec', binary=False)
vocab = word_vectors.vocab
print('搜狗词向量语料加载,成功!')

修改代码以后再次运行程序,发现开始出现错误2

错误2展示:

在这里插入图片描述

错误2原因:

从错误2的描述内容来看,错误的原因是在gensim 4.0.0及以上版本中,KeyedVectors类不再具有"vocab"属性,而是直接将词汇表作为字典存储在KeyedVectors对象中

错误2解决:

既然库版本升级以后,也不再使用vocab了,而是换了另外一种新的方式来访问,则将vocab这种旧的访问方式去掉,换成新的访问方式

错误2修改后代码:

word_vectors = gensim.models.KeyedVectors.load_word2vec_format('./tool/zhwiki_2017_03.sg_50d.word2vec', binary=False)
vocab = word_vectors.key_to_index
print('搜狗词向量语料加载,成功!')

两个错误修改以后,再次启动,程序就可以正常运行了


http://www.kler.cn/a/2689.html

相关文章:

  • 【CSS】设置滚动条样式
  • 2、蓝牙打印机点灯-GPIO输出控制
  • 单元测试MockitoExtension和SpringExtension
  • 接口测试-postman(使用postman测试接口笔记)
  • OpenAI CEO 奥特曼发长文《反思》
  • Cursor无限续杯——解决Too many free trials.
  • 具备人脸识别功能的多目标在线实时行为检测(yolov5+deepsort+slowfast)
  • [数据结构]直接插入排序、希尔排序
  • gns3:动态路由(ospf) area0 骨干网络(域间)(ABR)+ ospf 连接 rip (外部)(ASBR)+ 区域划分
  • tiles-api-2.0.4 升级tiles3.0.8遇到的问题
  • 三十七、实战演练之接口自动化平台的文件上传
  • MyBatisPlus的Wrapper使用示例
  • 在linux上安装配置nodejs工具,设置环境变量,设置npm国内镜像源,提高下载速度。
  • 深度学习应用技巧4-模型融合:投票法、加权平均法、集成模型法
  • cjson文件格式介绍
  • 音视频开发—MediaCodec 解码H264/H265码流视频
  • SpringBoot 结合RabbitMQ与Redis实现商品的并发下单【SpringBoot系列12】
  • Linux下的指令(常用的指令,以及案例展示)
  • QEMU启动ARM32 Linux内核
  • Thread类的基本用法
  • linux信号理解
  • spring5(四):IOC 操作 Bean 管理(基于注解方式)
  • SQL优化13连问,收藏好!
  • Docker常规安装简介
  • windows微服务部署
  • 天猫2月咖啡行业数据分析(咖啡品牌销量排行)