当前位置: 首页 > article >正文

【大模型-知识库之本地安装Embendding模型(BGE-M3)】

本地安装Embendding模型(BGE-M3)

  • 拉取模型
    • 1.安装Ollama
    • 2.拉取BGE-M3模型
  • 本地通过python 调用BGE-M3模型,将内容进行向量化

通过python进行文档内容的解析、分片、并调用向量模型将分片内容进行向量化,存入向量数据库中,其中向量转化可以使用开源的模型进行处理。

拉取模型

1.安装Ollama

访问Ollama官网下载并安装适用于本地操作系统的版本。

在这里插入图片描述

下载安装包后,执行安装程序,一直确认默认选项下一步就好。

在这里插入图片描述

安装完成后,在命令提示符或终端中执行:

ollama

显示如下即安装成功。

在这里插入图片描述

2.拉取BGE-M3模型

访问ollama官网,搜索BGE-M3模型,复制下载命令在命令提示符或终端中执行,等待下载,时间较长。

ollama pull bge-m3

在这里插入图片描述

等待模型下载完成,可通过 ollama list 验证是否安装成功‌

ollama list

在这里插入图片描述

本地通过python 调用BGE-M3模型,将内容进行向量化

在Pycharm的终端中安装 langchain-community 库

pip install langchain-community

在这里插入图片描述

此外,OllamaEmbeddings 可能依赖于其他库,具体取决于 langchain-community的实现细节。如果安装后遇到缺少其他库的错误,可以根据错误提示继续安装相应的库。

# 导入 OllamaEmbeddings 类,用于生成文本嵌入向量。
from langchain_community.embeddings import OllamaEmbeddings

# 初始化嵌入模型,指定模型名称为 bge-m3
embeddings = OllamaEmbeddings(model="bge-m3")

# 定义待处理文本
text = "Hello World!"

# 调用 embed_query 方法生成嵌入向量
embedding = embeddings.embed_query(text)

# 打印生成的嵌入向量的前5维特征值。
print(embedding[:5])  

输出向量:

在这里插入图片描述


http://www.kler.cn/a/593721.html

相关文章:

  • ROS机器人建模与仿真设计——模型控制理论
  • 【文章写作】以数字素养筑基,绘治理现代化蓝图
  • Linux笔记之Ubuntu22.04安装IBus中文输入法教程
  • 大模型——Ollama-OCR 简明教程
  • 「JavaScript深入」Socket.IO:基于 WebSocket 的实时通信库
  • 在Orin上查看CUDA cuDNN TensorRT的版本
  • 进程管理笔记1-进程线程基础知识
  • QML开发入门1--安装QT6.8和新建第一个QtQuickApplication
  • 某公司制造业研发供应链生产数字化蓝图规划P140(140页PPT)(文末有下载方式)
  • 【NGINX代理附件上传服务配置优化】
  • python-websocket压力测试
  • 【Git学习笔记】深度理解Git的分布式版本控制系统及其管理
  • 【Python办公】提取Excel嵌入图片流程(代码前期步骤)
  • MySQL InnoDB大表DDL时出现唯一键冲突
  • 知识蒸馏: Distilling the Knowledge in a Neural Network(上)
  • SAME51J20A Curiosity Nano|支持Arduino开发,适用于物联网终端、工业控制及人机交互场景
  • 微信小程序:用户拒绝小程序获取当前位置后的处理办法
  • github上传本地文件到远程仓库(空仓库/已有文件的仓库)
  • 新型胶囊来助力!可无线监测上皮屏障
  • LS-NET-004-简单二层环路解决(华为锐捷思科)