当前位置: 首页 > article >正文

faiss 用于检索10亿向量(维度768)的方法

faiss 用检索10亿向量(维度768)的方法,注意考虑占用内存空间大小不能超过100G,因为100G已经是很多服务器内存的极限了,有的128G已经是超规格的机器了。价格也就是2000左右(月租)。

要处理 10 亿个 768 维的向量,并且限制内存占用不超过 100G,我们需要使用 FAISS 中的一些高效索引类型和优化策略。以下是一个可行的方法:

愿我们终有重逢之时,而你还记得我们曾经讨论的话题。

 group 868373192

 second group 277356808

1. 选择合适的索引类型

考虑到内存限制,我们可以使用 faiss.IndexIVFScalarQuantizer,它结合了倒排索引(IVF)和标量量化(Scalar Quantization)技术,能够在减少内存占用的同时保持较高的搜索精度。

2. 安装 FAISS

首先,确保你已经安装了 FAISS 库。你可以通过以下命令安装:

pip install faiss-cpu  # 或者 faiss-gpu,如果你有 GPU 支持

3. 导入 FAISS 库

import faiss
import numpy as np

http://www.kler.cn/a/381614.html

相关文章:

  • 《Mycat核心技术》第06章:Mycat问题处理总结
  • VSCode 插件开发实战(七):插件支持了哪些事件,以及如何利用和监听这些事件
  • vue3 Proxy替换vue2 defineProperty的原因
  • Echarts连接数据库,实时绘制图表详解
  • 发际线不断后移,生发液排行榜第一名,让绒毛碎发爆出来
  • 一次成功流水账-RBDL库的安装与验证
  • 6. STM32之TIM实验--编码器接口()--(实验5:PWM驱动直流电机)
  • Vue中简单状态管理
  • PyTorch 2.0: 开启深度学习框架新纪元
  • Qt学习笔记第41到50讲
  • ubuntu 24.04中安装 Easyconnect,并解决版本与服务器不匹配问题
  • C#语言发展历史
  • Nginx配置文件编写示例
  • 【ARM Linux 系统稳定性分析入门及渐进 2.1 -- Crash 命令 Session Control 集合】
  • DNS正反向解析,区域备份
  • 计算机毕业设计Python+大模型膳食推荐系统 知识图谱 面向慢性病群体的膳食推荐系统 健康食谱推荐系统 机器学习 深度学习 Python爬虫 大数据毕业设计
  • 室内定位论文精华-20241104
  • 【深度学习】梯度累加和直接用大的batchsize有什么区别
  • c语言简单编程练习10
  • 前后端分离,Jackson,Long精度丢失
  • 命令行参数、环境变量、地址空间
  • Django遍历文件夹及文件
  • 设置HTTP会话(Session)的Cookie域
  • doris使用使用broker从HDFS导入数据
  • ArcGIS/QGIS按掩膜提取或栅格裁剪后栅格数据的值为什么变了?
  • 域名自动重定向8080端口无法访问后端服务问题