当前位置: 首页 > article >正文

AI主流向量数据库整理

文章目录

  • AI常用向量数据库整理
    • Chroma
    • pgvector
    • Milvus
    • LanceDB
    • Qdrant

AI常用向量数据库整理

在人工智能时代,向量数据库已成为数据管理和AI模型不可或缺的一部分。

向量数据库是一种将数据(包括文本、图像、音频和视频)存储为向量的数据库。

向量数据库的主要好处是它能够根据向量的接近程度或相似性(在转换为向量之后)快速准确地定位和检索数据。

这允许基于语义或上下文相关性进行搜索,而不是像传统数据库那样仅依赖于完全匹配或设置标准。例如,使用矢量数据库,可以:

  • 查找具有相似声音和节奏的歌曲
  • 发现具有相同主题和观点的文章
  • 识别具有相似功能和评论的商品

数据来自:https://github.com/phidatahq/phidata/tree/main/cookbook/vectordb

Chroma

Chroma: https://www.trychroma.com/

Chroma DB是一个开源的、AI本地的嵌入式向量数据库,旨在简化通过使知识、事实和技能对大型语言模型(LLM)规模上的机器学习模型可插拔,从而创建由自然语言处理驱动的LLM应用程序的过程,同时避免幻觉。

pgvector

Pgvector: https://github.com/pgvector/pgvector

pgvector是一个用于搜索向量相似性的PostgreSQL扩展,也可以用于存储嵌入。pgvector最终帮助你将所有应用程序数据存储在一个地方。
其用户可以受益于ACID合规性、时间点恢复、JOIN等所有其他优秀特性。

pgvector的关键特性包括:
精确和近似最近邻搜索
L2距离、内积和余弦距离
任何带有PostgreSQL客户端的语言

Milvus

官网:https://milvus.io/

Milvus 是一个开源的向量数据库,适合各种规模的人工智能应用。

LanceDB

LanceDB GitHub Repository: https://github.com/lancedb/lancedb
LangChain Documentation: https://python.langchain.com/

LanceDB是一款针对AI应用的新型开发者友好型无服务器向量数据库。它可嵌入应用程序中,无需管理服务器,其扩展性依赖于磁盘而非内存,具有低延迟性。LanceDB支持向量搜索、全文搜索和SQL,并针对多模态数据进行了优化。这一新版本,LanceDB 2.0,已在Github上开源。

Qdrant

官网: https://qdrant.tech/
github:https://github.com/qdrant/qdrant

Qdrant 是专为扩展过滤支持而设计的向量相似度搜索引擎和向量数据库,这使得它适用于各种基于神经网络的语义匹配、图像搜索等应用。

Qdrant 使用 Rust 🦀 编写,即使在高负载下也能快速、可靠地工作。


http://www.kler.cn/a/456913.html

相关文章:

  • 车间管理:掌握方法,有效应对浪费
  • 【Wi-Fi】802.11u、WPA、WPA2/WPA3-ENterprise、Hotspot 、IEEE802.11x的关系
  • ARM64 Windows 10 IoT工控主板运行x86程序效率测试
  • 解决springdoc-openapi-ui(Swagger3)跳转默认界面问题
  • VSCode快捷键Ctrl+/是注释;Ctrl+\是拆分编辑器;Ctrl+w是关闭编辑器
  • MySQL三大日志—— binlog、redoLog、undoLog 详解
  • 基于规则的系统架构:理论与实践
  • C语言中的贪心算法
  • BigDecimal解决精度问题
  • 【git】将项目上传到github、gitee
  • 【蓝桥杯每日一题】与或异或——DFS
  • 【Docker命令】如何使用 `docker cp` 命令拷贝容器文件到宿主机
  • Dify智能体进阶:Selenium截取动图
  • Git完整使用经历
  • 0基础带你python入门:pyQT + OpenCV相关练习
  • 调试文件系统(DebugFS )
  • Flutter 实现全局悬浮按钮学习
  • 微信小程序页面传参长度问题
  • Blender真实灰尘粒子动画资产预设 Dust Particles Pro V1.2
  • JVM常用参数
  • 《易经》在 Java 编程中的应用
  • Flutter 异步编程简述
  • 卷积神经网络(CNN)模型 CIFAR-10 数据集 例子
  • 学习,指针和FLASH
  • 02-18.python入门基础一基础算法
  • [江科大STM32] 第五集STM32工程模板——笔记