当前位置: 首页 > article >正文

2024年, Milvus 社区的那些事

66a4881aae7b9fef103adaee44f95391.png

4b5513b823700bc6355fab63ad4bd46c.png

随着跨年钟声响起,2024 年告一段落。这一年,Milvus GitHub Stars 正式突破 3 万大关,Docker 下载量突破6700w 次,达到一个新的里程碑,在开源向量数据库领域继续引领前行。在这遥遥领先的数据背后,不妨让我们一起回头看看,今年 Milvus 的社区里都发生了哪些事情,对于每位关心 Milvus 的朋友会有哪些帮助。

01.

2 个大版本,36 个小版本

所有社区的讨论都是围绕 Milvus 展开的,体现社区活跃度的一个关键指标就是版本迭代速度。2024 年,Milvus 社区一共发布了 36 个版本,平均 2 周不到就会发布一个版本,其中包含两个大的版本系列:2.4 和 2.5 。2.4 系列版本中,Milvus 支持了多向量列能力,以及稀疏向量类型,并且引入了丰富的 GPU 索引,使向量搜索的广度,深度以及性能进一步提升。2.5 系列版本中,Milvus 创新性地提出了基于稀疏向量的 BM25 检索能力,通过内置的 Sparse-BM25 对 Lexical 检索提供了原生支持,响应了社区里一直呼声很高的关键词检索需求。关于这两个大版本的详细功能解读,感兴趣的朋友可以参考以下两篇文章:《引领向量数据库技术新变革,Milvus 2.4 正式上线!》《Milvus 2.5:全文检索上线,标量过滤提速,易用性再突破!》。当然,如果您想了解任意一个版本的特性,提升以及 bugfix,Milvus 官网的 Release Note (https://milvus.io/docs/release_notes.md)页面可以找到答案。

版本迭代速度快,可以证明 Milvus 是一个十分活跃的开源社区,不过对于每一位用户来讲,经常会碰到 2 个问题:

版本这么多,我应该选哪个?

我的版本比较老,怎么升级到新版本?

关于版本选择,我的建议一般是这样,只考虑最新的两个大版本,根据功能需求确定大版本,大版本中选择最新的小版本。Milvus 的发版有这样的规律,一些大点的功能,比如,支持 GPU,多向量,全文检索,都会在一个大版本中首次引入,后续的版本都会包含。当一个大版本发布后,会持续发布一些小版本,主要增加一些小的功能和优化以及进行 bugfix。所以,版本号越大的小版本,也就是越新的小版本,它的稳定性一般都会更好,2.4.20 的稳定性就比2.4.1 的稳定性更好。

至于版本升级,Milvus 官网其实已经提供了很完善的升级指导了,https://milvus.io/docs/upgrade_milvus_cluster-operator.md,一般严格按照官网的文档操作不太会出什么问题。如果还是不放心,我们可以在升级之前,对当前集群的数据使用 Milvus Backup(https://github.com/zilliztech/milvus-backup) 做一个备份,即使发生意外情况,依旧可以恢复老集群。

02.

12 场直播,7 场 Meetup

Milvus 社区的常规活动,主要分为线上直播和线下 Meetup 两类。线上直播我们又分为 UserTech 和 DeepDive 两种类型,UserTech 主要聚焦在用户落地案例以及 Milvus 最佳实践分享,一般会邀请社区的资深用户作为嘉宾,DeepDive 则会重点分享 Milvus 的功能架构,创新技术等话题,偏技术解析更多。直播活动一般每个月都会有一次,UserTech 和 DeepDive 轮流登场,满足不同口味的朋友。并且在直播前一周都会在 Milvus 的用户交流群里进行通知,如果您还不在群里,记得扫描文末的二维码或者直接添加 Zilliz 小助手的微信(zilliz-tech)邀请进群。2024 年,Milvus 社区一共做了 12 场直播,既包括,携程、网易、OPPO 这些 Milvus 资深用户带来的 UserTech,也有Milvus 研发团队带来的,Milvus Lite 详解、ScaNN 算法拆解、向量过滤搜索及优化等 DeepDive。如果发现错过了感兴趣的直播,可以去 Zilliz 的公众号和 B 站账号里找一下回放。

除了丰富的线上直播之外,Milvus 社区还有和开发者面对面交流的 Meetup。在今年五月份之前,Milvus 的 Meetup 叫做 Milvus 老友汇,主要会邀请 Milvus 团队的成员和 Milvus 的用户来进行线下分享,话题都是围绕 Milvus 本身。在 Milvus 老友汇举办过程中,我们逐渐收到了一些来自参会朋友的反馈,希望增加一些非结构化数据处理,GenAI 技术的内容,恰好此时,Milvus 海外社区发起的 Unstructured Data Meetup 举行的如火如荼,受到广大开发者的支持和认可。于是,我们对 Milvus 老友汇进行了一次改革,正式变身为 Unstructured Data Meetup,核心差异就是在之前 Milvus 老友汇的基础上,增加了非结构化数据处理和 GenAI 技术的内容,使得 Meetup 的内容更加丰富,满足不同领域开发者的需求。2024 年,Milvus 社区一共举行了 1 场 Milvus 老友汇和 6 场 Unstructured Data Meetup。一些开发者比较多的城市,比如北京,上海,杭州,深圳,一年一次 Meetup 很多朋友表示根本不够。2025 年,随着 Milvus 社区力量的壮大,我们会考虑在这些重点城市提高频次。

新的一年,紧跟时代潮流,我们准备尝试短视频栏目,把社区里大家经常遇到的问题,典型的实践案例,关心的热点话题通过短视频的形式来进行解答和讲解,帮助大家更快地上手避坑,更好更稳地把向量数据库用起来,敬请期待。

03.

2 个重磅项目,北极星计划+黄金写手

一个人可以走得很快,一群人才能走得更远。

Milvus 社区能够发展得如此迅速,离不开每一位社区伙伴的支持。作为一个全球化的开源项目,每天会有上万开发者在使用 Milvus,使用过程中不可避免会遇到一些问题,如果仅靠 Milvus 团队自身的同学,是无论如何都无法支持完这些开发者的。也是在这个时候,我们看到 Github、微信用户交流群以及 Discord 里面,站出来了一些朋友主动地帮助这些遇到问题的开发者,或耐心地分析排查问题,或细致地编写博客分享最佳实践,各自在做一些擅长的事情来帮助别人。他们有的是 Milvus 老用户,有的是狂热的开源爱好者,有的是还在校园的学生,这就是我们希望同行的一群人。

为了将这些志同道合的朋友聚在一起,Milvus 社区发起了北极星计划(https://zilliz.com.cn/northstar)和黄金写手计划(https://zilliz.com.cn/golden-writer),旨在组建团队与我们共同建设 Milvus 社区,一起探讨社区前进的方向。如果您也非常喜爱 Milvus 这个项目,并且希望通过自己的 Coding、沟通、写作、布道等能力来建设运营 Milvus 社区,欢迎加入我们的北极星计划。如果您的文笔特别好,非常擅长技术文章写作,黄金写手计划欢迎您。

北极星计划和黄金写手计划自从 2024 年 3 月发布以来,目前已经集结了 20 多位小伙伴,不乏一些技术大牛,资深布道师,狂热开源分子。在 Milvus 版本发布的背后,每一场活动的背后以及爆款文章的背后,都有这些小伙伴的身影,再一次感谢这些朋友,选择和我们共同前行!

未来已来,AI 的能力正在以天为单位进行突破,Milvus 3.0,一个更加 AI-Friendly 的崭新版本也即将在 2025 年和大家见面。新的一年,Milvus 社区的故事还在继续,还会更精彩,让我们共同见证!

最后,给大家拜个早年,祝每一位 Milvus 社区的朋友新年快乐 🎉

作者介绍

4cd9e97b98adf22ae61353f70fbae1a3.jpeg

李成龙

Zilliz 资深开源布道师

推荐阅读

601feacb545f445753c694c0eeee9958.png

c3d62d3f327e94d32689fdb1ec570521.png

b224d5c71f88817970b9321182e6e73d.png

efcd36e1daf6aa74164cbc58f0a25409.png


http://www.kler.cn/a/468057.html

相关文章:

  • 牛客网刷题 ——C语言初阶(6指针)——字符逆序
  • 小程序组件 —— 28 组件案例 - 推荐商品区域 - 实现结构样式
  • Vue3苦逼的学习之路
  • 在大型语言模型LLM中使用私有数据
  • jenkins入门--安装jenkins
  • 【AWS SDK PHP】This operation requests `sigv4a` auth schemes 问题处理
  • UCAS 24秋网络认证技术 CH10 SSL 复习
  • 蓝桥杯-Python
  • Colyseus 与 Cesium 集成:构建实时地理可视化应用
  • 声音是如何产生的
  • 语雀导入md文件图片丢失
  • Pytorch 三小时极限入门教程
  • [网络安全]DVWA之XSS(DOM)攻击姿势及解题详析合集
  • 111 - Lecture 6 - Objects and Classes
  • 《深度学习梯度消失问题:原因与解决之道》
  • 第9章 子程序与函数调用
  • 【LLM】概念解析 - Tensorflow/Transformer/PyTorch
  • MQTT学习笔记
  • php容器设计模式
  • 050_小驰私房菜_MTK Camera debug, data rate 、mipi_pixel_rate 确认
  • 基于图的去中心化社会推荐过滤器
  • ip属地的信息准确吗?ip归属地不准确怎么办
  • 前端实现大文件上传(文件分片、文件hash、并发上传、断点续传、进度监控和错误处理,含nodejs)
  • 抖音评论区的IP属地可以关吗?详细解答
  • 安卓应用4字节不对齐导致so加载失败
  • javaEE-文件内容的读写