分布式数据库 OceanBase 的前世今生
文章目录
- 分布式数据库的开端
- OceanBase 2022 年度发布会
- 为什么“小就是大”?
- 商业化进程按下“加速键”
- 向国际输出中国技术
- OceanBase 2024 年度发布会
- 为什么要做云数据库?
- 2 年服务超 700 客户崭露头角
- 一体化云数据库简化数据栈
- 产品力和生态力是未来制胜关键
- 2024年11月中国数据库排行榜
- OB连续四月居榜首
- 榜单前五稳中求进
- 排名变化集中在第六至第十位,竞争加剧
- 参考资料
分布式数据库的开端
2006年,Google 发布了三篇论文,也是公认的大数据的三驾马车:分布式文件系统 GFS、分布式 KV 存储数据库 Big Table 以及处理和生成超大数据集的算法模型 MapReduce。
此后,虽然分布式开始成为大家讨论的对象,但由于分布式事务的性能以及分布式系统的复杂性,使得分布式数据库仅在数据量非常大的联机分析处理(OLAP)场景得到了一些应用。在传统数据库领域,仍以 Oracle 为代表的的集中式数据库独霸天下,更是独领国际市场,阿里便是其在中国最大的客户。
此后的十年,是分布式数据库被“冷落”的十年。与其说是被“冷落”,不如说是技术上难以突破,以及培育成本高,当时集中式数据库的商业化之路越走越顺,能够停下来从头开始的厂商少之又少。
不过,随着互联网时代的加速发展和科技的进步,集中式数据库的功能开始捉襟见肘。越来越多的企业进行数字化转型,对业务系统也更加高频的并发访问,当产生庞大的数据处理量,集中式数据库昂贵的成本和存储、计算极为有限的扩展能力开始暴露,企业不得不寻求性价比更高、存储和计算扩展能力更强的数据库。
2010年,阳振坤在阿里的招募下,开始研发国内第一款全自研式分布式数据库 OceanBase。彼时的分布式技术是真正的无人区,直至2015年,腾讯云、阿里云、PingCap 等公司才开始在初步探索。
OceanBase 2022 年度发布会
分布式数据库被“冷落”的10年,正是 OceanBase 在蚂蚁内部打磨的十年。从仅用在淘宝收藏夹一个细小的场景,到支撑了9年的淘宝双十一,并打破了 TPC-C 测试的世界纪录,直至 2020 年独立,到目前已经累计了 400+客户。
2022年 8月10日,在 OceanBase 2022 年度发布会,发布了 OceanBase4.0 产品——“小鱼”,这是首个单体分布式一体化架构的数据库,同时推出支持多云部署 OceanBase Cloud,通过技术突破和云化,试图让企业可在单体架构和分布式架构之间无缝切换,降低了分布式数据库的使用门槛。
纵观 OceanBase 的发展路径,其实也正代表了国产分布式数据库的十年,产品发布背后透露出的信号,是当下国产数据库的发展进程,更需要企业关注并共同推动。
为什么“小就是大”?
水滴聚大海、跬步积千里,每件小事做好,往往就是大。
《三体》中衡量一个文明科技水平的标准是,这个文明对微观世界的探索和展开程度的高低,即对微观世界的探索越深入,科技水平越高。
这就是典型的“小就是大”。
分布式数据库之所以能够更加贴近业务、更安全,原因在于它把数据切分成无数个“小”。
举个简单的例子。假设某公司的数据库中存放了 10 个表格,每个表格中的数据为 100 个数据量,那么对当数据进行提取时,只能定位到具体的表格,将表格中的数据全部跑上一遍,若该表格缺失了 2 个数据,将会导致整个数据库的系统无法工作。而分布式则是将每个表格中的 100 个数据进行分区处理,如每 20 个为一组,分为 A/B/C/D/E 区,当需要提取某个数据时,不仅能够定位到相应的表格,也能够直接定位到 A 区,同时,系统可对同一表格的不同区进行分区读写,大大提高了可用性和效率。
在现实的分布式数据库中,也许每 5 个数据即为一组,区分更精细,通常按行或列对数据进行拆分,同时进行三副本备份,哪怕E区的第一副本缺失或错误,也可通过第二、第三副本进行即时替换,不会导致整个数据库瘫痪。简单的说,集中式数据库如同“大马”拉“大车”,“大马”一旦出了问题,便会停滞不前,而分布式则是用无数的“小马”拉“大车”,一匹小马坏了不影响车子的前进,也能够快速进行补位,保证正常运转。
数据维度越来越小,可用性和安全性越来越高,这是分布式数据的“小就是大”。
然而这样的“三副本”形式,意味着企业如果想要部署分布式数据库,就要同时进行多个服务器部署,门槛比单台机高,且“分布”或“单体”的选择通常不可逆,选择了单体机就意味着几乎失去了“分布式”的机会。
这也是大家所探讨的核心问题。分布式数据库通常应用于高部署、密集数据量和高并发的数据,但部署门槛高,对于大宗性企业更加适用,而中小企业由于数据量不大,应用场景简单,并不需要在业务量不足时部署分布式数据库,反而购买单体机更为划算。但一旦部署单体机,后续业务量庞大时再进行架构调整,就是难上加难。
OceanBase 试图通过“小鱼”,来打破这个魔咒。简单的说,单看“小鱼”,只是一款高性能的单体机,在单机部署模式下,也可实现包括 Oracle/MySQL 的兼容性、TP 事务处理能力、AP 并行分析查询能力、租户资源隔离等功能。并在性能上进行了升级,如将故障恢复时间从 30 秒优化到 8 秒。
同时,小鱼对服务器本身的要求很低,单机部署最小支持 4C8G。这意味着,从前必须要在服务器级别(128 核及以上)的终端上部署的数据库,如今在4核的电脑上也可以进行部署。大大降低了企业的硬件购买成本,如同大型游戏对电脑配置的要求降低了,这让很多低配置玩家也能顺畅的玩游戏一般。
而当企业发展到一定阶段,数据量呈现一定规模想要扩容的时候,可以从一台“小鱼”增加到 3 台“小鱼”(3为分布式部署数量的最小单位),平滑地从单机部署模式升级成分布式部署模式。
一位 OceanBase 的技术人员分享到:MySQL 数据库在原理上,也可以做到从单机到分布式,但是过程很长,且需要将数据库暂停运行,单独部署。而小鱼则可在运行中,最快 1 分钟内即可完成模式的切换。
在 OceanBase 2022 发布会中,OceanBase 演示了小鱼从 1-3-9 的整个过程,只需要工作人员在后台进行程序部署,无需调整单机硬件,且过程简单流畅,接近“傻瓜操作”就可以完成,部署完成后,性能几乎成线性增长,并没有过多损耗。
这就十分符合企业的部署场景,若将数据库暂停进行调试,在实际操作中可能性等同于“0”。
这也正是“小鱼”的“小就是大”。硬件单位越来越小,但适配程度却越来越高,且在保持同等性能下,灵活度也越来越高。
而这样的“小就是大”,不止是技术层面的突破,更解决了数据库领域的关键问题:技术和业务的结合。
商业化进程按下“加速键”
从前,分布式数据库被“冷落”还有一个重要的原因,是不被市场接受。
这并不是因为用户不懂它的好,而是因为迁移成本太高,单体数据库虽然已经出现问题,但是通过叠加机器数量,能短暂解决,直到再次超负荷,这样的方式虽然“治标不治本”,但却相对省事。
但很快,一些企业便开始负担不起 Oracle 高昂的运营成本了。最先撑不住的是阿里。时任阿里首席技术官的王坚算了一笔账,把 1 万亿元 GMV 折算成数据量,再折算成需要的 IBM 小型机数量、Oracle 数据库量、EMC 存储数量,再换算成具体价格相加,得到他们每年需要给 IOE 的采购费 200 亿元。而这笔钱甚至超过他们每年所赚的利润。
在庞大的成本费用面前,必须从“根”上开始解决问题了。据测算,支付宝用 OceanBase 原生分布式数据库替代 Oracle 数据库之后,单副本数据可以做到 Oracle 的 1/7,其计算资源投入也降低为原来的 1/12,仅存储一项,相比 Oracle 就节省存储成本约 20 亿元,相当于每账户成本节省了90%。
这源于阳振坤提出了自研分布式数据库能够从两个方面节省成本,一是上述所讲的硬件成本,用普通 PC 机替代大型服务器,硬件成本得到缩减;二是将数据库的两大功能 OLTP 和 OLAP 结合在一起,形成 HTAP。
构想当然很好,但要真正建立,却需要几年时间做技术,再来几年时间跑业务。
在 2020 年,OceanBase 宣布独立进行公司化运营,成立由其 100% 控股的数据库公司——北京奥星贝斯公司。
OceanBase 的独立,是蚂蚁科技战略三步走的一个缩影。第一阶段是“试验”在自己的业务上做尝试;第二阶段是共享,共享给与自己“试验”业务最类似的金融机构;第三阶段是开放,将自己蹚出来的成熟产品进一步对外输出,扩大到政企和其他非金融类客户。
对于阳振坤来说,独立和开放有一个特殊的意义:通过更多企业和业务场景的深入,能够让 OB 更加贴近业务,从需求出发对技术不断打磨迭代,做出有竞争力的国产分布式数据库。
在 2020 年这个节点,OceanBase 的商业化按下了加速键。
此时,无论是集中式数据库的成本开始大规模超出企业负荷,还是受疫情影响,降本成为了每个企业的首要需求,这给了 OceanBase 一定的市场空间和机会,趁热打铁,OceanBase 在2020年正式推出 HTAP。
传统的 OLTP 和 OLAP 是两套数据库,需要分别购买,同时,数据还要在两个数据库中进行迁移,迁移的过程中还会面临着数据丢失和损耗的风险。而 HTAP 则是在一个数据库的基础上,既满足 TP 又满足 AP,降低了企业购买和迁移的成本。
和过去相比,HTAP 的事务处理性能提升 50%,数据分析性能提升 10 倍。用户业务无论是事务型还是分析型,只要一套系统就可以应对数字化转型过程中“海量、实时、在线”的业务需求。
以雄帝科技(300546)为例,其负责全国约三分之一的公交刷卡机系统,此前,刷卡机读取到的只是简单的交易数据,但随着互联网和信息化的发展,刷卡机能够读取到用户的一些基本信息,比如老年卡、学生卡等等。在一些场景里,就要对这些数据进行分析,比如在哪几个时间段用户量最高,合理调配公交车资源,以及一些营销节点,对不同类别的人群实施不同程度的折扣活动。
除此之外,分布式数据库能够做到真正的弹性扩缩容。以往的数据库扩容容易,缩容难。原因在于颗粒度比较粗,单个数据库内若有 20% 可用数据可 80% 废弃数据,不能够准确的剔除废弃数据,只能全盘保留。
中国福利彩票就曾被这个问题难住。彩票行业的瞬时数据量爆发是相当惊人的。中国福利彩票发行管理中心技术管理部副主任唐恒光分享到,一类彩票的年交易量大概是 200 亿,而在这一年内,开奖前半小时的交易量能够达到 50% 甚至 70%,这需要数据库在一天之内扩容,而平时的交易量,却根本用不着峰值的数据库容量,分布式数据库刚好能够解决这个问题,用时“变大”,闲时“缩小”,弹性伸缩降低部署成本。
这样技术上贴近业务场景和痛点的战略,在商业化的道路上稍见成效。仅仅在 2021 一年中,OceanBase 客户数量就实现翻倍,而在金融等核心优势场景,目前全国 TOP200 的头部金融机构中,有1/4都将 OceanBase 作为核心系统升级的首选。
向国际输出中国技术
虽然 OceanBase 在分布式数据库领域是先行者,但多名行业分析师表示,当下仍然处于早期阶段,只能说 OceanBase 刚刚完成了前半段。
关于未来的挑战,可以其概括为两个方面,一部分是技术难题,一部分是行业痛点。
技术难题也是最基础的问题,数据的一致性如何保证?数据迁移的成本如何降低?
对于分布式数据库来说,数据的一致性是其立足的根本,没有一致性就没有分布式。
OceanBase 的技术人员分享到,OB 与 MySQL 等数据库的区别在于,OB 将一致性协议放在了数据库底层,根据协议可以灵活动态的进行调整,而 MySQL 则是在已经成型的数据库产品的上层,尽量满足协议,二者有本质的区别,OB 的策略能够 100% 的做到高一致性。
而数据迁移的成本在当下,似乎是一个还未解决的难题。OB 数据库兼容 MySQL,原 MySQL 用户可直接进行迁移,并且引入了多云策略。OceanBase CEO 杨冰透露,除阿里云外,OB 即将上线 AWS、腾讯云、华为云等多个云部署。
另一方面,是企业面临的痛点。对于新兴事物,企业缺乏运维工具和经验,更缺乏相关的技术人员,技术虽好,但是买了不会装,装了不会用的情况比比皆是,而如果业务用不起来,其他的一切都是白搭。
OB 除了技术核心团队,正在加大服务团队的部署,分为开源服务团队、企业服务团队。这也为其他国产数据库提了一个醒。
这样重服务的形式,或许能够解决当下的问题,而想要真正能够从根本上影响整个数据库环境,阳振坤认为,还是要开源,共建生态。
2021年,OceanBase 宣布源代码开源,与外界共享全球最领先的原生分布式数据库的核心。一方面希望聚焦用户价值,解决用户的具体问题,另一方面期望与外界共建国产分布式数据库的生态,从另一条赛道超越“IOE”。
在 OceanBase4.0 版本中,进一步开源了社区版,社区版与企业版本的更新保持一致,让开源用户也能够体验到 OB 的最新版本。 OceanBase 首席技术官杨传辉介绍到,目前 OceanBase 已经吸引了 4200 多位开发者关注,产生了 500 多次技术创新碰撞(Commit),600 多篇社区深度原创内容,平均每天产生 5 篇高质量技术内容,平均每天有 100 多封活跃邮件,有 50 多家客户深度实践。
快手和携程就是 OceanBase 开源后的第一批用户。携程“IM+”业务采用 MySQL 作为消息写库,由于业务流量激增,数据存储达到 MySQL 的存储极限,只能保存两个月的记录,与业务部门的需求相差甚大。
面临这样的挑战下,携程尝试了 OceanBase 的开源版本,并与 OB 取得联系,深度沟通下二者共创,用 OceanBase 替代了 MySQL,并提供横向扩容能力通过加减机器应对业务的扩缩容,保证对业务的服务质量。最终,携程在保证性能的同时数据压缩能力提升了 85% 以上,在同等硬件投入前提下,从两个月扩展到获得超过一年的数据存储能力。
这或许正是开源的意义所在。
《三体》中,作者刘慈欣曾花费了大量笔墨,探讨“技术平等”的话题,阳振坤也曾拿分布式数据库与自动驾驶进行类比,二者均在发展的早期,且需要更多人投入在这项“未来事业”中去,开源是目前最有效缩短技术差距,共同进步的方式,这或许也是国产数据库们逆袭的关键点。
OceanBase 2024 年度发布会
近日,在OceanBase2024年度发布会上,CEO 杨冰表示,以专有云、公有云两个部署场景作为发展“双引擎”,商业化四年 OceanBase 客户数已突破 2000 家,连续4年客户数增速超过 100%。其中,公有云已经成为第二增长曲线,OB Cloud 推出两年以来,服务超过 700 家客户,客户数年同比增长 130%。
为什么要做云数据库?
注册独立公司运营 2 年后,OceanBase 在本地部署攻城略地之际,于 2022 年启动了云数据库战略,开始发力云端。
OceanBase 公有云事业部总经理尹博学介绍,OceanBase 发展云数据库,主要有以下考虑:
- 一是客户需求推动,无论是云原生的企业还是在进行云端转型的企业,海量数据高并发、实时分析等场景催生了数据库上云的需求;
- 二是 DBaaS 服务可以提升 OceanBase 服务边界和服务能力;
- 三是云基础设施的能力比较符合 OceanBase 产品技术发展方向,利用云上的技术能力和产品能力,能够为客户带来比私有云或本地部署更强大的功能和成本红利。
当前,云已经成为新的 IT 基础设施,数据库的底层环境已经从传统的硬件变为云环境。云带来了很多好处,一方面,云更加易用,能够实现动态伸缩、按需使用。另一方面,云可以实现计算、存储、网络、服务资源的共享和复用,带来了降本增效,云能为数据库带来用户所需的扩展性、低成本等特性。
云数据库已然成为了世界的主流。近些年,越来越多的独立数据库厂商发力云端,比如 MongoDB 推出 Atlas,ClickHouse 推出 ClickHouse Cloud,Neo4j 推出 AuraDB 等 DBaaS 服务,并取得了快速发展。
据 Gartner 统计,云数据库的全球市场份额正在不断增长,2023 年已达整体市场份额的 61%,云数据库增量贡献已经超过了 90%。
可以看出,OceanBase 推出 OB Cloud,符合世界主流数据库发展方向,是落实其全球化发展战略的重要一环。出海发展,建设本地私有化交付团队面临很大的挑战,云是比较便利的服务形态,能更好、更快速地触达用户。与此同时,OceanBase 也意在借助云端标准化服务发挥云上规模化能力,拓展自身服务和能力边界,打造新的增长点。
尹博学指出,每种技术形态都有适合的应用场景,OceanBase 会积极探索适合云数据库的业务。同时,在一些不适合上云的业务场景,比如国内金融业和电信业等行业,OceanBase 将继续坚定不移地提供线下服务。
2 年服务超 700 客户崭露头角
2023 年,为了以更清晰、准确的产品定位服务全球客户,OceanBase 公有云正式命名为 OB Cloud 云数据库。
尹博学介绍,OB Cloud 大致经历了三个发展阶段,第一阶段以阿里云为主;第二阶段逐渐发展多云,满足客户多云战略需求,包括多云容灾保障业务连续性以及满足出海合规要求等;第三阶段将服务中国境内客户夯实的能力,探索出来的优势场景和实践,在海外寻找同类型客户复制。
目前,OB Cloud 正在全球范围提供一致的云数据库服务,覆盖美洲、欧洲、亚洲的 30 余个地理区域的 100 多个可用区,支持阿里云、华为云、腾讯云、AWS 和 Google Cloud 等主流公有云基础设施,同时,OB Cloud 将入驻阿里云精选市场,提供更高的服务能力,未来也将支持Azure。
新能源汽车、家电、手机厂商等中国本土出海的企业是 OB Cloud 全球化发展的一类重要客户。另一类海外客户是在国内探索出来的比较有技术优势和场景优势行业,如零售行业、互联网金融行业,在海外寻找同类型客户进行复制。
目前,在零售、制造、互联网等多个领域,OB Cloud 已经实现广泛应用,服务客户包括小米、理想汽车、上汽大众、vivo、泡泡玛特、海底捞、中免日上、高德、携程,及海外的 GCash、PalmPay 等电子钱包。
以上汽大众为例,伴随着业务的不断发展,上汽大众原本采用的数据库面临着扩容压力大、查询性能瓶颈等问题。上汽大众的积分卡券关键业务系统已采用 OB Cloud,通过 OB 自研的 LSM-Tree 压缩引擎实现存储成本节约 85%,业务连续性提升至 99.999%、查询性能提升 5 倍。
比如泡泡玛特,随着线上抽盒的火爆,数据量也越来越大,以往的 MySQL 等传统集中式数据库扩缩容能力有限,容易造成线上抽盲盒时卡顿或延迟,影响用户体验。泡泡玛特基于 OB Cloud 打造新一代分布式抽盒机系统。目前新系统运行顺畅,扩缩容时间降低 90%,弹性应对秒杀期间的百倍流量,新系统在新品发售等高并发场景的系统连续性达到 99.999%。
某中式快餐品牌核心支付的 POS 系统是基于 Oracle 开发,面对业务快速增长的挑战,运营成本高昂,难以满足快速扩张诉求。2023 年,其核心业务系统平滑迁移至 OB Cloud,以极小的改造成本从传统集中式数据库全面转向云上分布式架构,通过多租户混部,TCO 成本下降 40%,存储压缩率达 89%,高并发场景下门店服务能力显著提升。
在云数据库这一领域,OceanBase 正在崭露头角。2023 年 OB Cloud 获选全球仅 10 家的 Gartner 云数据库管理系统魔力象限“荣誉提及”,并在 2024 年 Gartner 云数据库客户之声报告中,被评为亚太地区“客户之选”及全球“卓越表现者”。
一体化云数据库简化数据栈
尹博学介绍,企业数据库上云的路径主要有三大类:
第一类是初创企业,他们最初选择了云原生技术架构,敏态业务比较多,也需要敏捷地去进行业务试错,探索更多业务可能,更愿意利用云数据库的弹性、敏捷能力。
第二类是传统企业,数字化转型过程中进行云端转型,这类企业既需要云上的能力进行业务升级、数字化,也需要兼顾云下的基础设施、业务的稳定性和连续性,其云端转型有一定的时间和周期,是逐步上云的过程,可能某些业务、某些集群先上云,甚至是某一个集群的某一些副本先上云,很长阶段会处在混合云的状态。
第三类企业追求更高的业务连续性或者拓展新业务从而选择云数据库,数据库上云可以更好地解决数字化升级过程中 IT 基础设施的可靠性及安全性挑战,也为企业探索新业务提供弹性和敏捷能力,以更低的成本探索新业务。
OB Cloud 的理念是通过一体化云数据库,构建现代数据架构,简化技术栈,实现降本增效。OB Cloud 的一体化体现在以下三个方面:
一是时间周期选择的一体化,伴随着企业从初创期发展到平台期,OB Cloud 都能提供很好的支持,单机分布式一体化架构可以提供强大的扩展性(伸缩能力),支持灵活垂直伸缩和水平伸缩。
OB Cloud 客户的数据体量从小到大均有,其中最大的单集群 CPU 核数超过6400核、最大的单集群数据规模超过 1.2PB,这意味着 OB Cloud 有能力满足客户从小规模到大规模的业务增长需求。
二是场景的一体化,体现在混合负载和多模处理能力。OB Cloud 能够支持 HTAP 混合负载,这简化了传统 TP、AP、ETL 三套系统的数据分析栈,尤其今年推出的列存版本,极大提升了复杂查询和实时分析能力。
在多模数据处理方面。OB Cloud 同时兼容多种数据模型,包括 Oracle 和 MySQL 语法,HBase 和 Table 模型 API,以及 JSON、GIS 等半结构化数据格式,以及面向 AI 时代的向量引擎,OB Cloud 提供了一种统一的查询接口,简化了企业技术栈,降低了运维复杂度。
三是基础设施的一体化,OB Cloud 支持私有云、混合云、公有云以及跨云部署,OB Cloud 可以屏蔽掉底层基础设施的复杂性,提供灵活的部署形态,满足企业不同发展阶段的数据库上云需求,让客户在不同基础设施上获得一致性体验,完成客户从迁移、开发到使用的全生命周期管理。
多云支持是 OB Cloud 与其他宿主云原生数据库的一大差异,尤其一些出海企业,基于每个地域的监管法规要求,需要使用不同的云,而跨多款云、跨多款云原生数据库的迭代效率、成本、运维管控复杂度会面临很大挑战,所以企业需要一个多云体验一致的数据库。
产品力和生态力是未来制胜关键
OB Cloud 在短短 2 年时间获得 700 多家客户使用,是对这一款纯自研云数据库最大的认可。
中国数据库市场正在风起云涌,而产品力和生态力将是决定数据库能否长远发展的两大关键因素。
在产品力方面,尹博学介绍了 OB Cloud 的差异化竞争优势,竞争力一方面来源于比较专业且强大的产品研发团队,另一方面活跃的社区以及大量商业客户的真实场景打磨,打造了一个强大的数据库内核,OB Cloud 继承了其稳定、安全、高可用等方面的能力,又基于云基础设施充分发挥了云的优势。与此同时,在多云/跨云等宿主云数据库很难触达的场景,OB Cloud 能够为客户提供很好的支持。
比如在支持传统企业数据库上云时,OB Cloud 全面兼容 MySQL 和 Oracle,能够最大限度降低企业数据迁移的难度和成本,沉淀了完整的迁移方案确保客户应用的平滑无缝迁移。
OB Cloud 也可以提供异地冷备、异地热备、异地多活、跨洲际多活等灵活的多云容灾方案,帮助客户避免因单一云基础设施不稳定的影响,全面保障业务稳健性和业务连续性。比如,当 A 云故障以后,在数据无损的情况下,OB Cloud 跨云灾备可以实现分钟级别内切换到下一朵云的可用区上去,保障业务连续性,这些是单一宿主云原生数据库无法做到的。
在生态方面,OB Cloud 也在积极行动,技术生态方面无缝适配云上大数据、DevOps 等技术栈。服务生态方面积极联合行业 ISV,打造更全面的服务场景。
数据库的本质是信任,作为数据基础设施,很高兴看到 OB Cloud 一直不断强化产品力和生态力为客户带来更大的价值。而赢得更多企业的信赖,正是其走向全球,走向更广阔天地的底气所在。
2024年11月中国数据库排行榜
OB连续四月居榜首
11 月墨天轮社区的中国数据库流行度排行榜已更新,本期共有 226 个数据库产品参与,相较于年初的 292 个数据库,产品阵容已进行了更新和优化。近期,多个数据库产品取得了重要成果:
- OceanBase 年度发布会发布了多项创新技术,广受关注;
- PolarDB 的“云原生三层解耦 Serverless 数据库关键技术与应用”项目荣获 2024 年度中国计算机学会(CCF)科技进步一等奖;
- 在《中国云原生事务型数据库厂商技术能力评估,2024》报告中,TDSQL 凭借卓越的技术实力入选代表厂商,并在高性能、高可用、兼容性、安全性等六项能力评估中均获第一;
- KWDB 荣获中国信通院“OSCAR尖峰开源项目及社区奖”,进一步证明了其在开源数据库领域的影响力。
这些成果展示了中国数据库技术的迅速发展和行业中的卓越表现。接下来,我们将盘点本期榜单中的亮点数据库,分析它们在市场中的表现与未来前景。
榜单前五稳中求进
在本期榜单中,前五名的数据库产品排名相对稳定,这些头部产品在技术创新、性能优化和行业应用上持续发力,展现出稳健的增长趋势。
OceanBase 以 748.91 的得分稳固其在数据库排行榜上的领先地位,并与榜眼拉开近一百分的差距。本月的年度发布会无疑是行业的一大亮点,展现了 OceanBase 在技术创新和产品发展上的显著进步。特别是推出的 OceanBase 4.2.5 LTS 版本和 OceanBase 4.3.3 GA 版本,在性能、兼容性、稳定性和安全性等方面进行了全面优化和增强。OceanBase 4.2.5 LTS 版本针对核心系统所要求的高读写性能、高兼容性、高稳定性进行了进一步优化,TP性能提升了 26%,并且加强了多模一体化能力,新增支持 Redis 模型。
PolarDB 在本期榜单中仍以 629.19 的高分稳居前列,特别值得一提的是,阿里云的“云原生三层解耦 Serverless 数据库关键技术与应用”项目荣获 2024 年度中国计算机学会(CCF)科技进步一等奖。该架构有效解决了 Serverless 环境下的跨机事务迁移问题,将跨机迁移时间压缩至 0.5 秒以内,整体性能提升数十倍。
TiDB 凭借其“自主开源”和“技术引领”的核心优势,持续展现出强劲的竞争力,并在本月以 550.75 分的优异成绩跻身前列。作为全球开源数据库的领军者,TiDB 不仅拥有超过 2,200 名贡献者和 3,000 多家活跃用户,还荣获了 Gartner® Peer Insights™ 云数据库管理系统“客户之选”殊荣,成为唯一获此荣誉的中国数据库。
在技术创新方面,据悉 TiDB 将在即将发布的 8.4 版本中集成向量搜索功能。该功能的引入预计将在 AI 应用和银行业务等领域带来显著进步,进一步提升其在多样化数据处理和智能应用场景中的竞争力。让我们共同期待 TiDB 在未来的表现!
GaussDB 以 548.79 分稳居第四,作为具有 20 余年技术沉淀的数据库,GaussDB 已积累了丰富的专利,这些技术积累不仅提升了产品的成熟度,也增强了其在数据库领域的竞争力。GaussDB 不仅在华为内部成功保障了业务连续性,其技术能力也在银行、保险、证券、能源等行业的核心业务系统中得到广泛应用,展现出在多行业中的稳定性和高性能表现。
GoldenDB 在本月数据库排行榜中以 533.69 分再次位居第五。自 2019 年起,GoldenDB 系统相继在中信银行的信用卡核心业务和总行账务核心业务中投入生产,至今已稳定运行超过四年,充分体现了其在高可用性和可靠性方面的技术优势。目前,GoldenDB 在银行核心系统市场的投产数量占比达 50%,在次核心及非银核心系统市场的投产占比达 32%,这两项数据均居行业首位。
排名变化集中在第六至第十位,竞争加剧
凭借不断的技术突破,这些产品为整个数据库行业注入了新的活力和多样性。
金仓数据库本月得分为 511.89 分,排名上升一位。近期,金仓数据库在“中国滑雪信创数据库建设项目”中以第一名中标,此外凭借在软件行业的创新能力和卓越表现,电科金仓荣获“2024年软件和信息技术服务优秀企业”称号。未来,期待金仓数据库在技术创新和市场拓展方面持续取得新突破。
GBase 在本月的数据库排行榜中以 504.26 分的高分表现突出。其两款核心产品 GBase 8a 和 GBase 8s 在最近的奖项中取得了显著成绩:
- GBase 8a:以其创新的架构和卓越特性荣获“第二十六届中国国际软件博览会大奖(银奖)”,这一奖项是对其技术能力与商用价值的高度认可。
- GBase 8s:入选“金融信创生态实验室-金融信创解决方案(第一批)”,并荣获“2022金融行业核心业务系统优秀解决方案”奖。
本月达梦数据库保持第八位,排名不变。根据 2024 年前三季度财报,达梦数据库实现营收约 6.29 亿元人民币,同比大幅增长 40.96%。这一显著增长不仅反映了公司在市场中的强劲竞争力与盈利能力,也进一步巩固了其在国产数据库领域的领先地位。
腾讯云 TDSQL 在本月的排名中实现了首次突破,成功晋级为第九位。在《中国云原生事务型数据库厂商技术能力评估,2024》报告中,TDSQL以其卓越的技术实力成功入选代表厂商,并在高性能、高可用、兼容性、安全性、金融行业应用、互联网行业应用等六项能力评估中均获得第一。期待 TDSQL 继续保持其技术优势,推动数据库技术的进一步发展。
在本月数据库排行榜中,openGauss 虽排名下降,但其技术发展和社区活力依旧引人注目。最新发布的 6.0.0 LTS 版本是社区的一个重要里程碑,它汇聚了 940 名开发者的努力,合入 9970 个 PR,尤其在内核能力、资源池化架构、数据全生命周期管理工具和生态兼容性方面取得了显著进步。
此外,在开源四周年之际社区推出的“结队计划”,openGauss 进一步促进了伙伴、客户与社区成员之间的有效联接,期待未来 openGauss 能够继续推动数据库技术的发展和应用,实现生态的繁荣和行业的共赢。
参考资料
- 分布式数据库被“冷落”的十年,OceanBase在干什么?作者:刘雨琦
- 做简化技术栈的一体化云数据库,OB Cloud带来哪些新进展?
- 《曾被“霸凌”的两个孩子:电动汽车与分布式数据库》作者:阳振坤
- 《不做工程等于纸上谈兵——对话 OceanBase 创始人阳振坤》作者:田玮静
- 《这群程序员为何坚持30年“免费”写代码?》作者:显微故事小北