当前位置: 首页 > article >正文

MySQL之分库分表后带来的“副作用”你是怎么解决的?

目录标题

  • 一、垂直分表后带来的隐患
  • 二、水平分表后带来的问题
    • 1.多表联查问题
    • 2.增删改数据问题
    • 3.聚合操作问题
  • 三、垂直分库后产生的问题
    • 1.跨库join问题
    • 2.分布式事务问题
    • 3.部分业务库依然存在的性能问题
  • 四、水平分库后需要解决的问题
    • 1.聚合操作和连表问题
    • 2.数据分页问题
    • 3.ID主键的唯一性问题
    • 4.流量迁移、容量规划、节点扩容

一、垂直分表后带来的隐患

垂直分表后当试图读取一条完整数据时,需要连接多个表来获取,对于这个问题只要在切分时,设置好映射的外键字段即可。当增、删、改数据时,往往需要同时操作多张表,并且要保证操作的原子性,也就是得手动开启事务来保证,否则会出现数据不一致的问题。

这里可以看到,垂直分表虽然会有后患问题,但带来的问题本质上也不算大问题,就是读写数据的操作会相对麻烦一些,下面来看看其他的分库分表方案,接下来是真正的重头戏

二、水平分表后带来的问题

水平分表就是将一张大表的数据,按照一定的规则划分成不同的小表,当原本的一张表变为多张表时,虽然提升了性能,但问题随之也来了~

1.多表联查问题

  • 全局表:对于一些不经常更新但需要频繁联查的小表,可以将其设置为全局表,每个分片都有一份完整的副本。这样在进行联查时,可以直接使用本地的全局表数据。
  • 中间件支持:使用如ShardingSphere这样的分布式数据库中间件,它们能够智能地解析SQL语句,并在必要时从多个分片获取数据,然后在中间件层合并结果。
  • 预聚合与缓存:对于一些固定模式的联查,可以在后台定期执行并存储结果到缓存或专门的汇总表中!
  • 放入第三方中间件中,然后依赖于第三方中间件完成,如ES。一些大企业选用的方案

2.增删改数据问题

  • 分片键策略定位具体库表

3.聚合操作问题

  • 放入第三方中间件中,然后依赖于第三方中间件完成,如ES。一些大企业选用的方案

三、垂直分库后产生的问题

垂直分库是按照业务属性的不同,直接将一个综合大库拆分成多个功能单一的独享库,分库之后能够让性能提升N倍,但随之而来的是需要解决更多的问题,而且问题会比单库分表更复杂!

1.跨库join问题

  • Java系统中组装数据,通过调用对方服务接口的形式获取数据,然后在程序中组装后返回

2.分布式事务问题

分布式事务应该是分布式系统中最核心的一个问题,这个问题绝对不能出现,一般都要求零容忍,也就是所有分布式系统都必须要解决分布式事务问题,否则就有可能造成数据不一致性。

  • ①Best Efforts 1PC模式。
  • ②XA 2PC、3PC模式。
  • ③TTC事务补偿模式。(柔性事务)
  • ④MQ最终一致性事务模式。(常用)

3.部分业务库依然存在的性能问题

  • 再做水平分库即可

四、水平分库后需要解决的问题

1.聚合操作和连表问题

  • 放入第三方中间件中,然后依赖于第三方中间件完成,如ES。一些大企业选用的方案

2.数据分页问题

  • 放入第三方中间件中,然后依赖于第三方中间件完成,如ES。一些大企业选用的方案

3.ID主键的唯一性问题

  • 在业务系统中,利用特殊算法生成有序的分布式ID,比如雪花算法、Snowflake算法等。

4.流量迁移、容量规划、节点扩容

线上环境从单库切换到分库分表模式,数据该如何迁移才能保证线上业务不受影响,对于这个问题来说,首先得写脚本将老库的数据同步到分库分表后的各个节点中,然后条件允许的情况下先上灰度发布,划分一部分流量过来做运营测试

如果没有搭建完善的灰度环境,那先再本地再三测试确保没有问题后,采用最简单的方案,先挂一个公告:“今日凌晨两点后服务器会进入维护阶段,预计明日早晨八点会恢复正常运转”!然后停机更新,但前提工作做好,如:Java代码从单库到分库分表要改进完善、数据迁移要做好、程序调试一切无误后再切换,同时一定要做好版本回滚支持,如果迁移流量后出现问题,可以快捷切换回之前的老库。


根据实际情况先做垂直分库,然后再对于核心库做水平分库,水平分库的节点数量要保证的是2的整倍数,方便后续扩容。


扩容一般是指水平分库,也就是当一个业务库无法承载流量压力时,需要对相应的业务的节点数量,但扩容时必须要考虑本次增加节点会不会影响之前的业务,因为很多情况下,当节点的数量发生改变时,可能会影响数据分片的路由规则,这时就要考虑扩容是否会影响原本的路由规则。

扩容一般都是基于水平分库的基础上,进一步对水平库做节点扩容,目前业内有两种主流做法:水平双倍扩容法、异步双写扩容法。

水平双倍扩容法

想要使用双倍扩容法对节点进行扩容,首先必须要求原先节点数为2的整数倍,同时路由规则必须要为数值取模法、或Hash取模法,否则依旧会造成扩容难度直线提升。同时双倍扩容法还有一种进阶做法,被称之为从库升级法,也就是给原本每个节点都配置一个从库,然后同步主节点的所有数据,当需要扩容时仅需将从库升级为主节点即可,过程如下:

在这里插入图片描述

二倍扩容!!
在这里插入图片描述

如果你在的公司财大气粗,我推荐从库升级法,因为从库升级法不仅仅能够避免数据迁移,而且还能保证高可用,当主节点宕机时可以让从节点直接上线顶替,再配合Keepalived+VIP做重启,基本上能够让数据库真正达到7x24小时不间断运行。

异步双写扩容法(常用)

前面聊到的水平双倍扩容法,仅仅只是扩容时的一种方案,除此之外还有另一种方案称之为异步双写扩容法,大体示意图如下:

在这里插入图片描述

对于需要扩容时的情况,首先依旧把新的数据写入到老库中,然后写完之后同步给MQ一份,后续再由MQ的消费者去将新数据写到新库中,同时新库在这期间,会去同步老库中原有的数据,这个动作持续到所有旧数据全部同步完成后,再以老库作为校验基准,核对数据无误后,再将模式切换为扩容后的分库模式

稍微总结一下整个流程,如下:

  • 第一步:修改应用服务代码,加上MQ双写方案,配置新库同步老库数据,然后部署。
  • 第二步:等待新库同步复制老库中所有老数据,期间新写入的数据也会通过MQ写入新库。
  • 第三步:老库中的所有老数据全部同步完成后,以老库作为校验基准,校对新库中的数据。
  • 第四步:校对新老库之间的数据无误后,修改应用配置和代码,将双写改为路由分片,再次部署。

其实异步双写方案,也可以用来做后续的节点扩容,但会相对来说比较麻烦一些。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们处理,核实后本网站将在24小时内删除侵权内容。

在这里插入图片描述


http://www.kler.cn/a/325785.html

相关文章:

  • vscode 扩展Cline、Continue的差别?
  • 软件设计模式的原则
  • 50_Lua垃圾回收
  • 数仓建模(五)选择数仓技术栈:Hive ClickHouse 其它
  • linux: 文本编辑器vim
  • 《AI赋能鸿蒙Next,开启智能关卡设计新时代》
  • Servlet 3.0新特征
  • 新能源汽车储充机器人:能源高效与智能调度
  • 【2024.9.29练习】R 格式
  • P9241 [蓝桥杯 2023 省 B] 飞机降落
  • 【MySQL】查询原理 —— B+树查询数据全过程
  • docker安装Portainer CE
  • 华为eNSP:端口隔离
  • 【AI大模型】Prompt Engineering
  • tr命令:替换文本中的字符
  • PHP array+array与array_merge()的区别
  • Vue.js与Flask/Django后端的协同开发研究
  • 2-3树(2-3 Tree):原理、常见算法及其应用
  • JAVA开源项目 新闻推荐系统 计算机毕业设计
  • Flink 本地 idea 调试开启 WebUI
  • 【高分系列卫星简介——高分五号卫星(GF-5)】
  • 【Go语言基础——一个Go语言项目典型的文件结构示例】
  • 扩散模型DDPM代码实践
  • 黑马头条day7-app端文章搜索
  • Python语言中的重要函数对象用法
  • 【分布式微服务云原生】8分钟探索RPC:远程过程调用的奥秘与技术实现