当前位置: 首页 > article >正文

Partition架构

优质博文:IT-BLOG-CN

Partition架构

【1】结构: Region至少3ZoneZone内至少两个PartitionPartition内至少1K8S Member Cluster
【2】故障域: 故障域及核心链路至少Zone内收敛,甚至Partition收敛。故障域之间不应该有交互(状态流等);
【3】变更规范: 不同时变更多个Zone,甚至不同时变更多个Partition
【4】FederationRegional调度及控制面,负责Region内资源、容量调度;
【5】应用部署: 应用副本根据可用性级别分布在多个Zone内的多个Partition

故障域隔离FederatedHPA 场景梳理并分级,匹配不同故障域隔离要求。
【1】应用扩容链路: 高频+核心,Partition(Cluster)故障域内收敛,单个Partition故障不影响其他Partition正常扩容;
【2】HPA参数变更链路: 低频+非核心,Region故障域内收敛,故障会影响整个RegionHPA发布变更;
【3】ClusterRebalance链路: 低频+非核心,Region故障域内收敛,故障会影响整个Region的容量Rebalance

方案:
【1】HPA系统组件在Partition(Cluster)内完整部署并封闭,扩缩容链路与其它Partition完全隔离;
【2】FederatedHPA只负责Partition/Zone间的Rebalance协调与变更分发;

效果: 单个AZPartitionFederation的故障不影响其它AZPartition的应用扩缩容。

应用部署的Group(Rollout)Region级别。由Federation控制与分发到多个Zone内的PartitionGroup不同时变更多个Zone

容量调度问题
【1】流量上涨,Zone A扩容成功率下降(其他系统正在扩容等),需要降低Zone A流量比例,扩容成功率恢复后,需要恢复流量比例关系;
【2】Zone流量比例发生倾斜,如果单个Zone故障,ZoneCapacity会比非倾斜时高,需要主动触发提前扩容Node;
【3】混合云场景,私有云Zone容量不足,将部分应用容量公有云Zone倾斜,过峰后,因成本因素,恢复原有状态;

方案:
【1】Autopilot监听各Zone的资源用量、容量、扩容成功率以及SRE运营规则;
【2】Autopilot生成流量调度结果,并下发调度;
【3】HPA感知负载变化进行扩缩;
【4】Autopilot根据当前各Zone用量更新Capacity,并指导提前Node扩容;

多机房库存问题

用户的请求保证在同一机房内完成闭环,但部分场景并不适合划分单元化,比如多机房库存扣减问题。面对多机房库存扣减问题目前的策略如下:
【1】业务扣库存逻辑不调整,还是同步扣库存,但事先根据流量分配好每个机房库存;
【2】增加库存调配机制,当库存不足时触发库存调配,从有多余库存的机房进行调配;
【3】增加监控和库存不足告警通知,除了自动资源调配,对活动上线后进行机房间的库存情况实时观测和实时手动调配;


http://www.kler.cn/a/375029.html

相关文章:

  • QT中的定时器与计时器
  • PMP冲刺提分秘籍
  • 商业潜规则揭秘:从成交艺术到客户满意度的全方位策略
  • mac-ubuntu虚拟机(扩容-共享-vmtools)
  • Unsafe Fileupload-pikachu
  • 【综合算法学习】(第十篇)
  • CentOS9 Stream 设置禁用IPV6
  • CSP-J复赛集训200-300分(19): [2024 CSP-J 复赛] T3:小木棍
  • 2024 年河南省高等职业教育技能大赛实施方案概述
  • 开源协议类型及长安链开源协议介绍
  • Matlab自学笔记四十:日期时间型数据的关系运算:比较大小、比较时间先后、判断是否在两个时间之间
  • 大数据-199 数据挖掘 机器学习理论 - 决策树 模型 决策与条件 香农熵计算
  • [CSP篇] CSP2024 游记(下)
  • 智能码二维码zhinengma.cn如何赋能工业产品质量安全追溯
  • uniapp和vite项目配置多环境编译,增加测试环境变量配置--mode test
  • 鸿蒙Harmony-多边形绘制组件Polygon使用详解
  • Rust精简核心笔记:第三波,基础语法完结篇
  • 基于Matlab PCA人脸识别
  • 信息安全入门——网络安全控制
  • 人机环境系统智能是东方天地人思想与西方科技思维的融合
  • Red Hat下载ISO镜像的方法
  • 软中端,硬中断(学习笔记)
  • uicc.hci.service的理解
  • 基于java+SpringBoot+Vue的“衣依”服装销售平台设计与实现
  • 初阶数据结构之顺序表的实现
  • tkinter 走进现代化【一】 - 登录页