使用KubeSphere练习故障注入
故障注入工具:选择中
目标
验证系统稳定性,验证业务的故障预案是否有效
环境搭建
https://v2-1.docs.kubesphere.io/docs/zh-CN/installation/intro/
故障分类
iaas
主机断电、死机、磁盘满/慢/坏、磁盘不可读/写、网络抖动、丢包、DNS故障、断网
中间件
负载均衡失效、数据库连接慢、?
应用
进程hang、进程被kill、pod被kill、心跳异常、oom、超时
故障注入工具选型
模拟故障的工具支持的功能和场景对比:
工具名称 | 涉及场景 | 上手难度 | 地址 |
---|---|---|---|
puma | Pumba是一款基于Docker的故障注入工具,可以模拟容器故障、网络故障、资源限制等场景。可以轻松集成到持续集成/持续部署(CI/CD)流程中 | ? | |
chaos-mesh | Chaos Mesh 支持模拟多种故障场景,包括但不限于 CPU 占用、内存泄漏、磁盘故障、网络延迟、服务故障等 | ? | https://chaos-mesh.org/ |
Chaos Monkey | Chaos Mesh 是一款基于 Kubernetes 的开源混沌工程平台,由 PingCAP 开源并得到了 CNCF(Cloud Native Computing Foundation)的支持。Chaos Monkey是Netflix开源的一款故障注入工具,用于在生产环境中随机关闭虚拟机或容器实例,以测试分布式系统的容错能力。Chaos Monkey是Netflix Chaos Engineering工具集的一部分 | ? | |
chaosblade | 阿里巴巴开源的一款故障注入工具,Chaosblade支持模拟多种故障场景,包括但不限于CPU占用、内存泄漏、磁盘故障、网络延迟、服务故障等 | ? |