当前位置: 首页 > article >正文

【运维面试100问】(七)ceph基础题面试

  本站以分享各种运维经验和运维所需要的技能为主

《python零基础入门》:python零基础入门学习

《python运维脚本》: python运维脚本实践

《shell》:shell学习

《terraform》持续更新中:terraform_Aws学习零基础入门到最佳实战

《k8》暂未更新

《docker学习》暂未更新

《ceph学习》ceph日常问题解决分享

《日志收集》ELK+各种中间件

《运维日常》运维日常

《linux》运维面试100问

问题:

ceph的概念,各个角色,怎么使用,举例12台机器怎么分配mon/mgr/osd这些,最大宕机数多少,以及纠错码的含义

Ceph 是一个分布式存储系统,具有高可靠性、可扩展性和性能的特点。它包含多个角色,包括 Monitor(监视器)、Manager(管理器)和 OSD(对象存储守护程序)。下面是对这些角色的简要说明:

  1. Monitor(监视器):监视器维护了集群的状态信息,包括存储映射、健康状况和集群配置等。通常建议至少部署 3 个 Monitor 实例以确保高可用性。

  2. Manager(管理器):管理器负责集群的管理和监控,提供诸如性能统计、日志分析、调度等功能。通常建议至少部署 1 个 Manager 实例。

  3. OSD(对象存储守护程序):OSD 是实际存储数据的组件,负责将数据分布在集群中的多个节点上,并处理数据的读写请求。通常每个节点都会部署一个或多个 OSD。

对于您提到的 12 台机器,以下是一种可能的分配方式:

  • Monitor:至少部署 3 个 Monitor 实例,可以将它们分配在不同的节点上,例如节点 1、节点 2 和节点 3。

  • Manager:部署 1 个 Manager 实例,可以选择其中一个节点,例如节点 1。

  • OSD:剩余的 9 台机器可以用于部署 OSD。您可以根据具体的硬件配置和性能需求来决定每个节点上部署的 OSD 数量。例如,您可以在每个节点上部署 2 个 OSD,其中节点 4-6 部署 2 个 OSD,节点 7-9 部署 2 个 OSD。

关于最大宕机数,Ceph 的设计目标是在集群中容忍多个节点的故障。通常情况下,Ceph 可以容忍多个 OSD 和 Monitor 的故障。具体的最大宕机数取决于集群的配置和副本数设置。例如,如果您将数据配置为具有 3 个副本,那么即使有 2 个 OSD 或 Monitor 失效,集群仍然可以继续正常运行。

如果您在 Ceph 中使用纠错码(Erasure Coding),则会有额外的角色和配置要考虑。

纠错码是一种在数据分布中引入冗余以实现数据容错的技术。在 Ceph 中,Jerasure 和 ISA-L 是两种常用的纠错码实现方式。

在纠错码配置中,除了 Monitor、Manager 和 OSD 角色外,还涉及到以下两个角色:

  1. CRUSH Map Builder(CRUSH 映射构建器):CRUSH 是 Ceph 中用于数据分布和故障域管理的算法。CRUSH Map Builder 用于构建和维护 CRUSH 映射规则,以确保数据块的正确分布和冗余。

  2. Erasure Code Profile(纠错码配置文件):纠错码配置文件定义了纠错码的参数,如数据块数量、纠错码片段数量、冗余度等。您可以根据需求创建并配置不同的纠错码配置文件。

对于 12 台机器的例子,纠错码的分配方式可能如下:

  • Monitor:至少部署 3 个 Monitor 实例,例如节点 1、节点 2 和节点 3。

  • Manager:部署 1 个 Manager 实例,例如节点 1。

  • OSD:剩余的 9 台机器可以用于部署 OSD。您可以根据性能需求和纠错码配置来决定每个节点上部署的 OSD 数量。

  • CRUSH Map Builder:CRUSH Map Builder 角色通常不需要单独的节点,而是在 Monitor 或 Manager 节点上执行。

  • Erasure Code Profile:您需要根据纠错码的要求创建并配置相应的纠错码配置文件,并将其应用到 Ceph 集群中。

关于最大宕机数,纠错码的具体容错能力取决于纠错码的配置和参数设置。通常情况下,纠错码可以容忍多个 OSD 或节点的故障,具体的容错能力取决于纠错码的设置和冗余度。

例子:

对于 EC(Erasure Coding) 4+4 的配置,其中有 4 个节点,每个节点有 42 个 OSD。在这种情况下,我们可以分析最大的 OSD(对象存储守护程序)宕机数。

EC 4+4 表示数据被分为 4 个数据块和 4 个纠错码块。在 Ceph 中,纠错码块用于恢复数据,当某个 OSD 宕机时,可以使用纠错码块来重建数据。

在这种配置下,最大 OSD 宕机数取决于两个因素:

  1. 数据块的数量:在 EC 4+4 的配置中,有 4 个数据块。这意味着最多可以同时宕机 4 个 OSD,而不会导致数据丢失。

  2. 纠错码块的数量:同样,EC 4+4 的配置中有 4 个纠错码块。这意味着即使有 4 个 OSD 宕机,仍然可以通过纠错码块来恢复数据。

综上所述,对于 EC 4+4 的配置,最大 OSD 宕机数为 4。这意味着在最坏的情况下,最多可以同时宕机 4 个 OSD,而不会导致数据丢失。

需要注意的是,这是一种理论上的计算。实际上,Ceph 的容错能力还受到其他因素的影响,如网络故障、硬件故障等。

 


http://www.kler.cn/a/161043.html

相关文章:

  • 【大数据基础】大数据概述
  • LeetCode -Hot100 - 53. 最大子数组和
  • 2、蓝牙打印机点灯-GPIO输出控制
  • 用OpenCV实现UVC视频分屏
  • 从零手写线性回归模型:PyTorch 实现深度学习入门教程
  • 25上软考中级【软件设计师】易混淆知识点
  • 「神印王座」萝莉女神小六打劫,白送10万功勋点,王原原恋人登场
  • 掌汇云 | 全场景数据追踪,多维了解用户偏好,提高运营效率
  • python入门级简易教程
  • C语言二叉树的基本概念(一)
  • 猫头虎分享ubuntu20.04下VSCode无法输入中文解决方法
  • ProEasy机器人案例:电池边包胶
  • IoT DC3 是一个基于 Spring Cloud 全开源物联网平台 linux docker部署傻瓜化步骤
  • 图解系列--HTTPS,认证
  • Linux AMH服务器管理面板本地安装与远程访问
  • C++ Primer Plus第十五章笔记
  • 第4节:Vue3 布尔属性
  • H5: 按钮的点击热区
  • 解析操作系统是如何启动起来的?
  • Django 模板引擎 (四)
  • 分享5款在各自领域遥遥领先的软件
  • 【IEEE独立出版】2024第四届神经网络、信息与通信工程国际学术会议(NNICE 2024)
  • 从cot到agent的survey视频笔记
  • 2023.12.4 GIT的概念和组成
  • 几分钟在Ubuntu搭建本地Emlog博客网站并发布至公网无需购买域名服务器
  • 计网Lesson5 - MAC 地址与 ARP