当前位置: 首页 > article >正文

Hadoop--Secondary NameNode工作机制,作用及与NameNode HA的区别

  Secondary NameNode 主要用于辅助 NameNode 进行元数据的管理和检查点(Checkpoint)的生成。

1. Secondary NameNode 的工作机制详解

Secondary NameNode 的工作机制可以分为以下步骤:

① Secondary NameNode 询问 NameNode 是否需要 Checkpoint

Secondary NameNode 会定期(由 dfs.namenode.checkpoint.period 和 dfs.namenode.checkpoint.txns 配置决定)向 NameNode 发送请求,询问是否需要执行 Checkpoint。

NameNode 会根据 edits 日志的大小和操作数量决定是否需要 Checkpoint。

② Secondary NameNode 请求执行 Checkpoint

如果 NameNode 决定执行 Checkpoint,Secondary NameNode 会向 NameNode 发送 Checkpoint 请求。

③ NameNode 滚动正在写的 edits 日志

NameNode 停止向当前的 edits 日志文件写入新的操作,并创建一个新的 edits 日志文件用于记录后续操作。

旧的 edits 日志文件被标记为只读,并重命名为一个普通的 edits 日志文件。

④ 将滚动前的编辑日志和镜像文件拷贝到 Secondary NameNode

NameNode 将滚动前的 edits 日志文件和当前的 fsimage 文件拷贝到 Secondary NameNode。

⑤ Secondary NameNode 加载编辑日志和镜像文件到内存,并合并

Secondary NameNode 将拷贝的 edits 日志文件和 fsimage 文件加载到内存中。

将 edits 日志中的操作应用到 fsimage 上,生成一个新的、包含最新元数据的 fsimage 文件。

⑥ 生成新的镜像文件 fsimage.chkpoint

Secondary NameNode 将合并后的元数据写入一个新的 fsimage 文件(如 fsimage.chkpoint)。

⑦ 拷贝 fsimage.chkpoint 到 NameNode

Secondary NameNode 将生成的 fsimage.chkpoint 文件拷贝回 NameNode。

⑧ NameNode 将 fsimage.chkpoint 重新命名成 fsimage

NameNode 将 fsimage.chkpoint 重命名为 fsimage,替换旧的 fsimage 文件。

  同时,NameNode 会删除已经合并的 edits 日志文件,因为它们的操作已经被应用到新的 fsimage 中。

(1) 那么,什么是 edits 日志?

  在 HDFS 中,NameNode 负责管理文件系统的元数据(如文件目录结构、文件块信息等)。为了保证元数据的一致性,NameNode 会将所有的元数据修改操作(如创建文件、删除文件等)记录到一个称为 edits 日志 的文件中。

  • edits 日志:是一个追加写的日志文件,记录了所有对元数据的修改操作。
  • fsimage:是元数据的完整镜像文件,记录了某一时刻文件系统的完整状态。

  由于 edits 日志会不断增长,为了避免日志文件过大,HDFS 会定期将 edits 日志中的操作合并到 fsimage 中,这个过程称为 Checkpoint。

(2) “滚动正在写的 edits 日志”具体是怎样的?

  在 Secondary NameNode 执行 Checkpoint 的过程中, “滚动正在写的 edits 日志” 主要是如下过程:

  • 停止当前正在写的 edits 日志文件:NameNode 会停止向当前的 edits 日志文件(如 edits_inprogress_001)写入新的元数据修改操作。
  • 创建一个新的 edits 日志文件:NameNode 会创建一个新的 edits 日志文件(如 edits_inprogress_002),用于记录后续的元数据修改操作。
  • 将旧的 edits 日志文件标记为只读:停止写入的 edits 日志文件(如 edits_inprogress_001)会被标记为只读,并重命名为一个普通的 edits 日志文件(如 edits_001)。

  这个过程称为 日志滚动(Log Rolling),目的是将当前的 edits 日志文件冻结,以便 Secondary NameNode 可以安全地将其拷贝走并进行合并操作。

(3) 为什么需要滚动 edits 日志呢?

  滚动 edits 日志的目的是为了确保 Checkpoint 的一致性。

  • 避免数据丢失:在 Checkpoint 过程中,NameNode 仍然会接收客户端的元数据修改请求。如果不滚动日志,新的修改操作会继续写入旧的 edits 日志文件,导致 Secondary NameNode 无法确定哪些操作已经处理,哪些操作还未处理。
  • 确保一致性:通过滚动日志,NameNode 可以确保 Secondary NameNode 拷贝的 edits 日志文件是完整的、一致的,不会包含未完成的修改操作。

(4) 如果 NameNode 元数据丢失,能否从 Secondary NameNode 恢复?

  可以恢复部分元数据。Secondary NameNode 保存了上一次 Checkpoint 的 fsimage 和 edits 日志文件,可以恢复上一次 Checkpoint 时的元数据。
  无法恢复全部元数据。从上一次 Checkpoint 到 NameNode 崩溃期间,NameNode 可能接收了新的元数据修改请求,这些请求记录在 NameNode 正在写的 edits 日志文件中。由于这些 edits 日志文件没有被拷贝到 Secondary NameNode,因此这部分元数据无法恢复。

2. Secondary NameNode 的核心作用

(1) 定期合并 fsimage 和 edits 日志

  • fsimage:是 NameNode 中元数据的完整镜像文件,记录了文件系统的某一时刻的完整状态(如文件目录结构、文件块信息等)。
  • edits 日志:记录了所有对元数据的修改操作(如创建文件、删除文件等),是一个不断追加写的日志文件。

随着时间的推移,edits 日志文件会变得非常大,导致以下问题:

  • NameNode 启动时间变长:NameNode 启动时需要将 fsimage 加载到内存,并重放 edits 日志中的所有操作,edits 日志越大,启动时间越长。
  • 内存占用增加:edits 日志中的操作需要加载到内存中,可能导致 NameNode 内存不足。

  Secondary NameNode 的作用就是定期将 edits 日志中的操作合并到 fsimage 中,生成一个新的 fsimage 文件,从而减少 edits 日志的大小,优化 NameNode 的性能。

(2) 生成检查点(Checkpoint)

  Secondary NameNode 会定期(由配置参数 dfs.namenode.checkpoint.period 和 dfs.namenode.checkpoint.txns 决定)触发 Checkpoint 过程。
  在 Checkpoint 过程中,Secondary NameNode 会从 NameNode 获取当前的 fsimage 和 edits 日志文件,将它们加载到内存中,合并生成一个新的 fsimage 文件。
  新的 fsimage 文件会被传回 NameNode,替换旧的 fsimage 文件,同时删除已经合并的 edits 日志文件。

3. Secondary NameNode 的局限性

  尽管 Secondary NameNode 在元数据管理中起到了重要作用,但它并不是 NameNode 的高可用(HA)解决方案,存在以下局限性:

(1)不能实时备份元数据

  Secondary NameNode 只是定期合并 fsimage 和 edits 日志,生成新的 fsimage 文件,并不能实时备份 NameNode 的元数据。

(2)无法完全恢复元数据

  如果 NameNode 崩溃,Secondary NameNode 只能提供上一次 Checkpoint 的元数据,无法恢复从上一次 Checkpoint 到崩溃期间的数据(这些数据记录在 NameNode 正在写的 edits 日志文件中)。

(3)不是高可用组件

  Secondary NameNode 并不能接管 NameNode 的工作,它只是一个辅助工具。

4. Secondary NameNode 与高可用(HA)方案的区别

  在 Hadoop 2.x 及更高版本中,引入了 NameNode 高可用(HA) 方案,通过以下方式解决 Secondary NameNode 的局限性:

(1)Active NameNode 和 Standby NameNode

  两个 NameNode 同时运行,一个处于 Active 状态,负责处理客户端请求;另一个处于 Standby 状态,实时同步 Active NameNode 的元数据。

(2)共享存储(如 QJM 或 NFS)

  Active NameNode 将 edits 日志写入共享存储,Standby NameNode 从共享存储读取 edits 日志并应用到自己的内存中,保持元数据的实时同步。

(3)故障切换

  如果 Active NameNode 崩溃,Standby NameNode 会立即接管工作,确保系统的高可用性。


http://www.kler.cn/a/560470.html

相关文章:

  • Oracle 10g数据库资源下载分享
  • 软件测试高频面试题
  • git上传 项目 把node_modules也上传至仓库了,在文件.gitignore 中忽略node_modules 依然不行
  • 一键提取人声 、伴奏 免费人声、伴奏 音频分离软件分享——UVR5下载安装教程
  • 汽车零部件ERP软件进销存软件库存管理委外加工计算计件工资软件
  • 复用时钟 重映射(Remap)
  • YOLO11改进-模块-引入混合结构模块Mix Structure Block 提高多尺度、小目标
  • VMware 与 CentOS 安装指南
  • IP----访问服务器流程
  • centos系统MBR格式转换成gpt格式 (华为云)
  • 算法-图-数据结构(邻接矩阵)-BFS广度优先遍历
  • 爬虫基础入门之爬取豆瓣电影Top250-Re正则的使用
  • 【初阶数据结构】森林里的树影 “堆” 光:堆
  • GB 44496-2024《汽车软件升级通用技术要求》标准解读|标准结构、测试方法、测试内容
  • 高级SQL技术在Python项目中的应用:ORM与深度性能优化
  • 深度学习之图像分类(二)
  • 【备赛】在keil5里面创建新文件的方法+添加lcd驱动
  • Kubernetes资源管理实战:从理论到落地的完整指南
  • 【Redis 原理】通信协议 内存回收
  • 【Java 常用注解学习笔记1】——Java 常用注解全解析:从基础到实战