当前位置: 首页 > article >正文

Hadoop组成概述

Hadoop主要由HDFS、Mapreduce、yarn三部分组成,hdfs负责分布式文件数据的存储,yarn复杂资源的调度,mapreduce负责运算。

一、hdfs架构

namenode:存储文件的元数据信息

datanode:存储真实数据

2nn:对namenode的元数据进行备份

二、yarn架构

resourceManager:整个集群资源(内存 cpu等)的老大

nodeManager:单个节点服务器的老大

ApplicationMaster:单个任务运行的老大

container:节点中虚拟出来的容器,有自己的cpu 内存等任务运行所需的资源

三、mapreduce架构

mapTask:多个maptask并行处理输入数据

reduceTask:对map阶段数据进行汇总

四、HDFS、Mapreduce、yarn三者之间的关系、工作流程

(1)客户端向集群提交mr任务

(2)resourceManager选取一个节点,开辟一个容器container,运行applicationMaster

(3)applicationMaster向resourceManager申请运行所需的集群资源

(4)resourceManager分配有空闲资源的节点,开启container,在容器中运行mapTask(可以多个并行)

(6)同样也会开启容器运行reduceTask,对map阶段运行的结果进行汇总

(5)reduceTask将任务运行结果写入到datanode上进行保存,并将元数据存储到namenode上

(6)随后2nn也进行了元数据的备份


http://www.kler.cn/a/450397.html

相关文章:

  • VS2022 中的 /MT /MTd /MD /MDd 选项
  • ML-Agents 概述(二)
  • Linux搭建TRELLIS详细流程
  • QT用Enigmavb 打包成单独exe
  • 远程控制macOS一直卡在100%,能连接上了却只显示了壁纸?
  • VSCode:IDE显示设置 --自定义字体及主题颜色
  • 循环和迭代
  • 合同尾款产生纠纷该如何处理
  • 京东科技基于 Apache SeaTunnel 复杂场景适配 #数据集成
  • 深度分析 es multi_match 中most_fields、best_fields、cross_fields区别
  • 用于管理Unity中UGUI的工具系统UISystem
  • Bootstrap 5 加载效果
  • python学opencv读取图像(十四)BGR图像和HSV图像通道拆分
  • Vision Pro开发实现系统UI风格 毛玻璃效果
  • |-牛式-|
  • WebRTC学习二:WebRTC音视频数据采集
  • ChatGPT与Postman协作完成接口测试(二)
  • 1 SpringBoot——项目搭建
  • Web 第一次作业 初探html 使用VSCode工具开发
  • 后端-redis
  • Git远程仓库的使用
  • 【唐叔学算法】第21天:超越比较-计数排序、桶排序与基数排序的Java实践及性能剖析
  • 探索数据可视化的利器:Matplotlib
  • 【云原生】kubeadm搭建的kubernetes1.28集群上自建ingress-nginx服务
  • 【Qt】了解和HelloWorld
  • 【每日学点鸿蒙知识】AVCodec、SmartPerf工具、web组件加载、监听键盘的显示隐藏、Asset Store Kit