当前位置: 首页 > article >正文

面试:Hadoop,块,HDFS的优缺点,HDFS的读写流程

Hadoop 

CDH会简化Hadoop的安装

Hue主要用于数据分析和处理,而CM(Cloudera Manager)则主要用于集群的管理和运维。

HDFS

HDFS的块

块是 HDFS 系统当中的最小存储单位, 在hadoop2.0和3.0中默认128MB

在HDFS上的文件会被拆分成多个块,每个块作为独立的单元进行存储。多个块存放在不同的DataNode上,整个过程中 HDFS系统会保证一个块存储在一 个数据节点上 。如果某文件大小或者文件的最后一个块没有到达128M,则不会占据整个块空间 。

块的大小是固定的, 可以根据实际需求自定义,但不建议修改

改小: 增加寻址时间; 浪费元数据内存

改大: 增加传输时间

HDFS的读写流程

读流程

 

写流程


http://www.kler.cn/a/513747.html

相关文章:

  • Vue平台开发三——项目管理页面
  • 【附源码】108个Python实战项目,练完能力飙升
  • Level2逐笔成交逐笔委托毫秒记录:今日分享优质股票数据20250121
  • Python绘制数据地图-MovingPandas
  • 模型部署工具01:Docker || 用Docker打包模型 Build Once Run Anywhere
  • windows 远程链接 Ubuntu 24.04 LTS 图形界面
  • 安卓本地Maven仓的实现
  • 51c~SLAM~合集1
  • 数据结构学习记录-队列
  • STM32补充——IAP
  • 滑动窗口例题讲解
  • 缓存为什么比主存快?
  • 【MySQL】存储引擎有哪些?区别是什么?
  • CTTSHOW-WEB入门-爆破21-24
  • cnpm是什么鬼?
  • 视频m3u8形式播放 -- python and html
  • Python新春烟花
  • opencv-FindHomography接口-C语言实现
  • 靠右行驶数学建模分析(2014MCM美赛A题)
  • 日本IT|集成测试(結合テスト)的含义
  • office 2019 关闭word窗口后卡死未响应
  • 全新推理模型 DeepSeek-R1 问世,全面对标 OpenAI o1
  • “深入浅出”系列之C++:(10)nlohmann Json库
  • 【gopher的java学习笔记】Java中Mapper与Entity的关系详解
  • 虚拟mock
  • 学Python的人…