当前位置: 首页 > article >正文

Hadoop基本介绍

Hadoop是Apache软件基金会的一款开源软件指的是围绕Hadoop打造的大数据生态圈。 用java语言实现,允许用户使用 简单的编程模型 实现 跨机器 集群对海量数据进行 分布式计算 处理。

Hadoop核心组件

  • Hadoop HDFS(分布式文件存储系统):解决海量数据存储
  • Hadoop YARN(集群资源管理和任务调度框架):解决资源任务调度
  • Hadoop MapReduce(分布式计算框架):解决海量数据计算

Hadoop特性优点

  • 扩容能力(scalability

        Hadoop是在可用的计算机集群间分配 数据并完成计算任务的,这些集群可方 便灵活的方式扩展到数以千计的节点。

  • 成本低(Economical
        Hadoop集群允许通过部署普通廉价的机 器组成集群来处理大数据,以至于成本很 低。看重的是集群整体能力。
  • 效率高(efficiency
        通过 并发数据 ,Hadoop可以在节 点之间动态 并行 的移动数据,使得 速度非常快。
  • 可靠性(reliability
        能自动维护数据的多份复制,并且在任务失败后能自动地重新部署(redeploy)计算任务。所以Hadoop的按位存储和处理 数据的能力值得人们信赖。

Hadoop架构(3.0)

这个版本着重于性能优化

  • 通用

        精简内核、类路径隔离、shell脚本重构

  • Hadoop HDFS

        EC纠删码、多NameNode支持

  • Hadoop MapReduce

        任务本地化优化、内存参数自动推断

  • Hadoop YARN

        Timeline Service V2、队列配置

能力
能力
扩容
能力


http://www.kler.cn/a/550297.html

相关文章:

  • 【信息学奥赛一本通 C++题解】1285:最大上升子序列和
  • 数据结构(查找)
  • 浅析 vue里的全局指令文件 directives
  • 第1章大型互联网公司的基础架构——1.3 HTTP-DNS
  • 大模型知识蒸馏:解析原理、谈DeepSeek及服务器适配思路
  • 宝藏软件系列 篇一:My APK(Android)
  • Copilot:Excel中的Python高级分析来了
  • 青少年编程与数学 02-009 Django 5 Web 编程 19课题、RESTful API开发
  • C语言基础16:二维数组、字符数组
  • Mac本地部署deepseek
  • uv 简易安装与更换国内镜像源
  • 网页制作02-html,css,javascript初认识のhtml的文字与段落标记
  • Groovy语言的学习路线
  • Leetcode 227-基本计算器 II
  • MFC 自定义十六进制显示控件
  • CSDN、markdown环境下如何插入各种图(流程图,时序图,甘特图)
  • 玩转大语言模型——使用LM Studio在本地部署deepseek R1的零基础)教程
  • 深入理解Python多进程编程 multiprocessing
  • Vue 3 中,Pinia 和 Vuex 的主要区别
  • 珈和科技产品矩阵实现deepseek大模型能力接入 构建AI多模态农业大模型赋能农业提质增效