当前位置: 首页 > article >正文

Hadoop的运行模式

Hadoop的运行模式

        • 1、本地运行模式
        • 2、伪分布式运行模式
        • 3、完全分布式运行模式
        • 4、区别与总结








Hadoop有三种可以运行的模式:本地运行模式、伪分布式运行模式和完全分布式运行模式

1、本地运行模式

本地运行模式无需任何守护进程,单机运行,所有的程序都运行在同一个JVM上执行

Hadoop安装后默认为本地模式,数据存储在Linux本地。在本地模式下调试MapReduce程序非常高效方便,一般该模式主要是在学习或者开发阶段调试使用,例如,演示一下官方案例

2、伪分布式运行模式

Hadoop守护进程运行在本地机器上,模拟一个小规模的集群,数据存储在HDFS集群上;换句话说,可以配置一台机器的Hadoop集群,伪分布式是完全分布式的一个特例

3、完全分布式运行模式

Hadoop守护进程运行在一个集群上,即多台机器上分别启动Hadoop集群,数据存在HDFS集群上,这种运行模式也就是我们常见的各种云,主要用于大规模的生产环境中

4、区别与总结

三种运行模式的区别比较如下:

项目本地模式伪分布式模式完全分布式模式
fs.defaultFsfile:///hdfs://namenode/hdfs://namenode/
机器数量11N
守护进程/start-dfs.shstart-yarn.shstart-dfs.shstart-yarn.sh
数据存储与输出Linux本地HDFS集群HDFS集群

分布式模式需要启动一些守护进程 ,即在使用分布式Hadoop时,要先启动一些准备程序(HDFS和YARN守护进程),然后才能使用;而在本地模式下,不需要启动这些守护进程,将使用本地文件系统和本地MapReduce运行器

更多内容参考:https://blog.csdn.net/m0_51111980/article/details/125733227



http://www.kler.cn/a/578905.html

相关文章:

  • VTK笔记- 3D Widget类 vtkSplineWidget 样条部件
  • MySQL 数据归档自动化:Python + pt-archiver 打造高效运维利器
  • 【DuodooTEKr】Odoo 18设备管理双剑客:Maintenance设备模块与IOT模块的深度解析与实践
  • 【Linux】详谈 基础I/O
  • 供应链重构:制造业如何借助数字化提升响应速度?
  • docker启动jenkins,jenkins中调用docker
  • 学网络安全可以考取哪些证书?
  • Llama-Factory框架下的Meta-Llama-3-8B-Instruct模型微调
  • 如何在语言模型的参数中封装知识?——以T5模型为例
  • Navigation的进阶知识与拦截器配置
  • Matlab:矩阵运算篇——矩阵数学运算
  • docker compose 以redis为例
  • C# 多线程编程完全指南:从基础到高级应用
  • PyTorch系列教程:编写高效模型训练流程
  • 蓝桥-特别数的和
  • 安卓ZArchiver与解压专家对比评测
  • 钩子函数
  • 什么是zookeeper
  • MySQL 索引的数据结构(详细说明)
  • [Pycharm]创建解释器