当前位置：首页 > article >正文

Hadoop的运行模式

article 2025/3/10 18:20:29

Hadoop的运行模式

- - - 1、本地运行模式
    - 2、伪分布式运行模式
    - 3、完全分布式运行模式
    - 4、区别与总结

Hadoop有三种可以运行的模式：本地运行模式、伪分布式运行模式和完全分布式运行模式

1、本地运行模式

本地运行模式无需任何守护进程，单机运行，所有的程序都运行在同一个JVM上执行

Hadoop安装后默认为本地模式，数据存储在Linux本地。在本地模式下调试MapReduce程序非常高效方便，一般该模式主要是在学习或者开发阶段调试使用，例如，演示一下官方案例

2、伪分布式运行模式

Hadoop守护进程运行在本地机器上，模拟一个小规模的集群，数据存储在HDFS集群上；换句话说，可以配置一台机器的Hadoop集群，伪分布式是完全分布式的一个特例

3、完全分布式运行模式

Hadoop守护进程运行在一个集群上，即多台机器上分别启动Hadoop集群，数据存在HDFS集群上，这种运行模式也就是我们常见的各种云，主要用于大规模的生产环境中

4、区别与总结

三种运行模式的区别比较如下：

项目	本地模式	伪分布式模式	完全分布式模式
`fs.defaultFs`	`file:///`	`hdfs://namenode/`	`hdfs://namenode/`
机器数量	1	1	N
守护进程	/	`start-dfs.sh`、`start-yarn.sh`等	`start-dfs.sh`、`start-yarn.sh`等
数据存储与输出	Linux本地	HDFS集群	HDFS集群

分布式模式需要启动一些守护进程，即在使用分布式Hadoop时，要先启动一些准备程序（HDFS和YARN守护进程），然后才能使用；而在本地模式下，不需要启动这些守护进程，将使用本地文件系统和本地MapReduce运行器

更多内容参考：https://blog.csdn.net/m0_51111980/article/details/125733227

http://www.kler.cn/a/578905.html

相关文章：

VTK笔记- 3D Widget类 vtkSplineWidget 样条部件

MySQL 数据归档自动化：Python + pt-archiver 打造高效运维利器

【DuodooTEKr】Odoo 18设备管理双剑客：Maintenance设备模块与IOT模块的深度解析与实践

【Linux】详谈基础I/O

供应链重构：制造业如何借助数字化提升响应速度？

docker启动jenkins，jenkins中调用docker

学网络安全可以考取哪些证书？

Llama-Factory框架下的Meta-Llama-3-8B-Instruct模型微调

如何在语言模型的参数中封装知识？——以T5模型为例

Navigation的进阶知识与拦截器配置

Matlab:矩阵运算篇——矩阵数学运算

docker compose 以redis为例

C# 多线程编程完全指南：从基础到高级应用

PyTorch系列教程：编写高效模型训练流程

蓝桥-特别数的和

安卓ZArchiver与解压专家对比评测

钩子函数

什么是zookeeper

MySQL 索引的数据结构(详细说明)

[Pycharm]创建解释器