当前位置：首页 > article >正文

Hadoop完全分布式环境部署

article 2025/3/1 3:56:25

准备3台虚拟机，使用ping命令确保虚拟机能够联网，以root用户身份分别在三台虚拟机完成以下系统配置：

（1）在三台虚拟机分别使用yum安装epel-release

（2）在三台虚拟机分别关闭防火墙，保证虚拟机间能够互相ping通

（3）在三台虚拟机分别创建hadoop用户，并配置sudo

（4）在三台虚拟机中分别创建/opt/module, /opt/software 文件夹，并将目录的所有者和所属群组改为haoop用户

（5）在三台虚拟机中卸载自带jdk

提示: rpm -qa | grep java | xargs -n1 rpm -e --nodeps

（6）修改主机名称（/etc/hosts），分别为hadoopxx hadoopxx hadoopxx（xx用自己名字拼音首字母替换）

（7）配置hosts文件，将主机名与IP进行映射

（8）检查上述配置是否生效，不生效可重启虚拟机

2、切换到hadoop身份，分别在三台虚拟机安装JDK

（1）上传JDK安装包到/opt/software，解压安装到/opt/module

（2）配置环境变量，在/etc/profile.d目录下创建自己的环境变量配置文件my_env.sh

（3）添加环境变量JAVA_HOME, 并将JAVA_HOME/bin添加到PATH目录

（4）用source命令使环境变量设置生效

（5）查看JDK是否安装成功

3、以hadoop身份，分别在三台虚拟机继续安装Hadoop

（1）下载Hadoop-3.1.3.tar.gz到/opt/software,解压安装到/opt/module

（2）在my_env.sh文件添加HADOOP_HOME环境变量，并追加到PATH环境变量

（3）用source命令使环境变量生效

（4）配置无密码登录，确保主机间能够以hadoop身份通过ssh无密码互相访问（包括自己）

4.集群配置

（1）集群规划如下:

第一个节点: NameNode、DataNode、NodeManager

第二个节点: DataNode、ResourceManager、NodeManager

第三个节点:Secondary NameNode, DataNode,NodeManager

（2）在一台机器配置：core-site.xml 、hdfs-site.xml、yarn-site.xml、mapred-site.xml、workers文件

（3）将配置文件同步到其它两个节点

（4）启动hdfs

（5）启动yarn

（6）浏览器测试hdfs、yarn

查看全文

http://www.kler.cn/a/448961.html

malloc 分配大堆块（128KB）的一次探索

**Adversarial Demonstration Attacks on Large Language Models**

【Leetcode】855. 考场就座

小程序 - 模拟时钟

Echarts连接数据库，实时绘制图表详解

微服务拆分示例:黑马商城拆分商品服务模块

YOLOv9-0.1部分代码阅读笔记-dataloaders.py

C语言（一）——初识C语言

Django 视图中使用 Redis 缓存优化查询性能

初识C语言之二维数组(下)

npm install vue-router失败解决办法

4.2V单节锂电池充电电路（TP4056）、USB与锂电池切换电路分享

Github优质项目推荐（第九期）

QT_Demo（1）之实现多线程实现简单的电脑摄像头视频流开关

叉车作业如何确认安全距离——UWB测距防撞系统的应用

Kubernetes APF（API 优先级和公平调度）简介

guava本地缓存+自定义线程工厂和线程池

Day 15：Spring 框架基础

Sass变量的妙用：提升CSS开发效率与可维护性

Web安全攻防入门教程——hvv行动详解

相关文章：