当前位置：首页 > article >正文

三，Linux基础环境搭建（CentOS7）- 安装Hadoop

article 2024/10/27 12:49:07

Linux基础环境搭建（CentOS7）-安装Hadoop

大家注意以下的环境搭建版本号，如果版本不匹配有可能出现问题！

一、Hadoop下载及安装

Hadoop在大数据技术体系中的地位至关重要，Hadoop是大数据技术的基础，对Hadoop基础知识的掌握的扎实程度，会决定在大数据技术道路上走多远。在这里插入图片描述

Hadoop的下载

Hadoop下载链接：https://archive.apache.org/dist/hadoop/common/hadoop-2.7.3/ 在这里插入图片描述

将下载的安装包通过Xftp传输到Linux虚拟机/opt/software/中

Hadoop的安装

创建工作路径//usr/hadoop，下载hadoop安装包到/opt/software中，然后解压至工作路径。

mkdir /usr/hadoop		#首先在根目录下建立工作路径/usr/hadoop
cd /opt/software		#进入安装包的文件夹
tar -zxvf hadoop-2.7.3.tar.gz -C /usr/hadoop

二、配置Hadoop环境变量（3台）

vim /etc/profile

添加如下内容：

 #HADOOP
export HADOOP_HOME=/usr/hadoop/hadoop-2.7.3
export CLASSPATH=$CLASSPATH:$HADOOP_HOME/lib
export PATH=$PATH:$HADOOP_HOME/bin

source /etc/profile		#使profile生效

三、配置hadoop各组件（配置文件建议直接复制粘贴，防止搞错）

hadoop的各个组件的都是使用XML进行配置，这些文件存放在hadoop的etc/hadoop目录下。

1.hadoop-env.sh

cd $HADOOP_HOME/etc/hadoop
vim hadoop-env.sh

输入以下内容，修改java环境变量：

export JAVA_HOME=/usr/java/jdk1.8.0_171

在这里插入图片描述键入“Esc”，退出编辑模式，使用命令“:wq”进行保存退出。

2.core-site.xml

vim core-site.xml

内容如下：

&lt;configuration&gt;
&lt;property&gt;
  &lt;name&gt;fs.default.name&lt;/name&gt;
   &lt;value&gt;hdfs://master:9000&lt;/value&gt;
&lt;/property&gt;
&lt;property&gt;
  &lt;name&gt;hadoop.tmp.dir&lt;/name&gt;
   &lt;value&gt;/usr/hadoop/hadoop-2.7.3/hdfs/tmp&lt;/value&gt;
&lt;description&gt;A base for other temporary directories.&lt;/description&gt;
&lt;/property&gt;
&lt;property&gt;
  &lt;name&gt;io.file.buffer.size&lt;/name&gt;
   &lt;value&gt;131072&lt;/value&gt;
&lt;/property&gt;
&lt;property&gt;
  &lt;name&gt;fs.checkpoint.period&lt;/name&gt;
   &lt;value&gt;60&lt;/value&gt;
&lt;/property&gt;
&lt;property&gt;
  &lt;name&gt;fs.checkpoint.size&lt;/name&gt;
   &lt;value&gt;67108864&lt;/value&gt;
&lt;/property&gt;
&lt;/configuration&gt;

master：在主节点的ip或者映射名。

9000：主节点和从节点配置的端口都是9000。在这里插入图片描述

3.mapred-site.xml

hadoop是没有这个文件的，需要将mapred-site.xml.template样本文件复制为mapred-site.xml，对其进行编辑：

cp mapred-site.xml.template mapred-site.xml
vim mapred-site.xml

在这里插入图片描述内容如下：

&lt;configuration&gt;
&lt;property&gt;
&lt;!--指定Mapreduce运行在yarn上--&gt;
   &lt;name&gt;mapreduce.framework.name&lt;/name&gt;
   &lt;value&gt;yarn&lt;/value&gt;
 &lt;/property&gt;
&lt;/configuration&gt;

4.yarn-site.xml

vim yarn-site.xml

在这里插入图片描述内容如下：

&lt;configuration&gt;
&lt;!-- 指定ResourceManager的地址--&gt;
&lt;property&gt;
 &lt;name&gt;yarn.resourcemanager.address&lt;/name&gt;
   &lt;value&gt;master:18040&lt;/value&gt;
 &lt;/property&gt;
 &lt;property&gt;
   &lt;name&gt;yarn.resourcemanager.scheduler.address&lt;/name&gt;
   &lt;value&gt;master:18030&lt;/value&gt;
 &lt;/property&gt;
 &lt;property&gt;
   &lt;name&gt;yarn.resourcemanager.webapp.address&lt;/name&gt;
   &lt;value&gt;master:18088&lt;/value&gt;
 &lt;/property&gt;
 &lt;property&gt;
   &lt;name&gt;yarn.resourcemanager.resource-tracker.address&lt;/name&gt;
   &lt;value&gt;master:18025&lt;/value&gt;
 &lt;/property&gt;
 &lt;property&gt;
  &lt;name&gt;yarn.resourcemanager.admin.address&lt;/name&gt;
  &lt;value&gt;master:18141&lt;/value&gt;
 &lt;/property&gt;
&lt;!-- 指定reducer获取数据的方式--&gt;
 &lt;property&gt;
  &lt;name&gt;yarn.nodemanager.aux-services&lt;/name&gt;
  &lt;value&gt;mapreduce_shuffle&lt;/value&gt;
 &lt;/property&gt;
 &lt;property&gt;
  &lt;name&gt;yarn.nodemanager.auxservices.mapreduce.shuffle.class&lt;/name&gt;
  &lt;value&gt;org.apache.hadoop.mapred.ShuffleHandler&lt;/value&gt;
 &lt;/property&gt;
&lt;/configuration&gt;

5.hdfs.site.xml

vim hdfs-site.xml

在这里插入图片描述内容如下：

&lt;configuration&gt;
&lt;property&gt;
 &lt;name&gt;dfs.replication&lt;/name&gt;
   &lt;value&gt;2&lt;/value&gt;
 &lt;/property&gt;
 &lt;property&gt;
   &lt;name&gt;dfs.namenode.name.dir&lt;/name&gt;
   &lt;value&gt;file:/usr/hadoop/hadoop-2.7.3/hdfs/name&lt;/value&gt;
   &lt;final&gt;true&lt;/final&gt;
&lt;/property&gt;
 &lt;property&gt;
   &lt;name&gt;dfs.datanode.data.dir&lt;/name&gt;
   &lt;value&gt;file:/usr/hadoop/hadoop-2.7.3/hdfs/data&lt;/value&gt;
   &lt;final&gt;true&lt;/final&gt;
 &lt;/property&gt;
 &lt;property&gt;
  &lt;name&gt;dfs.namenode.secondary.http-address&lt;/name&gt;
   &lt;value&gt;master:9001&lt;/value&gt;
 &lt;/property&gt;
 &lt;property&gt;
   &lt;name&gt;dfs.webhdfs.enabled&lt;/name&gt;
   &lt;value&gt;true&lt;/value&gt;
 &lt;/property&gt;
 &lt;property&gt;
   &lt;name&gt;dfs.permissions&lt;/name&gt;
   &lt;value&gt;false&lt;/value&gt;
 &lt;/property&gt;
&lt;/configuration&gt;

dfs.replication：因为hadoop是具有可靠性的，它会备份多个文本，这里value就是指备份的数量（小于等于从节点的数量）。

6.slaves & master

编写slaves文件，添加子节点slave1和slave2；

vim slaves

编写master文件，添加主节点master。

vim master

四、同步其他虚拟机

分发profile文件，hadoop文件到slave1和slave2节点上

scp -r /etc/profile root@slave1:/etc/profile	#将环境变量profile文件分发到slave1节点
scp -r /etc/profile root@slave2:/etc/profile	#将环境变量profile文件分发到slave2节点
scp -r /usr/hadoop root@slave1:/usr/			#将hadoop文件分发到slave1节点
scp -r /usr/hadoop root@slave2:/usr/			#将hadoop文件分发到slave2节点

生效两个从节点的环境变量

source /etc/profile		#slave1和slave2都要执行

五、格式化hadoop (仅在master中进行操作)

首先查看jps是否启动hadoop，若无才可格式化

hadoop namenode -format

当出现“Exiting with status 0”的时候，表明格式化成功。在这里插入图片描述

六、开启hadoop集群

仅在master主机上开启操作命令。它会带起从节点的启动。（仅在master中进行操作）

cd /usr/hadoop/hadoop-2.7.3		#回到hadoop目录
sbin/start-all.sh		#主节点开启服务

master 在这里插入图片描述 slave1 slave2

注意各个节点的进程区别！如果各个节点的进程如上，那么你的hadoop完全分布式搭建完成！

查看全文

http://www.kler.cn/news/367278.html

eks节点的网络策略配置机制解析

S-Function

【elkb】linux麒麟v10安装ELKB 8.8.X版本（ARM架构）

TensorFlow面试整理-TensorFlow 数据处理

Discuz发布原创AI帖子内容生成：起尔 | AI原创帖子内容生成插件开发定制

雷池社区版有多个防护站点监听在同一个端口上，匹配顺序是怎么样的

Intelij IDEA通过Maven部署一个Tomcat的JavaWeb项目

Vue3用户关注与粉丝列表展示

前端页面手机端触摸屏操作

【C/C++ explicit关键字】为什么有了explicit关键字的构造函数就不能再有其无参构造函数

神经架构搜索：自动化设计神经网络的方法

Mysql5.7变为GreatSQL 8.0.32-25过程中，SQL语句报错及解决方案

原生页面引入Webpack打包JS

uniApp 加载google地图并规划路线

仕考网：25年初级会计师备考建议

十分钟了解Android Handler、Looper、Message

Java虚拟机：JVM介绍

微服务与多租户详解：架构设计与实现

Spring微服务学习笔记之Spring Cloud Alibaba远程服务调用实战

基于SSM的儿童教育网站【附源码】

【华为HCIP实战课程二十三】中间到中间系统协议IS-IS原理与配置详解，网络工程师

霜降时节，网络防护也需“御寒”

【LeetCode:43. 字符串相乘 + 模拟】

408算法题leetcode--第38天

Promise、async、await 、异步生成器的错误处理方案

挂耳式耳机品牌排行榜前十名有哪些？平价开放式耳机品牌推荐！

Linux基础环境搭建（CentOS7）-安装Hadoop

一、Hadoop下载及安装

Hadoop的下载

Hadoop的安装

二、配置Hadoop环境变量（3台）

三、配置hadoop各组件（配置文件建议直接复制粘贴，防止搞错）

1.hadoop-env.sh

2.core-site.xml

3.mapred-site.xml

4.yarn-site.xml

5.hdfs.site.xml

6.slaves & master

四、同步其他虚拟机

五、格式化hadoop (仅在master中进行操作)

六、开启hadoop集群

相关文章：