当前位置: 首页 > article >正文

基于伪分布式模式部署Hadoop集群

1.上传Hadoop安装包

在/export/software目录下使用rz命令上传Hadoop安装包

2.创建目录

在/export/servers目录下创建wfb-hadoop目录,用于存放Hadoop的安装目录,命令如下:

mkdir -p /export/servers/wfb-hadoop

3.安装Hadoop

        1)将Hadoop安装到/export/servers/wfb-hadoop目录,命令如下:

        tar -zxvf /export/software/Hadoop-3.3.4.tar.gz -C /export/servers/wfb-hadoop

        2)安装完成之后,进入到安装目录/export/servers/wfb-hadoop/Hadoop-3.3.4,并执行ll命令查            看Hadoop安装目录中的所有文件

4.验证Hadoop是否安装成功

在安装目录执行bin/Hadoop version命令查看Hadoop版本号,来验证是否安装成功

5.修改Hadoop配置文件

进入安装目录下的/etc/hadoop目录

        1)使用vi Hadoop-env.sh命令进行编辑,在该文件中添加如下内容:

        export JAVA_HOME=/export/servers/jdk1.8.0_171

        export HDFS_NAMENODE_USER=root

        export HDFS_DATANODE_USER=root

        export HDFS_SECONDARYNAMENODE_USER=root

        export YARN_RESOURCEMANAGER_USER=root

        export YARN_NODEMANAGER_USER=root

        2)执行vi core-site.xml命令进行编辑,在<configuration>标签中添加如下内容:

<property>

                <name>fs.defaultFS</name>

                <value>hdfs://hadoop1:9000</value>

        </property>

        <property>

                <name>hadoop.tmp.dir</name>

                <value>/export/data/hadoop-wfb-3.3.4</value>

        </property>

        <property>

                <name>hadoop.http.staticuser.user</name>

                <value>root</value>

        </property>

        <property>

                <name>hadoop.proxyuser.root.hosts</name>

                <value>*</value>

        </property>

        <property>

                <name>hadoop.proxyuser.root.groups</name>

                <value>*</value>

        </property>

        <property>

                <name>fs.trash.interval</name>

                <value>1440</value>

        </property>

        3)执行vi hdfs-site.xml命令进行编辑,在文件的<configuration>标签中添加如下内容:

<property>

      <name>dfs.replication</name>

      <value>1</value>

</property>

<property>

      <name>dfs.namenode.secondary.http-address</name>

      <value>hadoop1:9868</value>
  </property>

        4)执行vi mapred-site.xml命令进行编辑,在文件的<configuration>标签中添加如下内容:

<property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>hadoop1:10020</value>

</property>

<property>

                <name>mapreduce.jobhistory.webapp.address</name>

<value>hadoop1:19888</value>

</property>

<property>

<name>yarn.app.mapreduce.am.env</name>

                <value>HADOOP_MAPRED_HOME=/export/servers/wfb-hadoop/hadoop-3.3.4</value>

</property>

<property>

<name>marpreduce.map.env</name>

                <value>HADOOP_MAPRED_HOME=/export/servers/wfb_hadoop/hadoop-3.3.4</value>

        </property>

<property>

<name>mapreduce.reduce.env</name>

                <value>HADOOP_MAPRED_HOME=/export/servers/wfb-hadoop/hadoop-3.3.4</value>
</property> 

        5)执行vi yarn-site.xml命令进行编辑,在文件的<configuration>标签中添加如下内容:

<property>

<name>yarn.resorcemanager.hostname</name>

<value>hadoop1</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.pmem-check-enabled</name>

<value>false</value>

</property>

<property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>

<property>

<name>yarn.log.server.url</name>

                <value>http://hadoop1:19888/jobhistory/logs</value>

</property>

<property>

<name>yarn.log-aggregation.retain-seconds</name>

<value>604800</value>

</property>

        6)在安装目录虚下的/etc/hadoop目录执行vi workers命令,配置Hadoop从节点运行的服务器,将workers文件的默认内容改为hadoop1

6.格式化HDFS文件系统

在安装目录下执行如下命令,进行HDFS格式化(我已经进行格式化了,不再展示命令执行结果),出现successfully formatted说明格式化成功

bin/hdfs namenode -format

7.启动Hadoop

在安装目录下执行下列命令,启动HDFS和YARN

sbin/start-dfs.sh

sbin/start-yarn.sh

8.查看Hadoop运行状态

使用jps命令查看HDFS和YARN的相关服务


http://www.kler.cn/a/468607.html

相关文章:

  • 小R的蛋糕分享
  • HTML - <a>
  • 什么样的人适合从事FPGA开发的工作?
  • Spring MVC实战指南:构建高效Web应用的架构与技巧(三)
  • 麒麟信安云在长沙某银行的应用入选“云建设与应用领航计划(2024)”,打造湖湘金融云化升级优质范本
  • Linux 基础 4.文件IO 通用的IO模型
  • 开源模型迎来颠覆性突破:DeepSeek-V3与Qwen2.5如何重塑AI格局?
  • 流光效果
  • docker从下载到Python项目打包到容器中运行(解决下拉超时问题)
  • 【three.js】Shader着色器
  • 如何弥补开源大语言模型解决推理任务的不足
  • 深度 SEO 优化
  • 常见的框架漏洞复现
  • HarmonyOS NEXT应用开发实战(一):边学边玩,从零开发一款影视APP
  • 如何使用SparkSql
  • GESP202406 二级【计数】题解(AC)
  • html生成注册与登录代码
  • 使用LINUX的dd命令制作自己的img镜像
  • 【CSS】第一天 基础选择器与文字控制属性
  • 实时数仓:基于数据湖的实时数仓与数据治理架构
  • 【人工智能】基于Python与OpenCV构建简单车道检测算法:自动驾驶技术的入门与实践
  • [读书日志]从零开始学习Chisel 第四篇:Scala面向对象编程——操作符即方法(敏捷硬件开发语言Chisel与数字系统设计)
  • 【开源监控工具】Uptime Kuma:几分钟设置实时监控你的网站性能
  • 计算机网络掩码、最小地址、最大地址计算、IP地址个数
  • Android学习20 -- NDK5--操作camera(TODO)
  • 【能用的方案】springBoot集成netty中如何使用@Value(通过依赖注入(DI)来访问)配置文件中的属性值