当前位置: 首页 > article >正文

Hadoop3.3.4伪分布式环境搭建

文章目录

  • 前言
  • 一、准备
    • 1. 下载Hadoop
    • 2. 配置环境变量
    • 3. 配置免密
  • 二、Hadoop配置
    • 1. hadoop-env.sh
    • 2. hdfs-site.xml
    • 3. core-site.xml
    • 4. mapred-site.xml
    • 5. yarn-site.xml
  • 三、格式化
  • 四、启动


前言

hadoop学习——伪分布式环境——普通用户搭建


一、准备

1. 下载Hadoop

2. 配置环境变量

vi ~/.bash_profile

# 增加如下配置
export HADOOP_HOME=/home/install/hadoop-3.3.4
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

# 使配置生效
source ~/.bash_profile

3. 配置免密

二、Hadoop配置

配置的目录是$HADOOP_HOME/etc/hadop

1. hadoop-env.sh

修改JAVA_HOME,设置为JDK所在的位置

# Linux命令行输出 JDK 位置
echo $JAVA_HOME

2. hdfs-site.xml

<!--指定数据冗余份数-->
<property>
    <name>dfs.replication</name>
    <value>1</value>
</property>
<property>
    <name>dfs.http.address</name>
    <value>hadoop01:50070</value>
</property>

3. core-site.xml

 <!--hadoop01是机器名  hostname-->
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://hadoop01:9000</value>
</property>
<!-- hadoop临时目录 -->
<property>
    <name>hadoop.tmp.dir</name>
    <value>/home/install/data/hadoop/HADOOP_TMP_DIR</value>
    <description>Abase for other temporary directories.</description>
</property>
<!--所有用户可访问-->
<property>
    <name>hadoop.proxyuser.hduser.groups</name>
    <value>*</value>
</property>
<!--设置buffer size-->
<property>
    <name>io.file.buffer.size</name>
    <value>131072</value>
</property>
<!--任何IP可访问-->
<property>
    <name>hadoop.proxyuser.hduser.hosts</name>
    <value>*</value>
</property>

4. mapred-site.xml

<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>
<property>
    <name>mapreduce.job.counters.max</name>
    <value>1200000</value>
</property>
<property>
    <name>mapreduce.map.memory.mb</name>
    <value>4096</value>
</property>
<property>
    <name>mapreduce.reduce.memory.mb</name>
    <value>8192</value>
</property>
<property>
    <name>mapreduce.map.java.opts</name>
    <value>-Xmx3072m</value>
</property>
<property>
    <name>mapreduce.reduce.java.opts</name>
    <value>-Xmx6144m</value>
</property>

5. yarn-site.xml

<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>
<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop01</value>
</property>
<property>
    <name>yarn.nodemanager.vmem-pmem-ratio</name>
    <value>4</value>
</property>
<property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
</property>
<property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>20480</value>
</property>
<property>
    <name>yarn.scheduler.minimum-allocation-mb</name>
    <value>1024</value>
</property>
<property>
    <name>yarn.scheduler.maximum-allocation-mb</name>
    <value>20480</value>
</property>

三、格式化

hadoop namenode -format

四、启动

# 懒一点的方式
start-all.sh


http://www.kler.cn/a/505028.html

相关文章:

  • 蓝桥杯_B组_省赛_2022(用作博主自己学习)
  • 初识算法和数据结构P1:保姆级图文详解
  • 工程水印相机结合图纸,真实现场时间地点,如何使用水印相机,超简单方法只教一次!
  • 提供的 IP 地址 10.0.0.5 和子网掩码位 /26 来计算相关的网络信息
  • HTML5 加载动画(Loading Animation)
  • MySQL数据库(SQL分类)
  • 《Vue3实战教程》34:Vue3状态管理
  • 大数据学习(33)-spark-transformation算子
  • Android BitmapShader更简易的实现刮刮乐功能,Kotlin
  • 计算机二级-Java系列(Java的特点)
  • nodejs后端ws与http结合共享一个服务器,前端websocket发送信息后端ws接收信息,使用Map定型数组设置ID
  • rust调用DLL或lib
  • Redis 缓存穿透、击穿、雪崩 的区别与解决方案
  • 微软组建新内部 AI 研发组织:开启智能创新新篇章
  • GPT-SoVITS学习01
  • UDP、TCP特性
  • CasaOS小主机如何部署1Panel面板并实现远程管理服务器超实用教程
  • ubuntu 配置OpenOCD与RT-RT-thread环境的记录
  • 海康大数据面试题及参考答案
  • 【后端面试总结】Golang可能的内存泄漏场景及应对策略
  • Hessian矩阵 通过符号计算解析 Hessian 矩阵
  • 手机与平板:勒索软件的“天然通道”
  • 实时洞察、智能运营——新技术重塑企业绩效管理应用(上)
  • NLP自然语言处理分词模块PaddleNLP
  • 【赛博保安】安全Web日记文件下载漏洞逻辑越权漏洞密码爆破WebGoat靶场(四)
  • Android15源码编译问题处理