当前位置: 首页 > article >正文

Spark3.2.0集群部署ON YARN

环境说明

  • 准备三台服务器,分别为:bigdata141(hadoop 主节点)、bigdata142、bigdata143
  • 确保 hadoop 集群先启动好,我这边的 hadoop 版本为 3.2.0
  • 另准备一台服务器,bigdata144,作为 hadoop 客户端节点,也是作为spark的客户端节点

下载安装包 

下载链接:Index of /dist/spark

注意版本对应,这边 spark 选择版本为 3.2.0

下载完后,上传到作为客户端的服务器,我这边上传到 bigdata144 的 /data/soft/ 目录下

解压并配置

解压

解压,而后进入

[root@bigdata144 soft]# tar -zxvf spark-3.2.0-bin-hadoop3.2.tgz
[root@bigdata144 soft]# cd spark-3.2.0-bin-hadoop3.2
[root@bigdata144 spark-3.2.0-bin-hadoop3.2]# ll

配置

1、进入 conf/ 目录,复制一份 spark-env.sh.template

[root@bigdata144 spark-3.2.0-bin-hadoop3.2]# cd conf/
[root@bigdata144 conf]# ll
[root@bigdata144 conf]# cp spark-env.sh.template spark-env.sh
[root@bigdata144 conf]# vi spark-env.sh

2、编辑 spark-env.sh,在文件末尾添加 JAVA_HOME 和 hadoop 配置文件目录:

export JAVA_HOME=/data/soft/jdk1.8
export HADOOP_CONF_DIR=/data/soft/hadoop-3.2.0/etc/hadoop

启动Spark

 此部署方式不用启动 spark 任何进程

提交任务

1、查看 examples/jars 目录下的包,然后尝试提交任务:

[root@bigdata144 spark-3.2.0-bin-hadoop3.2]# ll examples/jars
[root@bigdata144 spark-3.2.0-bin-hadoop3.2]# bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn --deploy-mode cluster examples/jars/spark-examples_2.12-3.2.0.jar

 2、到 yarn 的界面上查看提交的 spark 任务信息,这样就可以在 yarn 上执行 spark 任务了


http://www.kler.cn/a/441258.html

相关文章:

  • PyTorch 快速入门
  • Go的内存逃逸
  • concurrent.futures.Future对象详解:利用线程池与进程池实现异步操作
  • 联想Y7000+RTX4060+i7+Ubuntu22.04运行DeepSeek开源多模态大模型Janus-Pro-1B+本地部署
  • Python学习之旅:进阶阶段(五)数据结构-双端队列(collections.deque)
  • Edge-TTS在广电系统中的语音合成技术的创新应用
  • Electron-Vue 框架的构成拆解 动态 Webpcak 5 打包
  • 2024三掌柜赠书活动第三十六期:深度学习高手笔记系列
  • ChatGPT Search开放:实时多模态搜索新体验
  • [OpenGL] 崩溃在nvoglv32.dll
  • LeetCode:239. 滑动窗口最大值
  • 【功能安全】软件安全架构
  • Ubuntu批量修改文件名
  • Netty 常见面试题原理解析
  • Java-08
  • FFmpeg 4.3 音视频-多路H265监控录放C++开发二十一.2,RTP协议-RTP协议概述,协议详情
  • 国标GB28181网页直播平台EasyGBS国标EasyGBD对讲音频demo
  • 大语言模型推理技术知识体系
  • Leetcode1847:最近的房间
  • RTSP系列一:RTSP协议介绍
  • 使用 Docker 容器持久化挂载本地路径避免数据丢失
  • GaLore和Q-GaLore:一种记忆高效的预训练和微调策略,用于大型语言模型(LLMs)
  • 推荐文章:探索单图像分片平面的3D重构——PlanarReconstruction项目详解
  • 【zlm】 webrtc源码讲解三(总结)
  • ctfshow-web入门-爆破(web21-web24)
  • 基于单片机智能鱼缸的设计