当前位置: 首页 > article >正文

Spark On Yarn External Shuffle Service

个人博客地址:Spark On Yarn External Shuffle Service | 一张假钞的真实世界

本文基于spark-3.1.2-bin-without-hadoop.tgz版本,所以spark-3.1.2-yarn-shuffle.jar已经在节点的${SPARK_HOME}/yarn目录下。

HADOOP_CLASSPATH

在所有NodeManager节点上设置环境变量:

export HADOOP_CLASSPATH=${SPARK_HOME}/yarn/spark-3.1.2-yarn-shuffle.jar:$HADOOP_CLASSPATH

yarn-site.xml

在yarn-site.xml中添加以下配置,并分发至所有NodeManager节点。

<!-- Spark Configuration -->
<property>
  <name>yarn.nodemanager.aux-services</name>
  <value>spark_shuffle</value>
</property>
<property>
  <name>yarn.nodemanager.aux-services.spark_shuffle.class</name>
  <value>org.apache.spark.network.yarn.YarnShuffleService</value>
</property>
<property>
  <name>spark.yarn.shuffle.stopOnFailure</name>
  <value>true</value>
</property>

重启NodeManager

yarn --daemon stop nodemanager
yarn --daemon start nodemanager

检查

在NodeManager节点上使用以下命令查看7337端口是否已被监听:

netstat -ntlp|grep 7337

该端口通过spark.shuffle.service.port指定,默认是7337。

启用

${SPARK_HOME}/conf/spark-defaults.conf中添加以下配置,并分发至所有节点。

spark.shuffle.service.enabled true


http://www.kler.cn/a/530614.html

相关文章:

  • python-leetcode-二叉树的层序遍历
  • MiniQMT与xtquant:量化交易的利器
  • Lesson 127 A famous actress
  • gesp(C++六级)(10)洛谷:P10722:[GESP202406 六级] 二叉树
  • 实验9 JSP访问数据库(二)
  • Ruby 模块(Module)
  • 17.[前端开发]Day17-形变-动画-vertical-align
  • 【高等数学】贝塞尔函数
  • 构建一个研发助手Agent:提升开发效率的实践
  • ArrayBlockingQueue源码分析
  • Codeforces Round 863 (Div. 3) E. Living Sequence
  • Android --- handler详解
  • Kanass基础教程-创建项目
  • 【tiktok 国际版抖抖♬♬ __ac_signature算法】逆向分析
  • 11.kafka开启jmx
  • LeetCode 0598.区间加法 II:最小值
  • 洛谷 P5146 最大差值 C语言
  • 力扣第435场周赛讲解
  • .事件传参与数据同步,条件渲染,列表渲染
  • javaweb实训:购物商城系统项目
  • MQTT知识
  • (万字长文)C++17中的未初始化内存算法:深度解析与实战应用
  • Baklib在内容中台智能化推荐系统中的应用与未来发展路径分析
  • 学习串行通信
  • 记8(高级API实现手写数字识别
  • GPIO配置通用输出,推挽输出,开漏输出的作用,以及输出上下拉起到的作用