当前位置：首页 > article >正文

Spark SQL读写Hive Table部署

article 2025/3/10 20:32:00

个人博客地址：Spark SQL读写Hive Table部署 | 一张假钞的真实世界

官网参考文档：Hive Tables。

本文使用的组件版本如下：

第一步：Hive部署

在所有Worker节点上部署Hive。主要是使用Hive下面的libs。

在${SPARK_HOME}/conf/spark-env.sh中添加以下内容：

export SPARK_DIST_CLASSPATH=$(hadoop classpath)

编译的目的是支持Hive。

./dev/make-distribution.sh --tgz -Phive -Phive-thriftserver -Pyarn -Dhadoop.version=3.2.2 -Phadoop-provided

部署过程比较简单。部署过程遇到的问题参见另外一篇博文：Spark on YARN部署

spark.sql.hive.metastore.version 3.1.2
spark.sql.hive.metastore.jars path
spark.sql.hive.metastore.jars.path file:///opt/hive/lib/*.jar

注意：这些Jar包需要使用Hive 3.1.2版本的。

10：预处理

回溯算法理论基础

递归练习七（floodfill 算法）

C#属性和字段(访问修饰符)

代码随想录-训练营-day17

JVM运行时数据区域-附面试题

MATLAB实现多种群遗传算法

MySQL各种日志详解

32.Word：巧克力知识宣传【32】

基于STM32的电动窗帘控制器