当前位置：首页 > article >正文

Spark任务读取hive表数据导入es

article 2025/2/21 3:10:02

使用elasticsearch-hadoop 将hive表数据导入es，超级简单

1.引入pom

<dependency>
  <groupId>org.elasticsearch</groupId>
  <artifactId>elasticsearch-hadoop</artifactId>
  <version>9.0.0-SNAPSHOT</version>
</dependency>

2. 创建sparkconf

// spark 参数设置
SparkConf sparkConf = new SparkConf();
//要写入的索引
sparkConf.set("es.resource","");
//es集群地址，不用全部配置会自动发现
sparkConf.set("es.nodes","");
sparkConf.set("es.mapping.id","c1");
sparkConf.set("es.net.http.auth.user","");//用户名
sparkConf.set("es.net.http.auth.pass","");//密码

SparkSession sparkSession = SparkSession.builder().config(sparkConf).enableHiveSupport()
                .getOrCreate();

3. 写入es

        Dataset<Row> dataSet = sparkSession.sql("select c1,c2,c3 from xx");
        JavaEsSparkSQL.saveToEs(dataSet, ImmutableMap.of());

sql读取的字段需要与es字段名一一对应

查看全文

http://www.kler.cn/a/310820.html

算法笔试-编程练习-好题-06

【HarmonyOS NEXT】DevEco快速实现真机截屏，并保存到电脑

JVM面试真题总结（十一）

ORM框架详解：为什么不直接写SQL？

软件渗透测试流程有哪些?专业软件测评公司简析渗透测试的好处

（k8s）Kubernetes 从0到1容器编排之旅

使用blender快速制作metahuman面部以及身体绑定教程

【C语言】分支和循环专题应用

QT＜24＞ Qt和windows中获取CPU序列号号以及主板序列号

为大模型提供服务需要多少 GPU 显存？

centos7如何连接网络 centos7wifi连接

QQ频道机器人零基础开发详解(基于QQ官方机器人文档)[第五期]

笔记：简要介绍WPF中FormattedText是什么，主要有什么功能

普罗米修斯监控

计算机网络 --- Socket 编程

open-webui安装部署

linux-网络管理-网络服务管理 17 / 100

【C++语言】C/C++内存管理

ElK 8 收集 Nginx 日志

Java从入门到精通学习框架（二）

相关文章：