当前位置: 首页 > article >正文

Apache SeaTunnel 2.3.8版本正式发布!

file

Apache SeaTunnel 2.3.8 版本现已正式发布!此次版本后,用户将可以使用期待已久的Docker镜像,还可以体验Job级别日志功能,以及其他更新优化的功能。本文将详细介绍 Apache SeaTunnel 2.3.8 版本中的关键更新内容,欢迎更多开发者和用户参与到我们的开源社区中来。

  • 2.3.8版本下载: https://seatunnel.apache.org/download/
  • Release Note:https://github.com/apache/seatunnel/releases/tag/2.3.8

重点更新

Job级别日志

此次更新中,我们对日志功能进行了优化,在之前的版本中,多个任务的日志都在一个文件中打印,当同时运行多个任务后,多个任务的日志交织在一起,不便于排查问题。

此次更新支持两种方式的配置,以实现更加高效的日志查询。

第一种是在每行日志中添加JobId,从而可以过滤查询出每个日志单独的日志; file

第二种是根据JobId拆分文件,只需修改日志配置文件,就可以每一个JobId打印单独的日志文件。

file

新增Docker镜像

此次更新中,添加了官方的镜像支持,在镜像中添加了全部的连接器,用户无需下载安装包,可以直接通过拉取镜像,更加方便地运行SeaTunnel,减小部署的复杂度,同时精简使用K8S部署的用户操作流程。

file

而对于有定制化需求,需要二次开发的用户,新版本也提供了一键式打包构建镜像的命令:

file

Flink/Spark引擎支持多表

之前的版本中,多表读取,写入的功能仅在Zeta引擎上进行了支持,此次更新后,Spark/Flink引擎也可以进行多表读取和写入。

适配 Prometheus 进行集群监控

此前,用户需要通过API来获取集群/任务的指标。现在,用户可以将指标进行导出到Prometheus上,Prometheus将定期拉取SeaTunnel的集群任务状态,并以可视化界面展示出来,以更便利地监控集群的状态,及时发现问题。

file

添加Typesense连接器支持

新增加对Typesense连接器的支持。

改进和优化

添加Embedding transform

通过Embedding transform,SeaTunnel支持将机器学习模型嵌入到数据转换过程中,把原始字段转换成向量值,再存储到相应的机器学习数据库。目前,SeaTunnel支持的机器学习模型提供商包括豆包、千帆、OpenAI,未来还将添加更多机器学习模型支持。

Kafka支持读取/写入Protobuf类型数据

增强了Kafka连接器对Protobuf数据格式的支持,在Kafka连接器下增加对Protobuf数据类型的定义,可以进行数据读取和写入。

文件支持读取压缩包

增加了对压缩文件格式的读取支持,省去了解压缩的步骤。

更加细粒度的资源加载隔离

支持将ClassLoader从任务组级别的隔离优化为任务级别,从而避免Source/Sink使用相同ClassLoader时可能造成的依赖冲突。

其他优化还包括:

  • Paimon流失读取和动态桶的写入支持

  • SQL嵌套查询支持查询Map结构字段

  • Iceberg的相关优化

  • 支持Kerberos认证

  • SaveMode添加IGNORE类型

  • 对于Redis不同版本的读取适配优化

  • MySQL 8.1/8.2/8/3版本的适配

  • 支持TiDB的CDC读取

  • 移除JDBC相关连接器中系统表的限制

  • 为所有连接器添加事件通知功能

  • ES连接器支持多表读取的功能

  • HBase连接器添加多表写入的功能

关键问题修复

  • 修复Hazelcast在非TCP连接时的组网问题
  • 修复资源隔离的问题
  • 修复Paimon Dynamic Bucket表,以及Decimal精度丢失的相关问题
  • 修复Iceberg任务结束资源未关闭的问题

详细更新情况请参考Release Note:https://github.com/apache/seatunnel/releases/tag/2.3.8

致谢贡献者

感谢@liunaijie对本次发版工作的指导和帮助,同时感谢以下社区成员的共同努力,让本次发版工作顺利完成:

hailin0, hawk9821, cl0924, sunxiaojian, dailai, corgy-w, Hisoka-X, liunaijie, chl-wxp, zhangshenghang, ISADBA, loustler, chenqianwen, FuYouJ, xxsc0529, EricJoy2048, ZhangWeike2000, jw-itq, kevinjmh, Carl-Zhou-CN, FlechazoW, PeppaPage, liugddx, Cheun99, happyboy1024, CosmosNi, Anush008, BruceWong96, zqr10159, cloud456, Gxinge, xxsc0529, luzongzhu, jiamin13579, Zuhdan, yujian225

本文由 白鲸开源科技 提供发布支持!


http://www.kler.cn/a/354938.html

相关文章:

  • 领克Z20结合AI技术,革新自动驾驶辅助系统
  • Vue.js前端框架教程11:Vue监听器watch和watchEffect
  • 基于推理的目标检测 DetGPT
  • Zerotier + VSCode远程连接实验室的服务器、Xshell连接远程服务器
  • 性能优化!突破性能瓶颈的尖兵CPU Cache
  • 分享某大佬微信hook 最新版本 dll (懂得都懂)
  • Jupyter Notebook汉化(中文版)
  • uniapp的移动端骨架屏组件开发应用
  • Java重修笔记 TCP 网络通信编程 - 传输文件
  • 【计算机网络 - 基础问题】每日 3 题(四十五)
  • 供应商管理是什么?
  • 瘦客户机介绍
  • 智能时代03学习日记
  • 自监督学习:引领机器学习的新革命
  • 电脑显示未安装任何音频输出设备怎么处理?
  • SQL中GROUP BY 和 HAVING 子句中使用 NULL 条件问题
  • Oracle实际需要用到但常常被忽略的函数
  • 3D Slicer 教程一
  • 【 ACM独立出版】第二届通信网络与机器学习国际学术会议(CNML 2024,10月25-27)
  • 01.单例模式设计思想
  • # linux从入门到精通-从基础学起,逐步提升,探索linux奥秘(十三)--权限设置注意事项和属主属组设置sudo操作
  • Google play开发者账号被封,申诉就有机会,别不信
  • day-68 使二进制数组全部等于 1 的最少操作次数 I
  • 三步指南 | 如何轻松将CATIA文件导入SOLIDWORKS?
  • 【热门】智慧果园管理系统解决方案
  • TCP(三次握手)和UDP(面向无连接)的原理以及区别