当前位置: 首页 > article >正文

CDL数据传输工具

什么是CDL

CDL(全称Change Data Loader)是一个基于Kafka Connect框架的实时数据集成服务。 CDL服务能够从各种OLTP数据库中捕获数据库的Data Change事件,并推送到kafka,再由sink connector推送到大数据生态系统中。

CDL目前支持的数据源有MySQL、PostgreSQL、Oracle、Hudi、Kafka、ThirdParty-Kafka,目标端支持写入Kafka、Hudi、DWS以及ClickHouse。

CDL结构

CDL服务包含了两个重要的角色:CDLConnector 和 CDLService,CDLConnector是具体执行数据抓取任务的实例,包含了Source Connector 和 Sink Connector,CDLService是负责管理和创建任务的实例。

CDL服务中的CDLService是多主模式,任意一个CDLService都可以进行业务操作;CDLConnector是分布式模式,提供了高可靠和Rebalance的能力,创建任务时指定的task数量会在整个集群中的CDLConnector实例之间做均衡,保证每个实例上运行的task数量大致相同,如果某个CDLConnector实例异常或者节点宕机,该任务会在其它节点重新平衡task的数量。

图1 Task的Rebalance示意图


http://www.kler.cn/news/361287.html

相关文章:

  • 保姆级VsCode配置C++编译环境
  • ceph pg stale 恢复
  • 手机玩黑色沙漠?GameViewer远程玩黑色沙漠教程
  • YOLO目标检测
  • 【软件安装与配置】 vue
  • 电脑异常情况总结
  • Mycat2安装配置
  • AI学习指南深度学习篇-对比学习的原理
  • Linux RTC 驱动实验
  • 详细尝鲜flutter
  • 【小趴菜前端实习日记5】
  • 架构师备考-背诵精华(系统架构评估)
  • AI学习指南深度学习篇-对比学习的数学原理
  • 基于OpenFOAM和Python的流场动态模态分解:从数据提取到POD-DMD分析
  • 数据仓库建设 : 主题域简介
  • 150+Premiere剪辑视频制作视频3D空间转场特效
  • MySQL的 主从同步
  • rust入门基础总结
  • 人工智能技术的应用前景与生活工作变革
  • Yolo系列 V1和V2的对比
  • Spring security 如何进行身份认证
  • linux链接、目标文件全解析
  • TWS充电盒:【电源管理芯片汇总】
  • 3184. 构成整天的下标对数目 I
  • Telegram mini app开发极简示例
  • 批量合并PDF 文件的 5 大解决方案