当前位置: 首页 > article >正文

AllData数据中台核心菜单十三:数据湖平台

🔥🔥 AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案。

✨奥零数据科技官网:http://www.aolingdata.com
✨AllData开源项目:https://github.com/alldatacenter/alldata
✨AllData官方文档:https://alldata-document.readthedocs.io
✨AllData社区文档:https://docs.qq.com/doc/DVHlkSEtvVXVCdEFo
在这里插入图片描述
在这里插入图片描述

「 AllData数据中台 - 主页 」
在这里插入图片描述

「 数据湖平台 - 功能描述 」

1、AllData数据同步平台基于开源项目Paimon建设。

2、Paimon是一种数据湖格式,支持使用 Flink 和 Spark 构建实时 Lakehouse 架构,用于流式和批处理操作。创新地结合了 Lake 格式和 LSM 结构,将实时流式更新引入数据湖架构。

3、Paimon数据湖通过一套完善的入湖工具,实现了实时数据同步至数据湖的功能,支持MySQL等多元数据库系统的数据变化快速捕捉与存储。它融合了Flink的流处理能力和Spark等计算引擎的批处理能力,实现了数据湖上的批流一体处理,降低了数据处理的复杂性和成本。

4、Paimon数据湖注重生态集成,与Hive、Trino、Presto等大数据典型计算引擎深度整合,提供了统一的数据存储和访问接口。其底层采用先进的存储架构和技术,如LSM树等,确保了高效的数据写入和查询性能。

5、Paimon数据湖是一个功能强大、易于使用且成本效益高的存储解决方案,适用于各种大数据场景,为数据分析和实时计算提供了坚实的基础。

「 数据湖平台 - 模块功能汇总 」

在这里插入图片描述

「 数据湖平台 - 功能点展示 」

「 数据湖任务 」
在这里插入图片描述
「 数据湖查询 」查询
在这里插入图片描述
「 数据湖查询 」工作台
在这里插入图片描述
「 基础元数据 」创建Catalog
在这里插入图片描述
「 基础元数据 」创建Database
在这里插入图片描述
「 基础元数据 」数据表-Table信息
在这里插入图片描述
「 基础元数据 」数据表-Option信息
在这里插入图片描述
「 基础元数据 」数据表-Schema信息
在这里插入图片描述
「 基础元数据 」数据表-Snapshot信息
在这里插入图片描述
「 基础元数据 」数据表-Manifest信息
在这里插入图片描述
「 基础元数据 」数据表-数据文件
在这里插入图片描述
「 基础元数据 」创建Table
在这里插入图片描述
「 CDC集成 」
在这里插入图片描述
「 CDC集成 」创建同步作业
在这里插入图片描述
「 CDC集成 」创建同步作业-编辑(MySQL-Paimon)
在这里插入图片描述
「 CDC集成 」创建同步作业-编辑(Kafka-Paimon)
在这里插入图片描述
「 CDC集成 」创建同步作业-编辑(MongoDB-Paimon)
在这里插入图片描述
「 CDC集成 」创建同步作业-编辑(PostgreSQL-Paimon)
在这里插入图片描述
「 CDC集成 」创建同步作业-运行
在这里插入图片描述
「 数据湖集群 」
在这里插入图片描述
「 数据湖集群 」新增集群
在这里插入图片描述
「 数据湖集群 」更新集群
在这里插入图片描述
「 数据湖集群 」集群连通性检测
在这里插入图片描述


http://www.kler.cn/a/553155.html

相关文章:

  • deepseek-r1系列模型部署分别需要的最低硬件配置
  • 解析DrugBank数据库数据|Python
  • KTransformers如何通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大语言模型的推理速度?
  • JVM 类加载器深度解析(含实战案例)
  • 有名管道的空间大小
  • [实现Rpc] 消息抽象层的具体实现
  • IO进程 day01
  • MySQL 安装过程记录以及安装选项详解
  • 寒假总结。
  • 基于Java(JSP)+MySQL设计与实现的 MVC 鲜花订购系统
  • “以数治税”时代 数据要素的价值挖掘
  • 昇腾DeepSeek模型部署优秀实践及FAQ
  • 图解长短期记忆网络(LSTM)
  • Yocto项目:如何部署AI——完整指南*
  • 基于开源Odoo、SKF Phoenix API与IMAX-8数采网关的圆织机设备智慧运维实施方案 ——以某纺织集团圆织机设备管理场景为例
  • SpringCloud面试题----什么是Feign?是如何实现负载均衡的
  • OSPF(开放路径最短优先)
  • JAX-RS与JAXB:实现XML数据交互的完整指南
  • 萌新学 Python 之 if 语句的三目运算符
  • C++ stack:数据结构的“叠盘子艺术”与“后进先出法则