当前位置: 首页 > article >正文

01-Datahub是什么?

Datahub是LinkedIn开源的基于现代数据栈的元数据管理平台,原来叫做WhereHows 。经过一段时间的发展datahub于2020年2月在Github开源。

官网地址为:A Metadata Platform for the Modern Data Stack | DataHub

源码地址为:GitHub - datahub-project/datahub: The Metadata Platform for the Modern Data Stack

目前标星8.8K,最新稳定版本0.12.0。

开发语言为Java和Python。

官网

页面

Datahub支持的功能:

Datahub是现代数据栈的元数据管理平台,支持Tableai、PowerBI、Superset等数据可视化工具。也支持Airflow、Spark、ES、Kafka、Hive、Mysql、Oracle等大数据组件的元数据的获取。

有搜索,数据血缘,数据分析,标签,术语表等功能,也可以集成数据质量框架,如GreatExceptions。

Datahub的优缺点:

优势:

强大的数据发现和搜索功能,方便用户快速定位所需数据。

提供数据质量元数据,帮助用户理解和信任数据。

支持多种数据源,包括传统的关系数据库和现代的数据湖。

社区活跃,不断有新功能和改进加入。

劣势: 初学者可能会觉得界面和配置相对复杂。

在某些情况下,集成新的数据源可能需要额外的开发工作。

总之Datahub是目前最优秀的元数据管理项目,如果能掌握Datahub对于学习元数据管理帮助巨大。


http://www.kler.cn/a/228716.html

相关文章:

  • FPGA 21 ,深入理解 Verilog 中的基数,以及二进制数与十进制数之间的关系( Verilog中的基数 )
  • Ubuntu 24.04 LTS 安装 tailscale 并访问 SMB共享文件夹
  • 数据库管理-第285期 Oracle 23ai:深入浅出向量索引(20250117)
  • lvm快照备份
  • CSS 合法颜色值
  • 第5章:Python TDD定义Dollar对象相等性
  • SpringBoot中数据库的连接及Mybatis的配置和使用
  • leetcode(滑动窗口)3.无重复字符的最长字串(C++详细题解)DAY2
  • aspose-words基础功能演示
  • Qt PCL学习(一):环境搭建
  • flink写入es的参数解析
  • PyTorch识别验证码
  • 【云原生kubernetes系列】---亲和与反亲和
  • docker更换镜像源
  • Vue 实现动态路由
  • 恒创科技:服务器内存不足影响大吗?
  • MySQL存储引擎、事务、锁、日志
  • 异地办公必不可缺的远程控制软件,原理到底是什么?
  • docker 的常用命令
  • C#入门及进阶教程|C#基本语法(五):控制台应用程序与格式化输出
  • 乐意购项目前端开发 #6
  • WordPress主题YIA如何将首页的置顶小工具改为站长推荐小工具?
  • 【Linux】解决:为什么重复创建同一个【进程pid会变化,而ppid父进程id不变?】
  • CTFHUB SSRF POST小记
  • 2024最新版Sublime Text 4安装使用指南
  • VLM 系列——MoE-LLaVa——论文解读