EDW国际数据管理最新趋势(二)|信息供应链与数据
最近Data Fabric、Data Mesh、DataOps等话题非常火。其实,信息供应链谈的也是同样的东西,那就是如何将数据治理与数据集成整合在一起的解决方案。
下图虽然简单但涵盖了非常大的信息量。将4A架构进行了拆解,应用架构与技术架构主要是支撑业务,业务架构与数据架构驱动企业进行数字化变革,在这个过程中靠数据架构打通数据与业务。
下面讲述如何设计一个数据产品。类似敏捷开发的Use Case设计,数据产品的设计也可以用一张画布来展示,包括数据产品的输入、输出接口设计,元数据设计,使用场景设计等。
接下来是一个具体的数据产品的画布例子。《设备错误修复》这样一个数据产品,输入是IoT数据,通过过滤与加工,捕获异常数据,并进行修复。
回到信息供应链,从经典的Bill Inmon数仓体系,从贴源层到数仓到数据集市也在逐步升级,越来越多数仓模型采用更为灵活的Data Vault模型。数据集市变化更大,除了传统的维度模型支撑BI报表和数据可视化,也输出面向数据挖掘平台的数据资产目录,面向AI的知识图谱,面向SOA的流式数据输出等。
最后我们看一下信息供应链全景图
第一:数据产品的设计,包括数据产品业务需求(Use Case)设计和数据模型设计(业务逻辑模型)
第二:从数据生产到数据消息,中间分为三层:贴源层、中间层Data Vault、信息访问层(多种形态)
总结一下,信息供应链的核心是数据产品,数据产品的核心是设计(业务需求与数据模型)。