【数据治理-设计数据标准】
1、分类分步骤制定数据标准
(1)根据定义数据标准的对象不同,数据标准可以分为面向业务数据的数据标准和面向分析数据的数据标准。
(2)面向业务数据的数据标准核心解决的问题是业务过程、结果数据和跨业务、跨系统的数据的一致性、正确性和权威性的问题。在各业务域数据资产目录的基础上定义业务数据标准,规范业务数据的产生、存储、使用的全过程。
(3)面向分析数据的数据标准主要解决的是数据分析过程中,数据维度和分析事实的一致性和规范性、指标数据计算的口径一致性、数据标签和模型的通用性等问题。最后因为分析数据本身还是来源于业务系统,所以业务数据标准是面向分析的数据标准的前提。在支撑分析的主题联结层,定义多维数据标准、指标数据标准和标签数据标准。
(4)因此,制定数据标准的基本逻辑是先在各业务域定义业务数据标准,再在面向分析的主题联接层定义多维数据表、指标数据标准和标签数据标准。
2、业务数据标准
业务数据是业务活动过程中产生的数据,是企业日常经营活动的直接体现,也是围绕主数据实体产生的业务行为和结果型数据。业务活动数据广泛存在于公司的各种业务活动、各类信息化系统、数据分析系统之中。针对这些重要的业务数据,建立让业务方、技术方、管理方都能认同的数据标准,统一业务数据的定义、结构、格式等方面,从而实现企业范围内的数据产生、使用、分析、共享的无障碍流通。
3、指标数据标准
指标就是用基于对业务进行分析的需求而制定的用某一个统一的标准去衡量业务状况的数值指示器,业务指标的数据变化情况会直接反映某一项业务的运营变化情况,指标用户(一般是管理者和业务分析者)会根据所反映出来的变化情况,及时的对现实业务做出调整。对指标制定标准就是为了统一业务、管理、技术等各方面对指标的理解和认知,确保无歧义、无偏差。
4、 维度数据标准
维度是用于观察和分析业务数据的视角,支撑对数据进行汇聚、钻取、切片分析。维度用于OLAP多维数据分析和决策支持场景下,维度代表了业务分析的视角,分析的数据内容就是事实数据。事实数据和维度进行关联构成事实表。对维度数据建立标准,统一分析数据的角度和穿透钻取逻辑,为管理者提供维度一致的数据分析视角。
5、标签数据标准
(1)标签是根据业务场景的需求,通过对目标对象(含静态、动态特性)运用抽象、归纳、推理等方法得到的高度精练的特征标识,用于差异化分类管理与决策。标签由其使用者自由定义,用于描述某个特征的定性数据。与用具体数据值描述事物的指标数据不同,标签数据更具有简单、易识别、定性化的特征。
(2)标签一般是基于原始数据进行加工得到的,带有特定业务含义的概括性描述。对标签的来源、生成规则和使用场景进行规范,就需要定义标签数据标准。