当前位置: 首页 > article >正文

海睿思分享 | 浅谈数仓指标体系管理

什么是指标

指标,是用于衡量事物发展程度的单位或方法,也常被称作度量,通常情况下也是报表统计的字段,例如:人口数、营业收入、用户数、利润率、成功率、失败率、覆盖率等。

//

1

数仓指标的构成

❖ 数据域

数据域是统一数仓层的顶层划分,是一个较高层次的数据归类标准,是对企业业务过程进行抽象、提炼、组合的集合,面向业务分析,一个数据域对应一个宏观分析领域,比如采购域、供应链域、HR域等。

数据域是抽象、提炼出来的,并且不轻易变动,既能涵盖当前所有业务需求,又能在新业务进入时无影响地将其分配到已有的数据域中,只有当所有分类都不合适时才会扩展新的数据域。

数据域是有效归纳、组织业务过程的方式,同时方便定位指标/度量。

❖ 业务过程

业务过程是一种企业的业务活动事件,且是企业经营过程中不可拆分的行为事件,比如下订单、银行转账、账号注册都是业务过程。

业务过程产生度量,并且会被转换为最终的事实表中的事实。业务过程一般与事实表一一对应,也有一对多或者多对一的特殊情况,比如累计快照事实表就会把多个业务过程产生的事实在一张表中表达。

❖ 统计周期

统计周期即统计数据的时间范围,例如历史至今、最近7天、最近30天、最近1年等(类似于SQL中where后的时间条件)。

公共定义仅支持定义统计周期,定义时与数据域、业务过程、事实/维度表是否定义无关,在此仅作计算逻辑定义。

❖ 业务限定

业务限定是指除统计维度以外对指标进行限定抽象的业务场景修饰词,限定统计的业务范围,筛选出符合业务规则的记录(类似于SQL中where后的条件,不包括时间区间)。

业务限定也有归属的数据域,某个业务限定来源于一张事实表或维度表,继承来源表的数据域,比如限定词“江苏省”、“部门-销售事业部”等。

❖ 维度

维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度。维度属于一个数据域,如组织维度(其中包括产品线、部门、科室、车间等)、时间维度(其中包括年、季、月、周、日等)。

2

数仓指标的分类

数仓指标分类主要为:原子指标、派生指标、复合指标、应用指标。

❖ 原子指标

原子指标是针对某一业务事件行为的度量,是一种不可拆分的指标,具有明确业务含义,比如支付金额。原子指标有确定的字段名称、数据类型、算法说明、所属数据域和业务过程。原子指标名称一般采用“动作+度量”方式命名,比如支付金额、注册用户数。

❖ 派生指标

派生指标可以理解为对原子指标业务统计范围的圈定,比如最近1年销售事业部销售金额(“最近1年”是统计周期,“销售事业部”是业务限定,“销售金额”是原子指标),1个派生指标=1个原子指标+统计周期+业务限定。

派生指标的构成

❖ 复合指标

复合指标是基于已经设计好的派生指标,设定复合计算逻辑而构成的指标。例如,一个已保存的派生指标A为最近1年销售事业部销售金额,另一个已保存的派生指标B为历史至今销售事业部在职员工人数,A/B即可以统计最近一年销售事业部人均销售金额。

复合指标的构成

❖ 应用指标

应用指标通常指从客户处调研得到,满足业务需要,最终要形成报表的指标,一般来源于派生指标或者复合指标。

3

数仓指标当前的痛点

❖ 命名不规范:存在含义不清晰、表述不正确、指标名称雷同,实际计算逻辑不一致,或者指标名称不一样,但是计算逻辑一致的情况。

❖ 口径不清晰:从用户处调研过来的指标口径描述不清晰,无法理解和实现。

❖ 指标稽核难:调研口径和实际逻辑没有明确、清晰的校验对比,稽核难度大,容易出现后面返工的情况。

❖ 呈现不直观:客户无法通过系统直观的看到指标业务流向,指标管理方式千差万别,有excel管理、ETL管理等。

❖ 结果跨平台:系统中治理完成的数据和指标无法快速数据分析,需要依赖于其他平台。

❖ 数据难追溯:业务血缘和数据血缘在系统中没有打通,导致应用指标进行数据溯源时较为困难。

4

面向业务的现代化指标体系

OceanMind海睿思 基于面向业务的现代化指标体系的理解,结合自身在大数据行业的技术沉淀,设计开发的S-DW智能数仓,通过建立企业数字化经营管理指标体系,实现经营健康情况实时、数字、可视化展示,纵向到底、追根溯源、高效辅助业务决策。

❖ 业务指标调研脑图线上呈现,统一管理,权限管理,可以做到调研结果的可视化、规范化、准确化。

【脑图体系】

❖ 业务总线矩阵,一键导入,线上管理和维护,快速构建数仓模型,提升指标建设实施效率。

【总线矩阵】

❖ 指标构建流程化,提供快速运算方式,为指标构建提高了效率,提升了准确性。

【指标构建】

❖ 提供了指标稽核能力,为业务逻辑和计算逻辑实现的一致性提供了稽核校验,方便人员审核。

【指标稽核】

❖ 提供了指标溯源、数据血缘能力,从业务指标层层追溯到源头业务数据,所见即所踪。

【指标血缘】

❖ 提供指标预览和预警功能,让企业运营风险及时掌握。指标全链路分析追根溯源,纵向到底,精准定位问题。

【异常预警】

 

【数据预览】

❖ 提供指标分析能力,支持多指标、多维度自定义构建,实时查看指标分析结果,可以将指标结果明细导出报表。

【指标分析】

5

总结

海睿思S-DW智能数仓,通过提供面向业务现代化指标体系,帮助企业进行指标规范化管理,规范指标的开发,维护好指标的计算口径和取数逻辑,为指标体系化构建赋能,为业务人员减负!


http://www.kler.cn/a/6995.html

相关文章:

  • 台式电脑没有声音怎么办?台式电脑没有声音解决详解
  • Android Activity Manager Service (AMS) 深入详解及源码分析
  • vue实现展示并下载后端返回的图片流
  • JDK17 安装使用
  • 三周精通FastAPI:42 手动运行服务器 - Uvicorn Gunicorn with Uvicorn
  • 常用命令之LinuxOracleHivePython
  • 深度学习训练营之yolov5训练自己的数据集
  • js(六)
  • 蓝桥杯 --- 递归与递推(习题)
  • 互联网摸鱼日报(2023-04-03)
  • 5类“计算机”专业很吃香,人才缺口巨大,就业前景良好
  • 我的 System Verilog 学习记录(13)
  • 逻辑回归算法
  • 算法竞赛进阶指南0x04 二分
  • 深度模型部署工具优劣学习总结
  • 关于华强北悦虎耳机破解开启苹果手机弹窗动画学习教程
  • MySQL事务
  • Java笔记_9(面向对象进阶)
  • Biotin-PEG-SH生物素-聚乙二醇-巯基结构式;SH-PEG-Biotin
  • Linux三剑客之grep命令详解
  • Spark简介及入门
  • maven之pom.xml配置文件详解
  • 函数参数:右值引用
  • 【分布式】HLC 混合逻辑时钟
  • 45了解容器编排工具 Kubernetes 的基本概念和应用,包括 Pod、Service
  • 上传了ipa但在苹果App Store中没有看到构建版本的问题