当前位置: 首页 > article >正文

数据治理(2)-数据标准

前言

在建模前规划制定数据标准,或在建模使用过程中根据业务情况沉淀企业业务的数据标准。通过规范约束标准代码、度量单位、字段标准、命名词典,来保障数据处理的一致性,从源头上保障数据的标准化生产,节约后续数据应用和处理的成本。数据标准包含字段标准标准代码度量单位命名词典


一、字段标准

字段标准是对含义相同但字段名称不同的数据进行统一规范管理的标准。

字段标准包含:

二、标准代码

标准代码是字段标准的取值范围,在标准代码中可设置某一字段标准可选择的数据的内容以及范围。例如性别字段标准的标准代码内容应该为男或女。

三、度量单位

度量单位指字段参数的数量单位(如个、厘米等),系统已为您提供了预置的度量单位,您可根据自定义需求创建新的度量单位。度量单位包括货币单位对象量词比例单位排名单位时间单位等度量类别。

四、命名词典

命名词典提供管理业务名词、物理表、字段的词根和词素等。

五、规则检查器

例如:某公司希望目标数仓分层中的表以dim_开头。当数仓分层中包含命名为dim_sku、dim_store、dimension_warehouse、fact_order的表时,触发检测后,检测结果如下表所示。

表名称

是否符合数仓分层的命名规范

dim_sku

匹配

dim_store

匹配

ension_warehouse

不匹配。名称不符合以dim_开头的规范。

fact_order

不匹配。名称不符合以dim_开头的规范。

总结

创建完成命名词典后,您可以在数仓规划的各层的检查器配置中。数据域、业务过程与业务分类的规划和创建。检查数仓中的表名、字段名等是否符合数仓分层的命名规范。


http://www.kler.cn/a/353317.html

相关文章:

  • Python使用socket实现简易的http服务
  • Linux--CPU系统资源命令查看--详解
  • MySQL批量修改数据表编码及字符集为utf8mb4
  • STM32裸机开发转FreeRTOS教程
  • 【Python】Python与C的区别
  • Spring配置文件中:密码明文改为密文处理方式(通用方法)
  • 网站集群批量管理-Ansible-进阶
  • Android/鸿蒙应用的资源配置技巧
  • 无人机驾驭技术:激光雷达非接触式测量!
  • 深入理解Go语言的栈
  • 笔记-Python爬虫技术基础及爬取百度新闻
  • 【人工智能-初级】第4章 用Python实现逻辑回归:从数据到模型
  • 微服务架构与容器云的关系与区别
  • HTML该如何性能优化?
  • 基于springboot的4S店车辆管理系统
  • 10.16学习
  • 道可云人工智能元宇宙每日资讯|中国发布首个汽车智能安全评价体系
  • 蓝象公共数据流通运营平台 助力公共数据资源开发利用
  • SpringMVC源码-@ControllerAdvice和 @InitBinder注解源码讲解
  • 2套solidworks如何满足20人使用?
  • [含文档+PPT+源码等]精品基于springboot实现的原生微信小程序小型电子拍卖系统
  • UE5 猎户座漂浮小岛 04 声音 材质
  • js的基础问题
  • SparkSQL介绍及使用
  • 如何保证数据库和缓存双写一致性?
  • DAY47WEB 攻防-PHP 应用文件上传函数缺陷条件竞争二次渲染黑白名单JS 绕过