当前位置: 首页 > article >正文

阿里数据仓库-数据模型建设方法总结

一、大数据领域建模综述

1.1 为什么需要数据建模
  • 有结构地分类组织和存储是我们面临的一个挑战。

  • 数据模型强调从业务、数据存取和使用角度合理存储数据。

  • 数据模型方法,以便在性能、成本、效率之间取得最佳平衡

    • 成本:良好的数据模型能极大地减少不必要的数据冗余,也能实现计算结果复用,极大地降低大数据系统中的存储和计算成本。

    • 效率:良好的数据模型能极大地改善用户使用数据的体验,提高使用数据的效率。

    • 质量:良好的数据模型能改善数据统计口径的不一致性,减少数据计算错误的可能性。

1.2 关系数据库系统和数据仓库
1.3 从 OLTP 和 OLAP 系统的区别看模型方法论的选择
  • OLTP 系统通常面向的主要数据操作是随机读写,主要采用满足 3NF 的实体关系模型存储数据,从而在事务处理中解决数据的冗余和一 致性问题:

  • OLAP 系统面向的主要数据操作是批量读写,事务处理中 的一致性不是OLAP 所关注的,其主要关注数据的整合,以及在一次性的复杂大数据查询和处理中的性能,因此它需要采用一些不同的数据建模方法。

1.4 典型的数据仓库建

http://www.kler.cn/a/446778.html

相关文章:

  • 深度学习——现代卷积神经网络(七)
  • XILINX平台LINUX下高速ADC08060驱动
  • 13.罗意文面试
  • 如何缩放组件
  • STM32 高级 物联网通信之CAN通讯
  • Azure虚拟机非托管磁盘大小调整
  • 计算无人机俯拍图像的地面采样距离(GSD)矩阵
  • 在uniapp Vue3版本中如何解决webH5网页浏览器跨域的问题
  • SpringBoot Redis 消息队列
  • uni APP关联服务空间
  • 机器学习-正则化技术
  • 算法题型整理—双指针
  • FreeRtos实时系统: 四.中断
  • 如何写申请essay
  • [Pro Git#4] 标签 | 理解 | 创建 | push
  • 前端滚动锚点(点击后页面滚动到指定位置)
  • Anthropic:Agents 2024年度总结!
  • 数据结构day5:单向循环链表 代码作业
  • 随记:springboot的xml中sql数据库表名动态写法
  • linux-----常用指令
  • HarmonyOS ArkTS中视频播放Video组件实现竖屏到横屏切换
  • Centos7安装k8s集群
  • kafka常用命令(持续更新)
  • Vivado安装System Generator不支持新版Matlab解决方法
  • 国标GB28181协议平台Liveweb:搭建建筑工地无线视频联网监控系统方案
  • 命令行音乐库管理工具Beets