当前位置: 首页 > article >正文

【Hive】——数据仓库

1.1 数仓概念

数据仓库(data warehouse):是一个用于存储,分析,报告的数据系统
目的:是构建面向分析的集成化数据环境,分析结果为企业提供决策支持
特点:
数据仓库本身不产生任何数据,其数据来源于不同外部系统
数据仓库也不需要消费任何的书,其结果开放给各个外部应用使用
这也是为什么叫仓库,而不叫工厂的原因
在这里插入图片描述

1.2 案例

在这里插入图片描述

1.3 数仓特征

在这里插入图片描述

1.3.1 面向主题性

在这里插入图片描述

1.3.2 集成性

在这里插入图片描述

1.3.3 非易性、非异变性

在这里插入图片描述

1.3.4 时变性

在这里插入图片描述

1.4 OLTP、OLAP

1.4.1 OLTP:联机事务处理

在这里插入图片描述

1.4.2 OLAP:联机分析处理

在这里插入图片描述
在这里插入图片描述

1.4.3 OLAP对比OLTP

在这里插入图片描述

在这里插入图片描述

1.5 数据仓库、数据库的区别

在这里插入图片描述
在这里插入图片描述

1.6 数据仓库、数据集市的区别

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.7 数据仓库思想与架构

1.7.1 分层思想和标准

操作型数据层(ODS)
数据仓库层(DW)
数据应用层(DA)
在这里插入图片描述

1.7.2 ODS层(Operation Data Store)

在这里插入图片描述

1.7.2 DW层(Data Warehouse)

在这里插入图片描述

1.7.3 DA层(或ADS层)

在这里插入图片描述

1.8 分层作用

在这里插入图片描述
在这里插入图片描述

1.9 ETL、ELT

ETL:抽取Extra、转化Transfer、装载Load
具体顺序基于业务实际灵活选择

1.9.1 ETL

在这里插入图片描述
在这里插入图片描述

1.9.2 ELT

在这里插入图片描述

在这里插入图片描述


http://www.kler.cn/a/159694.html

相关文章:

  • react 受控组件和非受控组件
  • CentOS网络配置
  • 如何向函数模块 FM 中传递 Range 参数
  • CTFHub每日练习
  • Matplotlib库中show()函数的用法
  • opencv常用api
  • Linux服务器超级实用的脚本
  • 海思SD3403/SS928V100开发(11)双网卡同网段外部回环搭建测试
  • 车联网架构设计(二)_消息缓存
  • C++学习之路(十五)C++ 用Qt5实现一个工具箱(增加16进制颜色码转换和屏幕颜色提取功能)- 示例代码拆分讲解
  • 每天一点python——day87
  • 网店一键搬家要用到的API接口
  • 【1day】致远A6系统任意文件下载漏洞学习
  • Pyside2 (Qt For Python)进度条功能实现
  • 【QT】Windows环境下,cmake引入QML
  • Elasticsearch 如何处理 Aggs 顺序中的大写字母和小写字母?
  • C语言每日一题(41)循环队列
  • C语言——指针(四)
  • 图扑参展高交会-全球清洁能源创新博览会
  • 从零构建属于自己的GPT系列2:模型训练1(预训练中文模型加载、中文语言模型训练、逐行代码解读)
  • 运维之远程桌面连接失败问题排查
  • java8 升级 java11
  • Hive数据库系列--Hive数据类型/Hive字段类型/Hive类型转换
  • 循环队列中的求队列长度公式怎么来的?【数学角度】
  • 【华为OD题库-068】找出经过特定点的路径长度-java
  • 【数电笔记】07-基本和复合逻辑运算