当前位置: 首页 > article >正文

【Hive】——数据仓库

1.1 数仓概念

数据仓库(data warehouse):是一个用于存储,分析,报告的数据系统
目的:是构建面向分析的集成化数据环境,分析结果为企业提供决策支持
特点:
数据仓库本身不产生任何数据,其数据来源于不同外部系统
数据仓库也不需要消费任何的书,其结果开放给各个外部应用使用
这也是为什么叫仓库,而不叫工厂的原因
在这里插入图片描述

1.2 案例

在这里插入图片描述

1.3 数仓特征

在这里插入图片描述

1.3.1 面向主题性

在这里插入图片描述

1.3.2 集成性

在这里插入图片描述

1.3.3 非易性、非异变性

在这里插入图片描述

1.3.4 时变性

在这里插入图片描述

1.4 OLTP、OLAP

1.4.1 OLTP:联机事务处理

在这里插入图片描述

1.4.2 OLAP:联机分析处理

在这里插入图片描述
在这里插入图片描述

1.4.3 OLAP对比OLTP

在这里插入图片描述

在这里插入图片描述

1.5 数据仓库、数据库的区别

在这里插入图片描述
在这里插入图片描述

1.6 数据仓库、数据集市的区别

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.7 数据仓库思想与架构

1.7.1 分层思想和标准

操作型数据层(ODS)
数据仓库层(DW)
数据应用层(DA)
在这里插入图片描述

1.7.2 ODS层(Operation Data Store)

在这里插入图片描述

1.7.2 DW层(Data Warehouse)

在这里插入图片描述

1.7.3 DA层(或ADS层)

在这里插入图片描述

1.8 分层作用

在这里插入图片描述
在这里插入图片描述

1.9 ETL、ELT

ETL:抽取Extra、转化Transfer、装载Load
具体顺序基于业务实际灵活选择

1.9.1 ETL

在这里插入图片描述
在这里插入图片描述

1.9.2 ELT

在这里插入图片描述

在这里插入图片描述


http://www.kler.cn/news/159694.html

相关文章:

  • Linux服务器超级实用的脚本
  • 海思SD3403/SS928V100开发(11)双网卡同网段外部回环搭建测试
  • 车联网架构设计(二)_消息缓存
  • C++学习之路(十五)C++ 用Qt5实现一个工具箱(增加16进制颜色码转换和屏幕颜色提取功能)- 示例代码拆分讲解
  • 每天一点python——day87
  • 网店一键搬家要用到的API接口
  • 【1day】致远A6系统任意文件下载漏洞学习
  • Pyside2 (Qt For Python)进度条功能实现
  • 【QT】Windows环境下,cmake引入QML
  • Elasticsearch 如何处理 Aggs 顺序中的大写字母和小写字母?
  • C语言每日一题(41)循环队列
  • C语言——指针(四)
  • 图扑参展高交会-全球清洁能源创新博览会
  • 从零构建属于自己的GPT系列2:模型训练1(预训练中文模型加载、中文语言模型训练、逐行代码解读)
  • 运维之远程桌面连接失败问题排查
  • java8 升级 java11
  • Hive数据库系列--Hive数据类型/Hive字段类型/Hive类型转换
  • 循环队列中的求队列长度公式怎么来的?【数学角度】
  • 【华为OD题库-068】找出经过特定点的路径长度-java
  • 【数电笔记】07-基本和复合逻辑运算
  • 『亚马逊云科技产品测评』活动征文|基于亚马逊云EC2搭建OA系统
  • uniapp打包的h5项目多了接口调用https://api.next.bspapp.com/client
  • 1.1美术理论基础
  • 快手数仓面试题附答案
  • 流量异常-挂马造成百度收录异常关键词之解决方案(虚拟主机)
  • python内存处理和常见的内存泄漏场景
  • 【从删库到跑路 | MySQL数据库总结篇】JDBC编程
  • 【论文】F1的单位是%还是1,mAP的单位是%还是1?答:F1的单位是1,mAP的单位是%
  • flutter的CircularProgressIndicator基本使用
  • 【UGUI】实现背包的常用操作