当前位置: 首页 > article >正文

数据仓库简介(一)

数据仓库概述

1. 什么是数据仓库?

数据仓库(Data Warehouse,简称 DW)是由 Bill Inmon 于 1990 年提出的一种用于数据分析和挖掘的系统。它的主要目标是通过分析和挖掘数据,为不同层级的决策提供支持,构成商业智能(BI)的一部分。

在这里插入图片描述

1.1 数据仓库的目标

数据仓库的核心目标是:

  • 分析与挖掘数据:提供决策支持。
  • 集中数据存储:从多种来源采集和抽取数据,形成企业数据的全局视图。
  • ETL 技术:通过数据抽取、转换和加载(ETL)技术实现数据的统一集成。

1.2 数据仓库的定义

数据仓库是一个:

  • 面向主题的:专注于特定的业务主题。
  • 集成的:从不同的数据源聚合数据。
  • 相对稳定的:数据在装入后一般不可更新,主要用于查询。
  • 反映历史变化的:保存历史数据,支持管理决策。

在这里插入图片描述

4. 数据仓库的特点

面向主题

数据仓库专注于特定业务领域,仅保留与该主题相关的数据,排除无关细节。

随时间变化

数据仓库能够保存历史数据,支持基于时间变化的分析,通常使用拉链表的方式在保证访问历史快照的同时降低存储空间。

集成的

通过 ETL 操作,将来自不同来源的数据集成到统一的数据仓库中。

数据不可更新

数据仓库的数据在加载后主要进行查询操作,不支持传统数据库的增删改操作,反映的是长时间范围内的历史数据。

5. 数据仓库与关系型数据库区别

特性数据仓库 /Hive关系型数据库/Mysql,Oracle
数据范围历史的/完整的/反映历史变化的数据当前在线交易状态数据
数据变化可添加/无删除/无更新/反应历史变化支持频繁的增删改查
应用场景BI、支持战略决策面向业务交易/事务流程
设计理论面向主题设计、违背范式、适当冗余面向事务设计、遵循范式、避免冗余
处理特点非频繁/大批量/高吞吐/有延迟频繁/小批次/高并发/低延迟
服务对象分析数据、服务于决策支持捕获数据、服务于业务操作人员

在这里插入图片描述


http://www.kler.cn/news/323662.html

相关文章:

  • 鸿蒙OS开发之动画相关示例分享, 关于弹出倒计时动画的实战案例源码分享
  • netty之Future和Promise
  • leetcode946. 验证栈序列
  • ARM GNU工具链
  • 赵长鹏今日获释,下一步会做什么?币安透露2024年加密货币牛市的投资策略!
  • 【数据结构-栈】力扣71. 简化路径
  • react-native如何一个项目生成两个安装包
  • 什么是Kafka?
  • 利用 Llama-3.1-Nemotron-51B 推进精度-效率前沿的发展
  • PlayerPerfs-不同平台的存储位置
  • 十一假期地区人流量出行大数据分析:技术驱动下的深度洞察
  • [Excel VBA办公]如何使用VBA批量删除空行
  • 基于微信小程序的网上商城+ssm(lw+演示+源码+运行)
  • 基于Hive和Hadoop的病例分析系统
  • Web会话跟踪+代码分析
  • 在C#中实现WebSocket的单聊和分频道聊天
  • Python 绘图艺术:解锁数据故事的三把密钥
  • AJAX(简介以及一些用法)
  • SQL 基础语法
  • Go conc库学习与使用
  • Ubuntu 16.04安装填坑记录
  • 夜间红外图宠物检测系统源码分享
  • 视频美颜SDK与直播美颜工具API是什么?计算机视觉技术详解
  • 履带机器人运动模型分析
  • 如何选择游戏高防服务器,有什么需要注意的点?
  • 一体化杀猪厂污水处理设备特点
  • 数据科学的核心工具箱:全面解析pandas、matplotlib.pyplot与scipy.stats在复杂数据分析流程中的应用
  • Maya学习笔记:项目设置和快捷键
  • 【已解决】【Hadoop】找到java环境路径
  • C++ —— 关于list