当前位置: 首页 > article >正文

数据仓库的概念

先用大白话讲一下,数据仓库的主要目的就是存储和分析大量结构化数据的。
> 那么它的核心目的是:支持商业智能(BI)和决策支持系统,也就是说,它不仅仅是为了存储,更重要的是为了分析提供便利。
> 再来说下它的特点:面向主题的、集成的、相对稳定的、随时间变化的。而这些特点恰恰反应了数据仓库与传统数据库的区别。
> 这里就要先讲一下OLTP(联机事务处理)OLAP(联机分析处理)的区别
> 1.数据更新:OLTP系统的数据经常被更新,数据仓库的数据相对稳定,通常只定期加载。
> 2.数据模型:OLTP系统通常使用高度规范化的模型;数据仓库通常使用星型或雪花模型
> 3.查询类型:OLTP系统主要处理简单、标准化的查询;数仓用于处理复杂的分析查询。
> 4.数据范围:OLTP系统通常只保存当前的数据;数仓会保存历史的数据。
> 5.性能优化:OLTP系统优化的是写入性能;数仓优化的是读取和分析性能。
> 还有一点,数仓通常会保存多个源系统的数据。
> 举个例子总结下:
>           如果说传统数据库像是一个高效运转的工厂,那么数据仓库就像是一个大型的研究中心,存储、整理并分析大量的信息,为企业决策提供支持。

 数据仓库的概念

        数据仓库是一个为支持商业智能和决策分析而设计的大型数据存储和管理系统。

数据仓库和传统数据库的区别

OLTPOLAP
用途联机事务处理联机分析处理
数据更新频繁更新相对稳定,定期加载
数据模型高度规范化星型或者雪花模型,优化查询性能
查询类型处理简单标准化的查询处理复杂的分析查询
数据范围只保存当前数据保存大量的历史数据
性能优化优化写入性能优化读取和分析性能
数据整合单一整合来自多个源系统的数据


http://www.kler.cn/a/421729.html

相关文章:

  • Qt 2D绘图之三:绘制文字、路径、图像、复合模式
  • Vue3可以不用Pinia了?
  • es 3期 第12节-选择合适的数据查询方式
  • 【Go底层】time包中Timer定时器原理
  • 【分组去重】.NET开源 ORM 框架 SqlSugar 系列
  • 论文阅读:Generating Synthetic Data for Medical Imaging
  • 企业AI助理在数据分析与决策中扮演的角色
  • B树与B+树的区别,为什么MySQL使用B+树不使用B树
  • Elasticsearch在liunx 中单机部署
  • ElasticSearch QueryDSL详解
  • 通过JS逆向,爬取音乐(仅供学习交流,严禁非法使用)
  • Kubernetes集群添加主机名解析
  • Node.js 实战: 爬取百度新闻并序列化 - 完整教程
  • c++预编译头文件
  • java调用ai模型:使用国产通义千问完成基于知识库的问答
  • 详解日志格式配置:XML 与 Spring Boot 配置文件格式
  • [RabbitMQ] 延迟队列+事务+消息分发
  • macOS运行amd64的镜像
  • 李飞飞:Agent AI 多模态交互的前沿探索
  • 为什么同一个网络下的其它电脑无法访问部署在mac上的flask服务