当前位置: 首页 > article >正文

关于大数据

在大数据背景下存在的问题:

        非结构化、半结构化数据:NoSQL数据库只负责存储;程序处理时涉及到数据移动,速度慢
是否存在一套整体解决方案?

        可以存储并处理海量结构化、半结构化、非结构化数据
        处理海量数据的速度很快,且扩展性强

大数据:数据达到一定规模以后,对数据进行存储和计算的技术

大数据的特征包括:

  • 数据规模巨大(Volume)
  • 生成和处理速度极快(Velocity)
  • 数据类型多样(Variety)
  • 价值巨大但密度较低(Value)

场景

离线和实时区分:数据是否有界。
    离线:数据产生以后存起来(如10G),以后不会增加或减少,以后的计算都是这么大。(断网也可以断网)。--------适合批处理
    实时:数据产生后直接计算。------适合流处理

生态

传统单机架构:比如在OS上安装了MySQL,OS为mysql提供了文件系统、通用计算(比如sql转成指令来执行)、资源管理。
大数据:有没有操作系统底层就是管理多个机器的?没有。所以我们要在软件层面来实现把OS构建成分布式的,然后这些分布式分别装不同组件。


http://www.kler.cn/a/533624.html

相关文章:

  • 3.【BUUCTF】XSS-Lab1
  • (dpdk f-stack)-堆栈溢出-野指针-内存泄露(问题定位)
  • 机器学习--2.多元线性回归
  • 21.2.1 基本操作
  • 从 0 到 1 构建数仓之DWD层
  • 【电脑系统】电脑突然(蓝屏)卡死发出刺耳声音
  • 第一天:Linux内核架构、文件系统和进程管理
  • 更换IP属地会影响网络连接速度吗
  • 一、0-1搭建springboot+vue3前后端分离-前端项目创建
  • 结构化与面向对象(下)
  • HTTP和HTTPS协议详解
  • 【最新】贷款市场报价利率LPR数据(2019-2025.1)
  • 无人机的续航能力和飞行效率概述!
  • 【自动化办公】批量图片PDF自定义指定多个区域识别重命名,批量识别铁路货物运单区域内容改名,基于WPF和飞桨ocr深度学习模型的解决方案
  • 【PyQt】使用PyQt5和Matplotlib实现的CSV数据可视化工具
  • 【React】受控组件和非受控组件
  • 在线教程丨YOLO系列10年更新11个版本,最新模型在目标检测多项任务中达SOTA
  • 逻辑回归原理
  • [数据结构] 线性表和顺序表
  • Elasticsearch面试技巧:从基础到高级
  • 血压计OCR文字检测数据集VOC+YOLO格式2147张11类别
  • 最短木板长度
  • 初识 Node.js
  • 扣子平台的选择器节点:让智能体开发更简单,扣子免费系列教程(17)
  • C++ Primer 算术运算符
  • DEA-Net(2024 SCI 1区)