当前位置: 首页 > article >正文

了解Hadoop

发展历程:

单机数据系统

localFS单机存储、SQL单机计算

分布式系统:

扩展数据存储Hadoop:基于磁盘:Hadoop核心【HDFS分布式文件系统、MapReduce分布式计算框架、资源管理和任务调度】+SQL on Hadoop【Hive、Impala、Presto】:

扩展数据计算spark:基于内存:spark核心+sparkSQL+sparkStreaming+MLlib+Graphx


http://www.kler.cn/a/451011.html

相关文章:

  • 从 GitLab.com 到 JihuLab.com 的迁移指南
  • flask-admin的modelview 实现list列表视图中扩展修改状态按钮
  • JS中若干相似特性的区别
  • Java代码覆盖率super-jacoco
  • Mysql数据究竟是如何存储的
  • 272-1路万兆光纤SFP+和1路千兆网络 FMC子卡模块
  • 【PCIe 总线及设备入门学习专栏 1.1 -- PCIe 基础知识 lane和link介绍】
  • JVM的垃圾回收机制GC
  • 面试基础篇---迭代器,yield, tcp, 等
  • C调用gnuplot绘图的方法
  • 【ROS2】坐标TF变换工具-tf2_ros
  • 鸿蒙元服务从0到上架【第三篇】(第二招有捷径)
  • tortoisegit推送失败
  • ubuntu下 如何将 NVIDIA 内核驱动 升级到特定版本 如550.127
  • 大语言模型学习工具及资源总结和落地应用
  • soular使用教程
  • ONNX 转 TensorRT Bug 记录:IIfConditionalOutputLayer
  • 鸿蒙-什么是ArkTS
  • 【C++】模板与泛型编程(一):定义模板,类模板
  • vue3 + MapTalks实现2.5D地图的绘制
  • SQL Server数据库多主模式解决方案
  • 面试小札:Java后端闪电五连鞭_11
  • prometheus监控windows主机
  • Springboot基于Web的高校志愿者服务管理系统81559
  • Git安装及基础学习
  • Blazor 中调用 JavaScript