了解Hadoop
发展历程:
单机数据系统:
localFS单机存储、SQL单机计算
分布式系统:
扩展数据存储Hadoop:基于磁盘:Hadoop核心【HDFS分布式文件系统、MapReduce分布式计算框架、资源管理和任务调度】+SQL on Hadoop【Hive、Impala、Presto】:
扩展数据计算spark:基于内存:spark核心+sparkSQL+sparkStreaming+MLlib+Graphx
单机数据系统:
localFS单机存储、SQL单机计算
分布式系统:
扩展数据存储Hadoop:基于磁盘:Hadoop核心【HDFS分布式文件系统、MapReduce分布式计算框架、资源管理和任务调度】+SQL on Hadoop【Hive、Impala、Presto】:
扩展数据计算spark:基于内存:spark核心+sparkSQL+sparkStreaming+MLlib+Graphx