当前位置: 首页 > article >正文

Spark和Hive的区别

1 Hive
Hive 是基于 Hadoop 的数据仓库工具,同时又是查询引擎, Spark SQL 只是取代的 Hive 的查询引擎这一部分,企业可以使用Hive+Spark SQL 进行开发。
Hive 的主要工作如下:
        把HQL 翻译长 map-reduce 的代码,并且有可能产生很多 mapreduce job
        把生产的Mapreduce 代码及相关资源打包成 jar 并发布到 Hadoop 的集群当中并进行运行
        Hive默认情况下用 derby 存储元数据,所以在生产环境下一般会采用多用户的数据库进行元数据的存储,并可以读写分离和备份,一般使用主节点写,从节点读,一般使用MySQL

 

2 Spark
        Spark SQL处理一切存储介质和各种格式的数据 ( 可以扩展 sparksql 来读取更多类型的数据 )
        Spark SQL把数据仓库的计算速度推向了新的高度( Tungsten 成熟之后会更厉害);
        Spark SQL推出的 Dataframe 可以让数据仓库直接使用机器学习,图计算等复杂算法;
Hive+Spark SQL+DataFrame 使用:
        Hive:负责廉价的数据仓库存储
        Spark Sql:负责高速的计算
        DataFrame:负责复杂的数据挖掘

 

3 Hive on Spark Spark Sql 的区别
Hive on Spark大体与 Spark SQL 结构类似,只是 SQL 解析器不同,但是计算引擎都是 Spark

 

4 Hive on Mapreduce Spark SQL 使用场景
Hive on Mapreduce 场景
Hive 的出现可以让那些精通 SQL 技能、但是不熟悉 MapReduce 、编程能力较弱与不擅长 Java 语言的用户能够在HDFS 大规模数据集上很方便地利用 SQL 语言查询、汇总、分析数据,毕竟精通 SQL 语言的人要比精通Java 语言的多得多。 Hive 适合处理离线非实时数据
Spark SQL 场景
Spark 既可以运行本地 local 模式,也可以以 Standalone cluster 等多种模式运行在 Yarn Mesos 上,还可以运行在云端例如EC2 。此外, Spark 的数据来源非常广泛,可以处理来自 HDFS HBase 、Hive、 Cassandra Tachyon 上的各种类型的数据。
实时性要求或者速度要求较高的场所

 

5 Hive on Mapreduce Spark SQL 性能对比
Spark SQL Hive on Spark 时间差不多,但都比 Hive on mapreduce 快很多,官方数据认为 Spark 会被传统mapreduce快 10-100 倍。

http://www.kler.cn/a/447696.html

相关文章:

  • postman读取文件执行
  • ROS1入门教程3:自定义消息
  • 基础爬虫案例实战
  • uniapp开发app,cover-view不能隐藏,使用v-if,v-show都不行的解决办法
  • 有哪些免费的 ERP 软件可供选择?哪些 ERP 软件使用体验较好?
  • Vulnhub靶场Nginx解析漏洞复现
  • 服务器上加入SFTP------(小白篇 1)
  • Bayes-GRU-Attention的数据多特征分类预测Matlab实现
  • 方正畅享全媒体新闻采编系统 screen.do SQL注入漏洞复现(附脚本)
  • 基于xiaothink对Wanyv-50M模型进行c-eval评估
  • 2024年企业中生成式 AI 的现状报告
  • wget -q -O
  • 数据结构 C/C++(实验七:排序)
  • macos 隐藏、加密磁盘、文件
  • Electric Capital 2024 年开发者报告 | 洞见未来 Web3 生态发展方向
  • 【C++——临时对象,const T】
  • Python 从入门到实战46(Matplotlib绘制常用表)
  • sentinel学习笔记1-为什么需要服务降级
  • JUC并发工具---阻塞队列
  • 加电:DETR论文阅读
  • 基于鲲鹏服务器的打砖块小游戏部署
  • 《开启微服务之旅:Spring Boot 从入门到实践》(二)
  • 三种国产大语言模型Python免费调用
  • “在Python中,所有的数据都是对象”是什么意思?
  • 贪心算法求解跳跃游戏
  • 企业内训|高智能数据构建、Agent研发及AI测评技术内训-吉林省某汽车厂商