当前位置: 首页 > article >正文

[Hive]四、Hive On Tez

  G:\Bigdata\Projects\大数据电商数仓项目(含2.0、3.0版本)\数仓项目实战V2.0\word版资料

1. Hive集成引擎Tez

Tez是一个Hive的运行引擎,性能优于MR。为什么优于MR呢?看下图。

用Hive直接编写MR程序,假设有四个有依赖关系的MR作业,上图中,绿色是Reduce Task,云状表示写屏蔽,需要将中间结果持久化写到HDFS。

Tez可以将多个有依赖的作业转换为一个作业,这样只需写一次HDFS,且中间节点较少,从而大大提升作业的计算性能。

1.1 安装包准备

1)下载tez的依赖包:Apache Tez – Welcome to Apache TEZ®

2)拷贝apache-tez-0.9.1-bin.tar.gz到hadoop102的/opt/software目录

        [seven@hadoop102 software]$ ls
        apache-tez-0.9.1-bin.tar.gz

3)将apache-tez-0.9.1-bin.tar.gz上传到HDFS的/tez目录下。

[seven@hadoop102 conf]$ hadoop fs -mkdir /tez
[seven@hadoop102 conf]$ hadoop fs -put /opt/software/apache-tez-0.9.1-bin.tar.gz/ /tez

4)解压缩apache-tez-0.9.1-bin.tar.gz
[seven@hadoop102 software]$ tar -zxvf apache-tez-0.9.1-bin.tar.gz -C /opt/module

5)修改名称
[seven@hadoop102 module]$ mv apache-tez-0.9.1-bin/ tez-0.9.1

3.2.2 集成Tez 

1)进入到Hive的配置目录:/opt/module/hive/conf

[seven@hadoop102 conf]$ pwd

/opt/module/hive/conf

2)在Hive/opt/module/hive/conf下面创建一个tez-site.xml文件

[seven@hadoop102 conf]$ pwd

/opt/module/hive/conf

[seven@hadoop102 conf]$ vim tez-site.xml

添加如下内容

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>


http://www.kler.cn/a/282826.html

相关文章:

  • C++——视频问题总结
  • 【代码审计】常见漏洞专项审计-业务逻辑漏洞审计
  • 二分查找--快速地将搜索空间减半
  • QTcpSocket 服务端和客户端
  • 服务jar包增加高斯数据库驱动jar包
  • Go八股(Ⅴ)map
  • 私域流量升级下的新机遇——“开源 AI 智能名片S2B2C 商城小程序”与新兴技术的融合
  • ARM/Linux嵌入式面经(二七):韶音
  • Java LeetCode 练习
  • pmp证书为何会被骂?他真的就是个垃圾证书?
  • 鸿蒙HarmonyOS开发实战: 页面传值跳转
  • Linux CMake根据环境变量和编译选项,编译多模块
  • k8s集群搭建
  • 四个版本的双向链表(C++,C++ CLI, C#, Java)
  • 奇安信渗透测试岗位三面经验分享
  • SpringBoot集成EasyExcel实现Excel文件导入/出
  • 计算机基础复习8.29
  • 力扣top300:3. 无重复字符的最长子串
  • Prompt-Tuning 和 LoRA大模型微调方法区别
  • 第二证券:三折折叠屏手机呼之欲出,14股业绩暴涨超200%
  • 大模型RAG(四)RAG工具
  • C++_CH16_Local static
  • Python知识点:如何使用PostgreSQL与Psycopg2进行数据库操作
  • 查找3(红黑树、B树)
  • VC++内存泄漏检测方法(6):介绍deleaker和heob两款软件
  • OpenCV杂项图像变换(2)线性混合函数blendLinear()的使用