当前位置：首页 > article >正文

记一次Hiveserver2连接异常的解决-腾讯云-emr

article 2025/2/21 3:42:05

原文阅读：【巨人肩膀社区·博客·分享】记一次Hiveserver2连接异常的解决-腾讯云-emr

离线任务跑的好好的，忽然有一天失败了，查看海豚上的任务执行日志发现是hiveserver2连接超时了。

查看监控发现了几个问题一个是GC变得频繁，另一个是连接数达到上限了。

GC变得频繁 =》内存不足 =》通过jdbc连接Hive查数数据时会使用hiveserver2配置的内存，如果查询需要的内存大于配置的内存时就会出现OOM

其中查询需要的内存会随着查询涉及的数据量的增加而增加，这就是为什么之前都是好好的，某一天出问题了，因为日增数据在一天天增长。

解决：修改配置增加所需内存

hive-env.sh中调整HS2Heapsize为8192，并重启hiveserver2生效。

<property>
  <name>hive.server2.heapsize</name>
  <value>4096</value>
</property>

因为我们用的是公有云的产品，所以可以直接通过可视化界面修改：

修改后重启hiveserver2生效

Tips：内存不是越大越好，多了浪费，还有一个更重要的就是会占用本节点其他服务的内存。

正常hive sql执行完对应hiveserver2的连接随之释放，但是某些原因可能导致任务异常，海豚调度的worker进程没有处理好这种异常导致一直不断开对hiveserve的连接。

解决：重启海豚调度的相关worker节点。

1.查看哪些ip和端口在连hiveserver2：netstat -tunp | grep xxxx

2.查看在这些ip里又是哪个进程发起的连接：sudo lsof -i :端口号

3.最终发现是海豚调度的worker进程一直不释放hs2的连接

4.最终重启海豚调度的worker进程

排查过程相关命令参见： shell 网络工具 netstat

vue3项目中使用pdfjs-dist踩坑记录

CSP-J 之计算机基本结构

YOLO介绍—datawhale

shell脚本语法

ASP.NET MVC 迅速集成 SignalR

【spring】IDEA 新建一个spring boot 项目

计算机网络：概述 - 性能指标

CategoriesController

labview禁用8080端口