当前位置: 首页 > article >正文

记一次Hiveserver2连接异常的解决-腾讯云-emr

原文阅读:【巨人肩膀社区·博客·分享】记一次Hiveserver2连接异常的解决-腾讯云-emr

离线任务跑的好好的,忽然有一天失败了,查看海豚上的任务执行日志发现是hiveserver2连接超时了。

查看监控发现了几个问题一个是GC变得频繁,另一个是连接数达到上限了。

1、针对内存问题

GC变得频繁 =》内存不足 =》通过jdbc连接Hive查数数据时会使用hiveserver2配置的内存,如果查询需要的内存大于配置的内存时就会出现OOM

其中查询需要的内存会随着查询涉及的数据量的增加而增加,这就是为什么之前都是好好的,某一天出问题了,因为日增数据在一天天增长

解决:修改配置增加所需内存

hive-env.sh中调整HS2Heapsize为8192,并重启hiveserver2生效。

<property>
  <name>hive.server2.heapsize</name>
  <value>4096</value>
</property>

因为我们用的是公有云的产品,所以可以直接通过可视化界面修改:



image.png



修改后重启hiveserver2生效

Tips:内存不是越大越好,多了浪费,还有一个更重要的就是会占用本节点其他服务的内存。



2、针对连接超上限

正常hive sql执行完对应hiveserver2的连接随之释放,但是某些原因可能导致任务异常,海豚调度的worker进程没有处理好这种异常导致一直不断开对hiveserve的连接。

解决:重启海豚调度的相关worker节点。

1.查看哪些ip和端口在连hiveserver2:netstat -tunp | grep xxxx

2.查看在这些ip里又是哪个进程发起的连接:sudo lsof -i :端口号

3.最终发现是海豚调度的worker进程一直不释放hs2的连接

4.最终重启海豚调度的worker进程

排查过程相关命令参见: shell 网络工具 netstat



结果:重启后连接断崖式下降:



image.png






http://www.kler.cn/a/303426.html

相关文章:

  • win11 新建一个批处理,双击查看本机的IP地址
  • npm list @types/node 命令用于列出当前项目中 @types/node 包及其依赖关系
  • HarmonyOS的@State装饰器的底层实现
  • 鸿蒙next版开发:ArkTS组件点击事件详解
  • 【数据结构】交换排序——冒泡排序 和 快速排序
  • 【练习案例】30个 CSS Javascript 加载器动画效果
  • 量化交易策略:掌握能量潮指标,提前捕捉卖出时机(Python代码解析)
  • vue3项目中使用pdfjs-dist踩坑记录
  • Docker基本管理--Dockerfile镜像制作(Docker技术集群与应用)
  • ubuntu20.04 Qt6引用dcmtk库实现dicom文件读取和字符集转换
  • CSP-J 之计算机基本结构
  • YOLO介绍—datawhale
  • C语言 | Leetcode C语言题解之第404题左叶子之和
  • shell脚本语法
  • ASP.NET MVC 迅速集成 SignalR
  • 【spring】IDEA 新建一个spring boot 项目
  • 【无人机设计与控制】旋转无人机摆锤的SDRE仿真
  • VSCode 编写 vue 项目之一键生成 .vue 页面模版
  • 计算机网络:概述 - 性能指标
  • 【Linux 从基础到进阶】Docker Compose 编排工具使用
  • CategoriesController
  • 什么是图像的边缘?说说边缘检测的任务以及基本原理?
  • 无人机应用新纪元:图形工作站配置推荐与硬件解析
  • 网络安全-dom破坏结合jq漏洞以及框架漏洞造成的xss-World War 3
  • Python | Leetcode Python题解之第402题移掉K位数字
  • labview禁用8080端口