当前位置：首页 > article >正文

一次线程数超限导致的hive写入hbase作业失败分析

article 2025/2/5 8:47:13

1.集群配置

操作系统：SuSe操作系统
集群节点：100台相同配置的服务器
单台：核心112Core，内存396G

2.问题现象

现象1：跑单个入库任务报错，批量提交任务后出现OOM异常
执行12个hivesql,将数据写入hbase.hbase入库有近一半的任务报错。
每次报错的任务不是同一个，hivesql任务分为2个阶段：
第1个阶段是hive自处理阶段，底层是spark计算引擎。出现oom,无法开启新的本地线程
第2阶段是以parquet格式生成Hfile写入hbase，出现如下报错：
OutOfMemoryError: unable to create new native thread异常

现象2：报错 Container [pid=XXX,containerID=container_1XXX] is running beyond virtual memory limits
以及 spark.deploy.yarn.ApplicationMaster: received term signal

3.问题分析

3.1 OOM异常分析

OutOfMemoryError: unable to create new native thread异常，一般是因

http://www.kler.cn/a/532201.html

相关文章：

深入浅出：频谱掩码 Spectral Masking —— 噪音消除利器

排序算法--归并排序

交叉验证、精确率、召回率

gitea - fatal: Authentication failed

技术架构师成长路线（2025版）

Spring Cloud工程搭建

2.8学习记录

什么是物理地址，什么是虚拟地址？

H. The Third Letter

接入DeepSeek大模型

蓝桥杯思维训练营(三）

【Leetcode刷题记录】2090. 半径为 k 的子数组平均值--定长滑动窗口解法和前缀和解法

基于RK3588+算能BM1684X的云电脑/云手机系统设计与实现

【Go语言圣经】第七节：接口

蓝桥杯接龙序列

83-《南茼蒿》

python列表知道下标怎么取值

输出解析器的使用

介绍一下Mybatis的底层原理（包括一二级缓存）

基于“蘑菇书”的强化学习知识点（四）：贝尔曼方程

deepseek的对话风格

单链表的“影分身术”：随机指针链表的深度拷贝实现

知识蒸馏教程 Knowledge Distillation Tutorial

ES6基础内容

[特殊字符] ChatGPT-4与4o大比拼

基于SpringBoot体育商品推荐设计与实现