当前位置：首页 > article >正文

sql长时间卡在gc current request事件

article 2025/4/2 22:24:35

问题描述

凌晨跑批出现超时。SQL f0ng33agbpzhs业务需要执行160w次左右。现场人员杀掉该sql，重新发起业务，业务批次成功跑完。

问题分析
1. 总体sql分析

分析对比sql的awrsqrpt，对比昨天3月8日的。

总体执行次数没有变化。Cpu时间、物理读等均在相同量级。

Cluster wait time异常

需要判断该sql是均匀的消耗cluster时间增加，还是某条sql出现的异常

1. 0点-2点的awr中

等待事件现象诡异，gc current request出现1次，但是等待时间极长。这种情况下，基本可以确定是单条sql的问题，而不是每条sql的缓慢。

对比sql这里，执行146w次，时间6200s

1. 0点30-1点的awr中

出现该异常等待事件

该sql执行了6w次

1. 1点-1点30的awr中

该sql执行次数为0，说明该sql已经完全卡住不执行了

1. 1点30-2点的awr中

该sql执行次数为0，说明该sql已经完全卡住不执行了

1. 2点-2点30的awr中

该sql执行了800来次，且这个时间段应是人为介入杀连接，重新发起job的时间段

1. Bug问题

根据现象，发现与bug 14195003现象接近，sql无限等待。文档中未提供补丁的解决方案。

Bug 14195003 Deadlock with "gc current request" and "gc buffer busy" is possible on RAC and wait forever

流程梳理

0点前该业务模块启动，在0点30-1点中，该异常bug出现，sql完全hang住。1-2点中间，该sql完全没有执行次数增加。跑批模块告警后，人工介入，在2点-2点30之间，将该会话杀死，并重新发起job。会话杀死解开了该bug死锁，然后又执行了约800次，该模块跑完。

建议办法

该bug的行程逻辑是4条进程形成的低概率gc事件死锁。2个节点各持有一个block，然后一致性读另一个节点他持有的block，且两节点上各有一条进程请求其他节点持有的该block的当前块

1、发现时及时杀掉任意4个会话中的一个，死锁即可解除。

2、业务上加强隔离性，该业务模块运行时，屏蔽其他节点涉及该部分业务。

查看全文

http://www.kler.cn/a/614561.html

Linux数据迁移与挂载优化方案

【愚公系列】《高效使用DeepSeek》038-应急事务处理

网络相关的知识总结1

网页设计思路

pytorch与其他ai工具

PyGame开发贪吃蛇小游戏

Open HarmonyOS 5.0 分布式软总线子系统 (DSoftBus) 详细设计与运行分析报告

Ditto-Talkinghead：阿里巴巴数字人技术新突破 [特殊字符]️

OpenCV图像拼接（10）用于实现图像拼接过程中的时间流逝（timelapse）效果的一个类cv::detail::Timelapser

Sentinel[超详细讲解]-1

用空闲时间做了一个小程序-二维码生成器

linux-5.10.110内核源码分析 - 写磁盘(从VFS系统调用到I/O调度及AHCI写磁盘)

明天该穿哪件内衣出门？

Laravel APP_KEY 生成方法

【商城实战(92)】高并发下的商城缓存进阶：从原理到实战

当模板方法模式遇上工厂模式：一道优雅的烹饪架构设计

-PHP 应用文件上传函数缺陷条件竞争二次渲染黑白名单JS 绕过

分布式特性对比

C语言入门教程100讲（0）从了解C语言的发展史开始

（二）万字长文解析：deepResearch如何用更长的思考时间换取更高质量的回复？各家产品对比深度详解

问题描述

问题分析

流程梳理

建议办法

相关文章：