当前位置: 首页 > article >正文

FT2000+ qemu kvm openEuer crash 分析 频繁设置CPU online及cgroup导致进程卡死、不调度故障

测试用例1 openEuler 20.03 默认内核

https://hknaruto.blog.csdn.net/article/details/130498823

内核版本信息

 突然就坚挺起来,长时间稳定运行

待续

测试用例2:CentOS8 (16C16G:无法crash分析,放弃)

十几分钟后,终端已卡死 ,两个终端均无响应,但是gnome还活着,图形界面还能动

dump

virsh dump --memory-only --format=kdump-zlib centos8 centos8-tcti-0505.zlib

 crash分析

重启虚拟机

kvm内,安装好crash分析环境

yum install -y crash nfs-utils

下载安装debuginfo包

http://debuginfo.centos.org/8/aarch64/Packages/kernel-debuginfo-4.18.0-240.el8.aarch64.rpm

http://debuginfo.centos.org/8/aarch64/Packages/kernel-debuginfo-common-aarch64-4.18.0-240.el8.aarch64.rpm

执行分析

virsh reset centos8

登录虚拟机,挂载共享目录后执行crash,居然报错不匹配:crash /usr/lib/debug/lib/modules/4.18.8-240.el8.aarch64/vmlinux and /mnt/hostshare/qemu-virtual-machine/centos8-tcti-0505.zlib not match

 手动触发一次crash验证下(kdump安装时,默认开启了

 重启后,可以看到生成了vmcore

这又可以 

故障分析

WARNING: kimage_voffset cannot be determined from the dumpfile. WARING: cannot read linux_banner string crash /usr/lib/debug/lib/modules/4.18.8-240.el8.aarch64/vmlinux and /mnt/hostshare/qemu-virtual-machine/centos8-tcti-0505.zlib not match

尝试手动编译crash

https://github.com/crash-utility/crash/archive/refs/tags/8.0.3.tar.gz

$ tar -xf crash-8.0.3.tar.gz
$ cd crash-8.0.3
$ make

报错,放弃。

参考

[Crash-utility] crash failing with CentOS 5 under VMware

[Crash-utility] [PATCH 1/1] arm64: Fix missing offset formodules_vaddr with aarch64 guest dump

=====================================================================

失败的分析记录:

dump

virsh dump --memory-only --format=kdump-zlib openEuler openEuler-20.03-linux5.10.0-tcti-0505.zlib

 crash分析

重启虚拟机

kvm内,安装好crash分析环境,执行分析

virsh reset openEuler

登录虚拟机,挂载共享目录后执行

crash linux-5.10.38/vmlinux /mnt/hostos/qemu-virtual-machine/openEuler-20.03-linux5.10.0-tcti-0505.zlib

报错,放弃。

故障

crash: cannot determine VA_BITS_ACTUAL

放弃该版本内核,转向分析20.03自带内核。

 参考

it cannot determine VA_BITS_ACTUAL on Linux 5.4 for ARM64 · Issue #52 · crash-utility/crash · GitHub

参考资料

https://www.cnblogs.com/organic/p/17321523.html


http://www.kler.cn/a/17927.html

相关文章:

  • Gartner发布安全平台创新洞察:安全平台需具备的11项常见服务
  • neo4j desktop基本入门
  • 提取神经网络数学表达式
  • 代码 RNN原理及手写复现
  • macOS解决U盘装完系统容量变小的问题
  • Java 网络编程(一)—— UDP数据报套接字编程
  • Go数据结构---可变长数组
  • 正则表达式 - 字符组
  • 牛客 BM18 二维数组中的查找
  • c# 数据保存为PDF(二) (Aspose pdf篇)
  • Linux C/C++后台开发面试重点知识
  • 互联网摸鱼日报(2023-05-08)
  • 虚拟环境中的 CPU 优化
  • YAPI--撰写接口文档的平台
  • ruby环境中的irb
  • 奇数单增序列
  • 有限等待忙等、让权等待死等、互斥遵循的几大原则——参考《天勤操作系统》,柳婼的博客
  • 基于C#开发 B/S架构的实验室管理系统 云LIS系统(MVC + SQLserver + Redis)
  • HTTP的特点
  • Python入门(三)变量和简单数据类型(二)
  • MySQL基础(十四)视图
  • 设计模式——模板方法模式
  • 数据结构与算法基础(王卓)(35):交换排序之快排【第二阶段:标准答案、初步发现问题】
  • 看不懂具体的代码方法?这样向chatgpt提问
  • (22)目标检测算法之 yolov8模型导出总结
  • Scala Option类型,异常处理,IO,高阶函数