当前位置: 首页 > article >正文

二、OpenSM排障----实战生产

目录

一、确认 OpenSM 服务端故障的步骤

1. 检查客户端与服务器的连通性

2. 检查客户端 InfiniBand 接口状态

3. 检查子网管理器状态

4. 检查拓扑信息

5. 检查路由表

二、客户端日志位置及查看方法

1. 系统日志

2. OpenSM 客户端日志

3. 内核日志

4. 性能计数器日志

三、常见故障场景及解决方法

1. 服务器端 OpenSM 未启动

2. 服务器端 OpenSM 配置错误

3. 网络链路故障

4. 客户端驱动或固件问题

四、总结


当 OpenSM 服务端故障时,客户端可能无法正常访问 InfiniBand 网络。以下是排障步骤,帮助确认是否是服务器故障,以及如何查看客户端日志。


一、确认 OpenSM 服务端故障的步骤

1. 检查客户端与服务器的连通性

    http://www.kler.cn/a/546243.html

    相关文章:

  • ADC入门准备(十):信号与系统知识回顾
  • Linux Mem -- Where the mte store and check in the real hardware platform
  • 如何下载AndroidStudio的依赖的 jar,arr文件到本地
  • JVM类加载和垃圾回收(详细)
  • 【RAG落地利器】Weaviate、Milvus、Qdrant 和 Chroma 向量数据库对比
  • 群体智能优化:粒子群算法(PSO)详解与实战
  • 如何在微信小程序中添加动画效果
  • Python爬虫实战:利用代理IP获取招聘网站信息
  • Vue 2 路由指南:从基础到高级
  • 机器学习 - 线性模型
  • 在springboot加vue项目中加入图形验证码
  • 【linux】文件与目录命令 - ln
  • 渗透测试工具:SQLmap安装教程及使用
  • 【算法专场】哈希表
  • 庞氏骗局(Ponzi Scheme):金融投资与公司经营中的隐形陷阱(中英双语)
  • 在我的世界地下城开发mod的第一天
  • 怎么才能DeepSeek批量写作和内容导出?
  • 傅里叶变换推导
  • 【黑马点评优化】1-使用JWT登录认证+redis实现自动续期
  • Django 进行数据库操作(ORM框架+mysqlclient+mysql)